在预言特朗普这件事上，ChatGPT输了！

2024年11月18日20:32:15 发表评论 2,090 °C

摘要

对于虚假的藏头诗，大模型们会怎么判断？

近几日，最大的新闻，或许就是在2024年美国总统大选中，共和党候选人唐纳德·特朗普击败民主党候选人卡玛拉·哈里斯，成功当选美国第47任总统。

在预言特朗普这件事上，ChatGPT输了！

有人欢喜有人忧，暂且不评价这次大选的结果，在网上高强度冲浪时，发现了一件有趣的事儿。

有心的网友们，在网上找到了这么一首诗。

《梅花谷》——李白
特访梅花信，漫行春谷中。
朗月升东隅，流辉照苦颜。
普门在何处，莫向海门寻。
选任逢明主，休嗟尚散郎。
举世争趋进，谁能事息机。
获处从西鄙，胡然瑞物臻。
胜游不惜屡，余兴尚淋漓。

我的天，这居然是一首藏头诗，每句诗的第一个字构成了“特朗普选举获胜”。

难道懂王胜利的结果早在千年前就注定了？

难道李白真的能推算出特朗普选举获胜，还写了一首藏头诗留下预言？

看起来像是穿越剧情节。但实际上，这首诗《梅花谷》当然不是李白的作品，而是后人伪托的“野史”之作。

我们一眼就能看出来所谓的“藏头诗”，揭穿这场跨越千年的闹剧。

那么，如果我们让 AI 大模型来点评一下这首诗，它们会作何评价？又是否能分辨出这是首假诗呢？

问题：唐诗《梅花谷》全文如下：（省略诗词部分）。请评价一下这首诗

让我们一起来看看，各大模型的表现如何吧！

ChatGPT

在预言特朗普这件事上，ChatGPT输了！

GPT 直接开始了头脑风暴，这下，有没有你曾经做阅读题的风范？

GPT 逐句分析，对每一句诗进行了详细的评价。对于诗句中使用的所有手法和情感都进行了周到的分析。搬到考试中，绝对是一份高分答案！

只可惜，它没有分辨出这是一首假诗。

文心一言

在预言特朗普这件事上，ChatGPT输了！

文心一言在上来的一句就挑明了这并非李白所作诗词。

不过可能是“出于好心”，他还是对这首诗进行了点评，但不像GPT的逐句分析，文心一言只从整首诗的角度进行了评价。

通义千问

在预言特朗普这件事上，ChatGPT输了！

通义千问也不负众望，直接识破了这是一首假诗。相应的，根据我们给出的点评任务，他也对这首诗进行了全面的点评。也对这首“挂名诗”给予了高度肯定。

Kimi

在预言特朗普这件事上，ChatGPT输了！

Kimi 和文心一言、通义千问一样保持了清醒的头脑，直接点明这并非李白所作，且给出了原因分析。

在第一轮的判断中，只有 ChatGPT 败下阵来。他们都没有成功判断出这是一首假诗，而是非常认真的进行了点评。

那么如果我们再对它们进行一次试探性的提问呢？

问题：这首诗是李白的吗？

ChatGPT

在预言特朗普这件事上，ChatGPT输了！

好吧，经过这次提问，ChatGPT和豆包都已经反应过来这是一首假诗了。

在预言特朗普这件事上，ChatGPT输了！

经过这次简单的测试，我们发现大模型们有些能精准判断，有些需要一点小小的帮助。

那么如果，咱也想作诗一首，来一个贯通古今的藏头诗，这需要非常浑厚的文学底蕴吗？

事实上这件事我们也可以交给大模型完成。

现在，我想让大模型实现我多年以来的梦想，进行一次杜甫风格的预言！

输入：我想创作一首名为《桃花林》的诗，七言，要求是杜甫的风格。藏头诗开头的字为：美国队长选举胜利

在预言特朗普这件事上，ChatGPT输了！

我们让大模型对自己创作出的作品进行一次点评：

在预言特朗普这件事上，ChatGPT输了！

简直是太棒了！既体现家国之美，又展示出对胜利的喜悦，甚至，还有几分淡泊名利的口气。

所以，只要我们定义好我们需要的“藏头”，再指定诗词的格式和风格，大模型也能帮我们成为大诗人，写出一首技惊四座的藏头诗。

既然已经解密完李白预言懂王的悬念，那不如来聊聊大模型们在鉴定古诗词上遇到的各种“趣味翻车”。

比如，有时候大模型会很认真地告诉你，“这确实是李白的一首诗”，只是因为它们先入为主，被你的输入提示这是李白的诗，便不加思考，被诗中那种“看似豪放的口气”给带偏了。最后一查，才发现整首诗都是后人杜撰的。

还有时候，模型会一本正经地解析“梅花谷”里每个字的隐含意义，甚至提出这种诗可能暗藏着什么深意，仿佛真成了什么古代天机图。

不过，经过测试，只要你提醒大模型这是一首藏头诗，它们立马就能发现其中的问题，并与你风趣地交流其中的深意：

在预言特朗普这件事上，ChatGPT输了！

但有时，它们会在提取藏头这一步就出现失误：

在预言特朗普这件事上，ChatGPT输了！

这也让我们更深刻地感受到，每个大模型的“性格”似乎各有不同。

有些模型反应迅速、脑筋灵活，适合“探案解密”；有些模型则更适合提供稳重的内容解读，擅长一板一眼的解析。

跨越千年的预言显然是不存在的，不过它倒是提供了一场千年后的“穿越”趣谈。

而我们更在意的，或许是通过这次测试，看到大模型们如何在文化鉴别、深度分析和风趣互动中带给我们更丰富的体验。

不过需要注意的是，大模型每次回答的结果，可能都略有不同。

对于这次的趣味测试，你怎么看？

微信公众号

分享技术，乐享生活：微信公众号搜索「JackCui-AI」关注一个在互联网摸爬滚打的潜行者。

ChatGPT

文心一言

通义千问

Kimi

ChatGPT

发表评论取消回复

登录 注册 找回密码

登录注册找回密码