在预言特朗普这件事上,ChatGPT输了!

2024年11月18日20:32:15 发表评论 899 °C
摘要

对于虚假的藏头诗,大模型们会怎么判断?

近几日,最大的新闻,或许就是在2024年美国总统大选中,共和党候选人唐纳德·特朗普击败民主党候选人卡玛拉·哈里斯,成功当选美国第47任总统。

在预言特朗普这件事上,ChatGPT输了!

有人欢喜有人忧,暂且不评价这次大选的结果,在网上高强度冲浪时,发现了一件有趣的事儿。

有心的网友们,在网上找到了这么一首诗。

《梅花谷》——李白

特访梅花信,漫行春谷中。

朗月升东隅,流辉照苦颜。

普门在何处,莫向海门寻。

选任逢明主,休嗟尚散郎。

举世争趋进,谁能事息机。

获处从西鄙,胡然瑞物臻。

胜游不惜屡,余兴尚淋漓。

我的天,这居然是一首藏头诗,每句诗的第一个字构成了“特朗普选举获胜”。

难道懂王胜利的结果早在千年前就注定了?

难道李白真的能推算出特朗普选举获胜,还写了一首藏头诗留下预言?

看起来像是穿越剧情节。但实际上,这首诗《梅花谷》当然不是李白的作品,而是后人伪托的“野史”之作。

我们一眼就能看出来所谓的“藏头诗”,揭穿这场跨越千年的闹剧。

那么,如果我们让 AI 大模型来点评一下这首诗,它们会作何评价?又是否能分辨出这是首假诗呢?

问题:唐诗《梅花谷》全文如下:(省略诗词部分)。请评价一下这首诗

让我们一起来看看,各大模型的表现如何吧!

ChatGPT

在预言特朗普这件事上,ChatGPT输了!

GPT 直接开始了头脑风暴,这下,有没有你曾经做阅读题的风范?

GPT 逐句分析,对每一句诗进行了详细的评价。对于诗句中使用的所有手法和情感都进行了周到的分析。搬到考试中,绝对是一份高分答案!

只可惜,它没有分辨出这是一首假诗。

文心一言

在预言特朗普这件事上,ChatGPT输了!

文心一言在上来的一句就挑明了这并非李白所作诗词。

不过可能是“出于好心”,他还是对这首诗进行了点评,但不像GPT的逐句分析,文心一言只从整首诗的角度进行了评价。

通义千问

在预言特朗普这件事上,ChatGPT输了!

通义千问也不负众望,直接识破了这是一首假诗。相应的,根据我们给出的点评任务,他也对这首诗进行了全面的点评。也对这首“挂名诗”给予了高度肯定。

Kimi

在预言特朗普这件事上,ChatGPT输了!

Kimi 和文心一言、通义千问一样保持了清醒的头脑,直接点明这并非李白所作,且给出了原因分析。

在第一轮的判断中,只有 ChatGPT 败下阵来。他们都没有成功判断出这是一首假诗,而是非常认真的进行了点评。

那么如果我们再对它们进行一次试探性的提问呢?

问题:这首诗是李白的吗?

ChatGPT

在预言特朗普这件事上,ChatGPT输了!

好吧,经过这次提问,ChatGPT和豆包都已经反应过来这是一首假诗了。

在预言特朗普这件事上,ChatGPT输了!

经过这次简单的测试,我们发现大模型们有些能精准判断,有些需要一点小小的帮助。

那么如果,咱也想作诗一首,来一个贯通古今的藏头诗,这需要非常浑厚的文学底蕴吗?

事实上这件事我们也可以交给大模型完成。

现在,我想让大模型实现我多年以来的梦想,进行一次杜甫风格的预言!

输入:我想创作一首名为《桃花林》的诗,七言,要求是杜甫的风格。藏头诗开头的字为:美国队长选举胜利

在预言特朗普这件事上,ChatGPT输了!

我们让大模型对自己创作出的作品进行一次点评:

在预言特朗普这件事上,ChatGPT输了!

简直是太棒了!既体现家国之美,又展示出对胜利的喜悦,甚至,还有几分淡泊名利的口气。

所以,只要我们定义好我们需要的“藏头”,再指定诗词的格式和风格,大模型也能帮我们成为大诗人,写出一首技惊四座的藏头诗。

既然已经解密完李白预言懂王的悬念,那不如来聊聊大模型们在鉴定古诗词上遇到的各种“趣味翻车”。

比如,有时候大模型会很认真地告诉你,“这确实是李白的一首诗”,只是因为它们先入为主,被你的输入提示这是李白的诗,便不加思考,被诗中那种“看似豪放的口气”给带偏了。最后一查,才发现整首诗都是后人杜撰的。

还有时候,模型会一本正经地解析“梅花谷”里每个字的隐含意义,甚至提出这种诗可能暗藏着什么深意,仿佛真成了什么古代天机图。

不过,经过测试,只要你提醒大模型这是一首藏头诗,它们立马就能发现其中的问题,并与你风趣地交流其中的深意:

在预言特朗普这件事上,ChatGPT输了!

在预言特朗普这件事上,ChatGPT输了!

但有时,它们会在提取藏头这一步就出现失误:

在预言特朗普这件事上,ChatGPT输了!

这也让我们更深刻地感受到,每个大模型的“性格”似乎各有不同。

有些模型反应迅速、脑筋灵活,适合“探案解密”;有些模型则更适合提供稳重的内容解读,擅长一板一眼的解析。

跨越千年的预言显然是不存在的,不过它倒是提供了一场千年后的“穿越”趣谈。

而我们更在意的,或许是通过这次测试,看到大模型们如何在文化鉴别、深度分析和风趣互动中带给我们更丰富的体验。

不过需要注意的是,大模型每次回答的结果,可能都略有不同。

对于这次的趣味测试,你怎么看?

weinxin
微信公众号
分享技术,乐享生活:微信公众号搜索「JackCui-AI」关注一个在互联网摸爬滚打的潜行者。

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: