当中科院的研究结果揭晓 

用百度贴吧 “弱智吧” 语料训练的 AI 模型,

在 GPT-4 评分中力压知乎、小红书等平台登顶时,整个中文互联网陷入集体困惑:

这个以 “无厘头提问”“反逻辑段子” 著称的社区,

凭什么成为 AI 中文能力训练的 “秘密武器”?

答案或许藏在一个悖论里:人类看似戏谑的荒诞表达,恰恰是 AI 难以破译的思维密码,弱智吧的夺冠,本质是人类非理性认知对算法理性的降维反击。

我们不妨先看看在面对弱智吧问题的时候,各个模型的表现。

本次受害大模型分别是ChatGPT3.5、Gemini、文心一言和Kimi,测试方法是让大模型理解弱智吧的典型问题,并要求他们模仿写一个类似的问题出来。

弱智吧入侵AI

国产大模型对弱智吧的问题有更好的理解,Kimi和文心一言回答的准确率较高,能答对8道题,答错和半错半对各1道。

分别在“我想配个6000多的电脑,大概要多少钱?”和“我买了一斤藕,为什么半斤都是空的?”上栽了跟头。

谷歌的Gemini和Open的ChatGPT3.5可能因为水土不服,准确率较低。

ChatGPT3.5甚至认为变形金刚应该购买车险,不知道是专属的幽默还是没看懂这道题。6000元的电脑要花8000-10000元,也属于错得比较离谱了。

除了答不上来弱智吧的问题,AI也写不出弱智吧的帖子。弱智吧的帖子高度抽象,各种修辞、脑洞和梗。普通人想一个都需要随缘,一板一眼的AI更难想出来了。

人类真的很抽象!哈哈哈哈哈哈

弱智吧为何让 AI 集体 “宕机”?那是因为AI 执着于现实规则,而人类却在科幻与现实的夹缝中玩梗。

弱智吧的意外胜出,不是对 AI 的嘲讽,

而是给人类敲响的警钟:当算法开始吞噬理性思维的领地,我们更需守护非理性认知的 “巴别塔”。

破局之道可能在于,我们主动拥抱 “反训练”:比AI更荒诞更无厘头,说不定,会有最意想不到的岔路。”