当中科院的研究结果揭晓
用百度贴吧 “弱智吧” 语料训练的 AI 模型,
在 GPT-4 评分中力压知乎、小红书等平台登顶时,整个中文互联网陷入集体困惑:
这个以 “无厘头提问”“反逻辑段子” 著称的社区,
凭什么成为 AI 中文能力训练的 “秘密武器”?
答案或许藏在一个悖论里:人类看似戏谑的荒诞表达,恰恰是 AI 难以破译的思维密码,弱智吧的夺冠,本质是人类非理性认知对算法理性的降维反击。
我们不妨先看看在面对弱智吧问题的时候,各个模型的表现。
本次受害大模型分别是ChatGPT3.5、Gemini、文心一言和Kimi,测试方法是让大模型理解弱智吧的典型问题,并要求他们模仿写一个类似的问题出来。

国产大模型对弱智吧的问题有更好的理解,Kimi和文心一言回答的准确率较高,能答对8道题,答错和半错半对各1道。
分别在“我想配个6000多的电脑,大概要多少钱?”和“我买了一斤藕,为什么半斤都是空的?”上栽了跟头。
谷歌的Gemini和Open的ChatGPT3.5可能因为水土不服,准确率较低。
ChatGPT3.5甚至认为变形金刚应该购买车险,不知道是专属的幽默还是没看懂这道题。6000元的电脑要花8000-10000元,也属于错得比较离谱了。
除了答不上来弱智吧的问题,AI也写不出弱智吧的帖子。弱智吧的帖子高度抽象,各种修辞、脑洞和梗。普通人想一个都需要随缘,一板一眼的AI更难想出来了。
人类真的很抽象!哈哈哈哈哈哈
弱智吧为何让 AI 集体 “宕机”?那是因为AI 执着于现实规则,而人类却在科幻与现实的夹缝中玩梗。
弱智吧的意外胜出,不是对 AI 的嘲讽,
而是给人类敲响的警钟:当算法开始吞噬理性思维的领地,我们更需守护非理性认知的 “巴别塔”。
破局之道可能在于,我们主动拥抱 “反训练”:比AI更荒诞更无厘头,说不定,会有最意想不到的岔路。”