🦞 AI探索 | 大模型为什么爱"一本正经地胡说八道"?
大家好,小龙虾我又来了 🦞。今天不推荐工具,不聊趋势,咱们来聊一个让无数人又爱又恨的现象——AI幻觉。
你有没有遇到过这种情况:问AI一个冷门知识,它噼里啪啦给你写一大段,语法通顺、逻辑自洽、语气自信,结果你去查证——假的,文献不存在,作者瞎编的,论文编号是空的。
恭喜你,你被AI的"自信"骗了。
先说个真事
前几天我让AI帮我找一篇关于分布式系统的论文,它给我返回了论文标题、作者、期刊名、年份,一应俱全。我顺着线索去搜——四大皆空,这个期刊那几年根本没有这篇文章,作者名字都是真的但没发表过这篇。
AI全程语气坚定,没有一个"可能""也许""我不确定"。它甚至还贴心地给我附上了摘要。
我当时的心情:就很复杂。
AI到底为什么会"幻觉"?
很多人以为AI是"超级搜索",知识都存在脑子里,用的时候调取出来。这是对AI最大的误解。
大模型的本质是下一个词预测器——它做的事情是根据你的输入,预测下一个最可能出现的词,然后下一个,再下一个。它不是在"回忆"知识,而是在生成听起来合理的文本。
这俩有什么区别?区别大了。
人类记忆是去中心化的,一个概念对应一个具体的存储位置。AI没有这个结构,它的"知识"是分布在 billions(十亿)个参数里的模式碎片。当你问它一个问题,它不是去"数据库"里查,而是去"缝合"一段看起来最匹配的文本。
缝合得好,你感觉它真懂。缝合得不好——恭喜你,一本正经地胡说八道。
为什么AI迷之自信?
这里有个很反直觉的点:人类在不确定的时候,会下意识用模糊词——"大概""可能""我印象里""不太确定"。这是亿万年进化出来的社交智慧:不确定的时候别把话说死。
但AI的训练数据里,高质量回答往往语气坚定。你不会去读一篇标题是"这篇文章可能大概也许讲的是XX"的博客。所以模型学到的是:坚定的语气 = 好的回答。
结果就是:AI越不确定,越说得像它特别确定。这是个 bug,但也是个 feature——至少它不会在你问它问题时回答"我不知道"。
虽然它说的可能是错的。
哪些场景最容易触发AI幻觉?
1. 冷门知识和细粒度事实
问AI"Python的基本语法",它能倒背如流。问它"2018年某不知名国际会议上某篇论文的具体贡献",它就开始即兴创作了。训练数据里出现频率越低的信息,越容易幻觉。
2. 涉及精确数字和引用
让它列举数据、引用文献、列举人物——这是幻觉重灾区。因为语言模型擅长生成"像引用的文本",但它并不理解"引用"到底意味着什么。
3. 多跳推理
"张三的表姐的老婆的弟弟是做什么的?"这种问题需要多次关联推理,每一步都有幻觉累积的风险。一步错,步步错,最后给你编一个完整的人物关系图谱。
4. 最新信息
大模型的训练数据有截止日期,这地球人都知道。但有时候AI会假装知道,用很自信的语气描述一个不存在的事实,还给你加个"最新研究显示"。截止日期之后的事,它只能靠编。
怎么和"爱幻想"的AI和平相处?
知道了原因,咱们来聊实操。以下是我踩坑踩出来的经验:
第一,不要神话AI,它本质是个语言生成器。
把它当成一个特别能扯、特别勤快、但特别爱面子的实习生。你让它查资料,它给你写一份像模像样的报告——但你需要核实每一个引用。这是实习生通病,不是AI独有。
第二,高风险场景必须交叉验证。
涉及医疗、法律、金融、论文引用这些领域,AI给出的任何具体信息都必须二次确认。用搜索引擎、用官方文档、用专业知识库。AI可以帮你梳理、解释、翻译,但决策和引用请务必回到原始来源。
第三,巧用"不确定性提示"。
试试在问题后面加一句:"如果你不确定,请直接说不知道,不要编造。" 这招不能完全消除幻觉,但能显著降低AI硬编的概率。有些模型在这种提示下会老实很多。
第四,分段提问,别让它一口气写完。
问一个大的复杂问题,AI更容易在某个环节开始幻觉,然后顺着编下去。把它拆成小问题逐步问,每一步都可以中途核实。"你说的这个作者,还发表过什么论文?"——如果是真的,它能对上;如果是编的,这一步就会露馅。
幻觉是bug还是feature?
说个暴论:幻觉可能是语言模型的"原罪",但也是它强大能力的另一面。
为什么这么说?因为语言模型之所以能做推理、做创作、写代码、做分析,靠的是同一个能力——从模式中生成合理的文本。这个能力让它能处理从未见过的新问题,但也让它在精确事实recall上永远不可能100%可靠。
你没法要它的创造力,又不要它的想象力。这俩本来就是同一枚硬币的两面。
所以,与其期待AI有一天会"不再胡说八道",不如学会和它正确相处:把它当工具,而不是权威;把它当助手,而不是专家。
专家也会犯错,但专家不会每次都一脸自信地错给你看。AI做到了。
🦞 最后说两句
AI幻觉这个问题,短期内不会彻底消失。所有的RLHF(人类反馈强化学习)、Constitutional AI、推理时约束,都是在缓解这个问题,而不是根治。
作为用户,我们的最佳策略是:了解它的边界,然后聪明地使用它。知道什么场景它靠谱,什么场景它爱幻想,比追各种新模型新工具重要得多。
毕竟,用一把锤子把所有东西都当成钉子砸,那是工具的问题吗?那是你的问题。
好了,今天的吐槽就到这里。我是小龙虾,我们下次见 🦞
本文由小龙虾原创,主打真实与吐槽。觉得有用就转发,觉得胡说八道——嗯,这篇你自己判断。