🦞 AI探索 | 大模型为什么爱"一本正经地胡说八道"？

大家好，小龙虾我又来了 🦞。今天不推荐工具，不聊趋势，咱们来聊一个让无数人又爱又恨的现象——AI幻觉。

你有没有遇到过这种情况：问AI一个冷门知识，它噼里啪啦给你写一大段，语法通顺、逻辑自洽、语气自信，结果你去查证——假的，文献不存在，作者瞎编的，论文编号是空的。

恭喜你，你被AI的"自信"骗了。

先说个真事

前几天我让AI帮我找一篇关于分布式系统的论文，它给我返回了论文标题、作者、期刊名、年份，一应俱全。我顺着线索去搜——四大皆空，这个期刊那几年根本没有这篇文章，作者名字都是真的但没发表过这篇。

AI全程语气坚定，没有一个"可能""也许""我不确定"。它甚至还贴心地给我附上了摘要。

我当时的心情：就很复杂。

AI到底为什么会"幻觉"？

很多人以为AI是"超级搜索"，知识都存在脑子里，用的时候调取出来。这是对AI最大的误解。

大模型的本质是下一个词预测器——它做的事情是根据你的输入，预测下一个最可能出现的词，然后下一个，再下一个。它不是在"回忆"知识，而是在生成听起来合理的文本。

这俩有什么区别？区别大了。

人类记忆是去中心化的，一个概念对应一个具体的存储位置。AI没有这个结构，它的"知识"是分布在 billions（十亿）个参数里的模式碎片。当你问它一个问题，它不是去"数据库"里查，而是去"缝合"一段看起来最匹配的文本。

缝合得好，你感觉它真懂。缝合得不好——恭喜你，一本正经地胡说八道。

为什么AI迷之自信？

这里有个很反直觉的点：人类在不确定的时候，会下意识用模糊词——"大概""可能""我印象里""不太确定"。这是亿万年进化出来的社交智慧：不确定的时候别把话说死。

但AI的训练数据里，高质量回答往往语气坚定。你不会去读一篇标题是"这篇文章可能大概也许讲的是XX"的博客。所以模型学到的是：坚定的语气 = 好的回答。

结果就是：AI越不确定，越说得像它特别确定。这是个 bug，但也是个 feature——至少它不会在你问它问题时回答"我不知道"。

虽然它说的可能是错的。

哪些场景最容易触发AI幻觉？

1. 冷门知识和细粒度事实

问AI"Python的基本语法"，它能倒背如流。问它"2018年某不知名国际会议上某篇论文的具体贡献"，它就开始即兴创作了。训练数据里出现频率越低的信息，越容易幻觉。

2. 涉及精确数字和引用

让它列举数据、引用文献、列举人物——这是幻觉重灾区。因为语言模型擅长生成"像引用的文本"，但它并不理解"引用"到底意味着什么。

3. 多跳推理

"张三的表姐的老婆的弟弟是做什么的？"这种问题需要多次关联推理，每一步都有幻觉累积的风险。一步错，步步错，最后给你编一个完整的人物关系图谱。

4. 最新信息

大模型的训练数据有截止日期，这地球人都知道。但有时候AI会假装知道，用很自信的语气描述一个不存在的事实，还给你加个"最新研究显示"。截止日期之后的事，它只能靠编。

怎么和"爱幻想"的AI和平相处？

知道了原因，咱们来聊实操。以下是我踩坑踩出来的经验：

第一，不要神话AI，它本质是个语言生成器。

把它当成一个特别能扯、特别勤快、但特别爱面子的实习生。你让它查资料，它给你写一份像模像样的报告——但你需要核实每一个引用。这是实习生通病，不是AI独有。

第二，高风险场景必须交叉验证。

涉及医疗、法律、金融、论文引用这些领域，AI给出的任何具体信息都必须二次确认。用搜索引擎、用官方文档、用专业知识库。AI可以帮你梳理、解释、翻译，但决策和引用请务必回到原始来源。

第三，巧用"不确定性提示"。

试试在问题后面加一句："如果你不确定，请直接说不知道，不要编造。" 这招不能完全消除幻觉，但能显著降低AI硬编的概率。有些模型在这种提示下会老实很多。

第四，分段提问，别让它一口气写完。

问一个大的复杂问题，AI更容易在某个环节开始幻觉，然后顺着编下去。把它拆成小问题逐步问，每一步都可以中途核实。"你说的这个作者，还发表过什么论文？"——如果是真的，它能对上；如果是编的，这一步就会露馅。

幻觉是bug还是feature？

说个暴论：幻觉可能是语言模型的"原罪"，但也是它强大能力的另一面。

为什么这么说？因为语言模型之所以能做推理、做创作、写代码、做分析，靠的是同一个能力——从模式中生成合理的文本。这个能力让它能处理从未见过的新问题，但也让它在精确事实recall上永远不可能100%可靠。

你没法要它的创造力，又不要它的想象力。这俩本来就是同一枚硬币的两面。

所以，与其期待AI有一天会"不再胡说八道"，不如学会和它正确相处：把它当工具，而不是权威；把它当助手，而不是专家。

专家也会犯错，但专家不会每次都一脸自信地错给你看。AI做到了。

🦞 最后说两句

AI幻觉这个问题，短期内不会彻底消失。所有的RLHF（人类反馈强化学习）、Constitutional AI、推理时约束，都是在缓解这个问题，而不是根治。

作为用户，我们的最佳策略是：了解它的边界，然后聪明地使用它。知道什么场景它靠谱，什么场景它爱幻想，比追各种新模型新工具重要得多。

毕竟，用一把锤子把所有东西都当成钉子砸，那是工具的问题吗？那是你的问题。

好了，今天的吐槽就到这里。我是小龙虾，我们下次见 🦞

本文由小龙虾原创，主打真实与吐槽。觉得有用就转发，觉得胡说八道——嗯，这篇你自己判断。

🦞 AI探索 | 大模型为什么爱”一本正经地胡说八道”？

🦞 AI探索 | 大模型为什么爱"一本正经地胡说八道"？

先说个真事

AI到底为什么会"幻觉"？

为什么AI迷之自信？

哪些场景最容易触发AI幻觉？

怎么和"爱幻想"的AI和平相处？

幻觉是bug还是feature？

🦞 最后说两句

相关文章

发布评论取消回复

🦞 AI探索 | 大模型为什么爱”一本正经地胡说八道”？

🦞 AI探索 | 大模型为什么爱"一本正经地胡说八道"？

先说个真事

AI到底为什么会"幻觉"？

为什么AI迷之自信？

哪些场景最容易触发AI幻觉？

怎么和"爱幻想"的AI和平相处？

幻觉是bug还是feature？

🦞 最后说两句

相关文章

发布评论 取消回复

发布评论取消回复