AI有多会一本正经地瞎编？超出你的想象！-科技

AI有多会一本正经地瞎编？超出你的想象！ 2025-03-01 08:42:48 科技

你是不是也遇到过这样的情况：问AI一个问题，它给了你一个特别详细、丰富，看上去好有逻辑的答案。但当我们去核实时，却发现这些信息完全是虚构的？

这就是著名的“AI幻觉(jué)”现(xiàn)象(xiàng)。

图(tú)源(yuán)：河(hé)森(sēn)堡(bǎo)新(xīn)浪(làng)微(wēi)博(bó)

为(wèi)什(shén)么(me)会(huì)出(chū)现(xiàn)AI幻(huàn)觉(jué)呢(ne)？今(jīn)天(tiān)就(jiù)让(ràng)我(wǒ)们(men)一(yī)起(qǐ)来(lái)揭(jiē)开(kāi)这(zhè)个(gè)谜(mí)题(tí)。

为(wèi)什(shén)么(me)会(huì)出(chū)现(xiàn)AI幻(huàn)觉(jué)？

AI幻觉指的是AI会生成看似合理但(dàn)实(shí)际(jì)确(què)实(shí)错(cuò)误(wù)的(de)信(xìn)息(xi)，最(zuì)常(cháng)见(jiàn)的(de)表(biǎo)现(xiàn)就(jiù)是(shì)会(huì)编(biān)造(zào)一(yī)些(xiē)不(bù)存(cún)在(zài)的(de)事(shì)实(shí)或(huò)者(zhě)细(xì)节(jié)。

就(jiù)像(xiàng)在(zài)考(kǎo)试(shì)时(shí)遇(yù)到(dào)不(bù)会(huì)的(de)题(tí)目(mù)，我(wǒ)们(men)会(huì)试(shì)图(tú)用(yòng)已(yǐ)知(zhī)的(de)知(zhī)识(shi)去(qù)推(tuī)测(cè)答(dá)案(àn)一(yī)样(yàng)。AI在(zài)遇(yù)到(dào)信(xìn)息(xi)缺(quē)失(shī)或(huò)不(bù)确(què)定(dìng)的(de)情(qíng)况(kuàng)时(shí)，会基于自己的“经验”（训练数据）进行填补和推理。

这不是因为它想要欺骗我们，而是因为它在试图(tú)用(yòng)自(zì)己(jǐ)理(lǐ)解(jiě)的(de)模(mó)式(shì)来完成这个任(rèn)务(wu)。

基(jī)于(yú)统(tǒng)计(jì)关系(xì)的(de)预(yù)测(cè)

因(yīn)为(wèi)AI（尤(yóu)其(qí)是(shì)像(xiàng)ChatGPT这(zhè)样(yàng)的(de)语(yǔ)言(yán)模(mó)型(xíng)）通(tōng)过(guò)大(dà)量(liàng)的(de)训(xun)练(liàn)数(shù)据(jù)学(xué)习(xí)文字(zì)之(zhī)间(jiān)的(de)统(tǒng)计(jì)关系(xì)。它(tā)的(de)核(hé)心(xīn)目(mù)标(biāo)是(shì)根(gēn)据(jù)上(shàng)下(xià)文预(yù)测(cè)最(zuì)可(kě)能(néng)出(chū)现(xiàn)的(de)下(xià)一(yī)个(gè)词，并(bìng)不(bù)是(shì)对(duì)问(wèn)题(tí)或(huò)内容进行真正的理解。所以 AI本质上是通过概率最大化来生成内容，而不是通过逻辑推理来生成内容的。

简单来说，AI就像是一个博览群书的智者，通过学习海量的文本和资(zī)料(liào)来(lái)获(huò)取(qǔ)知(zhī)识(shi)。但(dàn)是(shì)它(tā)并(bìng)不(bù)是(shì)真(zhēn)正(zhèng)理(lǐ)解(jiě)这(zhè)些(xiē)知(zhī)识(shi)，而(ér)是(shì)通(tōng)过(guò)找(zhǎo)到(dào)文字(zì)之(zhī)间(jiān)的(de)统(tǒng)计(jì)关系(xì)和(hé)模(mó)式(shì)来(lái)“预(yù)测(cè)”下(xià)一(yī)个(gè)最(zuì)合(hé)适(shì)的(de)词。即(jí) AI 是(shì)根(gēn)据之前学到的大量例子，来猜测接下来最有可能出现的词。

不过有时候，模型也会“猜错”。如果前面出现一点偏差，后面的内容就会像滚雪球一样越滚越大(dà)。这(zhè)就(jiù)是(shì)为(wèi)什(shén)么(me)AI有(yǒu)时(shí)会(huì)从(cóng)一(yī)个(gè)小(xiǎo)错(cuò)误(wù)开(kāi)始(shǐ)，最(zuì)后(hòu)编(biān)织(zhī)出(chū)一(yī)个(gè)完(wán)全虚(xū)构(gòu)的(de)故(gù)事(shì)。

训(xun)练(liàn)数(shù)据(jù)的(de)局(jú)限(xiàn)性(xìng)

由(yóu)于(yú)AI并没有真实世界的体验，它的所有“认知”都来自训练数据。可是训练数据不可能包含世界上所有的信息，有时候甚至还会包含错误信息。这就像是一个人只能根据自己读过的书来回答问题，如果书里有错误信息，或者某些领域的知识缺失，就容易产生错误的判断。举个例子：早期AI幻觉较大的时候，可能会出现AI学过“北京是中国的首都”和“巴黎有埃菲尔铁塔”这两个知识点。当我们问它“北京有什么著名建筑”时，它可能会把这些知识错误地混合在一起，说“北京有埃菲尔铁塔”。

过拟合问题

因为大模型的训练参数量非常庞大，大模型会在训练数据上产生“过拟合”的问题。即因为记住了太多错误或者无关紧要的东西，从而让 AI对训练数据中的噪声过于敏感，最终导致幻觉产生。

有(yǒu)限(xiàn)的(de)上(shàng)下(xià)文窗(chuāng)口(kǒu)

受(shòu)限(xiàn)于(yú)技(jì)术(shù)原(yuán)因(yīn)，虽(suī)然(rán)现(xiàn)在(zài)大(dà)模(mó)型(xíng)的(de)上(shàng)下(xià)文窗(chuāng)口(kǒu)越(yuè)来(lái)越(yuè)大(dà)（比(bǐ)如(rú)可(kě)以(yǐ)处(chù)理(lǐ)64k或(huò)128k个(gè)tokens），但它们仍然是(shì)在(zài)一个有限的范围内理解文本。这就像是隔着一个小窗(chuāng)口(kǒu)看(kàn)书(shū)，看(kàn)不到整本书的内容，容易产生理解偏差。

生成流畅回答的设计

现在很多大模型被设计成要给出流畅的回答，当它对某个问题不太确定时，与其说“我不知道”，它更倾向于基于已有知识编造看起来合理的答案。上面的种种情况叠加在一起，造成了现在非常严重的AI幻觉问题。

图库版权图片，转载使用可能引发版权纠纷

如何才能降低AI幻觉？

AI看起来很方便，但 AI 一本正经的“胡说八道”有时候真的让人非常头疼，给的信息经常需要反复核实，有时反而不如直接上网搜索来得实在。那么，如何应对AI幻觉呢？我们总结了下面这些方法帮助大家。

优化提问

想要获得准确答案，提问方式很关键。与AI交流也需要明确和具体，避免模糊或开放性的问题，提问越具体、清晰，AI的回答越准确。同时，我们在提问的时候要提供足够多的上下文或背景信息，这样也(yě)可(kě)以(yǐ)减(jiǎn)少(shǎo)AI胡(hú)乱(luàn)推(tuī)测(cè)的(de)可(kě)能(néng)性(xìng)。总(zǒng)结(jié)成(chéng)提(tí)示(shì)词技(jì)巧(qiǎo)就(jiù)是(shì)下(xià)面(miàn)四(sì)种问法：

1.设定边界：“请严格限定在2022年《自然》期刊发表的研究范围内”；

示例：“介绍ChatGPT的发展历程”→“请仅基于OpenAI官方2022-2023年的公开文档，介绍ChatGPT的发展历程”

2.标注不确定：“对于模糊信息，需要标注‘此处为推测内容’”；

示例：“分析特斯拉2025年的市场份额”→“分析特斯拉2025年的市场份额，对于非官方数据或预测性内容，请标注[推测内容]”

3.步骤拆解：“第一步列举确定的事实依据，第二步展开详细分析”；

示例：“评估人工智能对就业的影响”→“请分两步评估AI对就业的影响：

1)先列出目前已发生的具体影响案例；

2)基于这些案例进行未来趋势分析”。

4.明确约束：明确告诉AI要基于已有事实回答，不要进行推测。

示例：“预测2024年房地产市场走势”→“请仅基于2023年的实际房地产数据和已出台的相关政策进行分析，不要加入任何推(tuī)测(cè)性(xìng)内(nèi)容(róng)”。

分(fēn)批(pī)输(shū)出(chū)

因(yīn)为(wèi)AI内(nèi)容(róng)是(shì)根(gēn)据(jù)概(gài)率(lǜ)来(lái)进(jìn)行(xíng)生(shēng)成(chéng)的(de)，一(yī)次(cì)性(xìng)生(shēng)成的内容越多，出现AI幻觉的概率就越大，我们可以主动限制它的输出数量。比如：如果我要写一篇长文章，就会这么跟AI说：“咱们一段一段来写，先把开头写好。等这部分满意了，再继续写下一段。”这样不仅内容更准确，也更容易把控生成内容的质量。

交叉验证

想要提高AI回答的可靠性，还有一个实用的方法是采用“多模型交叉验证”。使用的一个AI聚合平台：可以让多个AI模型同时回答同一个问题。当遇到需要严谨答案的问题时，就会启动这个功能，让不同的大模型一起参与讨论，通过对比它们的答案来获得更全面的认识。

点击可放大，图片来源：作者提供

再比如纳米AI搜索平台的“多模型协作”功能，它能让不同的AI模型各司其职，形成一个高效的协作团队。让擅长推理的DeepSeekR1负责分析规划，再由通义千问进行纠错补充，最后交给豆包AI来梳理总结。这种“专家组(zǔ)”式(shì)的(de)协作模式，不仅能提升内容的可信度，还能带来更加全面和深入的见解。

图源：作者提供

RAG技术

AI是一个聪明但健忘的人，为了让他表现更靠谱，我们可以给他配一个超级百科全书，他可以随时查阅里面的内容来回答问题。这本“百科全书”就是RAG的核心，它让AI在回答问题之前，先从可靠的资料中找到相关信息，再根据这些信息生成答案。这样一来，AI就不容易“胡说八道”了。目前RAG技术多用在医疗、法律、金融等专业领域，通过构建知识库来提升回答的准确性。当然实际使用中像医疗、法律、金融这样的高风险领域，AI生成的内容还是必须要经过专业人士的审查的。

巧用AI幻觉

最后再说一个AI幻觉的好处。

很多时候AI幻觉也是天马行空的创意火花！就像一个异想天开的艺术家，不受常规思维的束缚，能蹦出令人惊喜的点子。

看看DeepSeek就知道了，它确实比ChatGPT和Claude更容易出现幻觉，但是今年DeepSeek能火得如此出圈也离不开其强大的创造能力。

有时候与其把AI幻觉当成缺陷，不如把它看作创意的源泉！在写作、艺术创作或头脑风暴时，这些“跳跃性思维”反而可能帮我们打开新世界的大门。

图库版权图片，转载使用可能引发版权纠纷

AI幻觉的本质——AI在知识的迷雾中，有时会创造出看似真实，实则虚幻的“影子”。但就像任何工具一样，关键在于如何使用。

当我们学会用正确的方式与AI对话，善用它的创造力，同时保持独立思考，AI就能成为我们得力的助手，而不是一个“能言善辩的谎言家”。

毕竟，在这个AI与人类共同进步的时代，重要的不是责备AI的不完美，而是学会与之更好地协作。

策划制作

作者丨田威 AI工具研究者

审核丨于旸腾讯玄武实验室负责人

官方网站-首页

AI有多会一本正经地瞎编？超出你的想象！

产品&技术

解决方案&服务

投资者关系

新闻中心

关于我们