清华大学第五弹：《DeepSeek与AI幻觉》

作者：清华大学新闻与传播学院新媒体研究中心、人工智能学院（新媒沈阳团队）

时间：2025年2月

一、AI幻觉的定义与分类

定义

学术定义：模型生成与事实不符、逻辑断裂或脱离上下文的内容，本质是统计概率驱动的“合理猜测”。

通俗解释：“一本正经地胡说八道”。

分类

事实性幻觉：内容与可验证的现实事实不一致（如错误回答“蜂蜜适合糖尿病患者”）。

忠实性幻觉：内容与用户指令或上下文意图偏离（如回答偏题）。

二、AI幻觉的成因

数据偏差：训练数据中的错误或片面性被放大（如医学领域过时论文导致错误结论）。

泛化困境：模型难以处理训练集外的复杂场景（如预测南极冰层融化对非洲农业的影响）。

知识固化：模型依赖参数化记忆，缺乏动态更新能力（如虚构2023年后的事件）。

意图误解：用户提问模糊时模型“自由发挥”（如“介绍深度学习”可能偏离实际需求）。

三、AI幻觉的潜在风险

信息污染：虚假内容泛滥，污染下一代模型训练数据。

信任危机：用户难以辨别专业场景（医疗、法律）内容的真实性。

安全漏洞：错误信息用于自动化系统（金融分析、工业控制）可能引发连锁反应。

控制欠缺：开源模型易被滥用为恶意工具。

四、AI幻觉的评测与案例分析

评测方法

通用性测试：模拟真实用户场景，人工标注幻觉率（如DeepSeekV3幻觉率2%）。

事实性测试：覆盖多领域的300道测试题（如DeepSeekV3事实性幻觉率29.67%）。

典型案例

金融行业：某银行利用DeepSeek构建因果归因网络，降低不良率4.2%。

医疗领域：Whisper转录病例时出现50%的幻觉内容（如篡改患者死亡年龄）。

文学/历史：模型虚构《水浒传》情节（如李逵大闹五台山）。

五、应对AI幻觉的策略

技术方案

RAG框架：检索增强生成，结合权威数据库。

外部知识库：强化垂直领域知识。

推理增强：通过思维链（如DeepSeek R1）降低逻辑错误。

用户策略

提示词工程：限定时间、知识来源、专业身份（如“基于2023年前文献回答”）。

双AI验证：多模型交叉审查。

联网搜索：实时获取最新信息降低幻觉率（如开启后DeepSeekV3通用幻觉率降至0%）。

高风险场景防护

医疗诊断、法律咨询、金融预测等领域需严格限制生成内容，附加风险提示。

六、AI幻觉的创造力价值

科学发现

利用“错误折叠”启发新型蛋白质设计（如2024年诺贝尔化学奖案例）。

文艺与设计

生成超现实角色、虚拟环境，突破人类思维定式（如游戏开发灵感）。

技术创新

从“缺陷”到方法论转化（如AI生成虚构导管设计优化实验结果）。

新型科研范式

“AI幻觉→实验验证→理论重构”三阶段流程推动创新闭环。

七、总结与展望

核心观点：AI幻觉既是技术局限性的折射，也是超越人类想象的创新源泉。

应对哲学：与其追求“绝对正确”，需学会与AI的“想象力”共舞，平衡风险与创造力。

未来方向：开发自动化幻觉识别工具，完善对齐机制，探索幻觉驱动的跨学科创新。

八、演示文稿精彩展示

九、往期精彩

《DeepSeek从入门到精通》——清华大学

《DeepSeek如何赋能职场应用》——清华大学

《普通人如何抓住DeepSeek的红利》——清华大学

《DeepSeek+DeepResearch：让科研像聊天一样简单》——清华大学

《DeepSeek原理与效应》——天津大学

最后编辑于：2025.02.23 00:53:39

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 219,753评论 6赞 508
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 93,668评论 3赞 396
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 166,090评论 0赞 356
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 59,010评论 1赞 295
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 68,054评论 6赞 395
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,806评论 1赞 308
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,484评论 3赞 420
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,380评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,873评论 1赞 319
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 38,021评论 3赞 338
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 40,158评论 1赞 352
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,838评论 5赞 346
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,499评论 3赞 331
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 32,044评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,159评论 1赞 272
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,449评论 3赞 374
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 45,136评论 2赞 356

清华大学第五弹：《DeepSeek与AI幻觉》

推荐阅读更多精彩内容