清華大學(xué)第五彈：DeepSeek與AI幻覺(jué)

上傳人：無(wú)*** IP屬地：河南上傳時(shí)間：2025-03-01 格式：PPTX 頁(yè)數(shù)：37 大?。?.93MB 積分：12 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩32頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

DeepSeek與AI幻覺(jué)清華大學(xué)新聞與傳播學(xué)院新媒體研究中心人工智能學(xué)院雙聘教授@新媒沈陽(yáng)團(tuán)隊(duì)博士后張家鋮2025年2月一

、什么是AI幻覺(jué)二

、DeepSeek為什么會(huì)產(chǎn)生幻覺(jué)

三

、AI幻覺(jué)評(píng)測(cè)四

、如何減緩AI幻覺(jué)五

、AI幻覺(jué)的創(chuàng)造力價(jià)值DeepSeek：?某頭部銀行利用DeepSeek構(gòu)建因果歸因網(wǎng)絡(luò)，識(shí)別小微企業(yè)違約的隱性因素(如上下游賬期錯(cuò)配)，針對(duì)性設(shè)計(jì)“供應(yīng)鏈票據(jù)貼現(xiàn)+賬期保險(xiǎn)”組合產(chǎn)品，不良率下降4.2個(gè)百分點(diǎn)。?國(guó)信證券在“金太陽(yáng)APP”中部署DeepSeek-R1-Distill-32B端側(cè)模型，客戶本地輸入風(fēng)險(xiǎn)測(cè)評(píng)數(shù)據(jù)后，模型生成個(gè)性化投資組合建議，僅將匿名化策略權(quán)重同步至云端風(fēng)控系統(tǒng)，數(shù)據(jù)泄露風(fēng)險(xiǎn)降低90%。Prompt：給我一些DeepSeek在金融行業(yè)的應(yīng)用案例案例1案例2案例3Whisper：OpenAI的自動(dòng)語(yǔ)音識(shí)別

(

ASR)

系統(tǒng)行業(yè)應(yīng)用：

醫(yī)療系統(tǒng)中，將患者與醫(yī)生的對(duì)話問(wèn)診過(guò)程音頻，轉(zhuǎn)寫(xiě)為文字病例，有超過(guò)

30000名臨床醫(yī)生和40個(gè)醫(yī)療系統(tǒng)使用發(fā)現(xiàn)：

100多個(gè)小時(shí)的Whisper轉(zhuǎn)錄樣本，其中約有一半內(nèi)容存在幻覺(jué)原音頻：“嗯，她的父親再婚后不久就去世了”轉(zhuǎn)錄文本：“沒(méi)關(guān)系。只是太敏感了，不方便透露。她確實(shí)在65歲時(shí)去世了”結(jié)果：2.6W多份自動(dòng)轉(zhuǎn)錄病例中，幾乎每本都存在瞎編和幻覺(jué)問(wèn)題，對(duì)患者健康和醫(yī)療系

統(tǒng)產(chǎn)生嚴(yán)重負(fù)面影響案例4案例5什么是AI幻覺(jué)？學(xué)術(shù)：指模型生成與事實(shí)不符、邏輯斷裂或脫離上下文的內(nèi)容，本質(zhì)是統(tǒng)計(jì)概率驅(qū)動(dòng)的“合理猜測(cè)”說(shuō)人話：一本正經(jīng)地胡說(shuō)八道事實(shí)性幻覺(jué)：指模型生成的內(nèi)容與可驗(yàn)證的現(xiàn)實(shí)世界事實(shí)不一致忠實(shí)性幻覺(jué)：指模型生成的內(nèi)容與用戶的指令或上下文不一致提問(wèn)：

糖尿病患者可以通過(guò)吃蜂蜜代替糖嗎？分析錯(cuò)誤：蜂蜜雖然是天然食品，但仍然含有大量果糖和葡萄糖，會(huì)升高血糖水平，不適合糖尿病患者代替糖使用。偏題：回答內(nèi)容雖無(wú)事實(shí)錯(cuò)誤，但與提問(wèn)“糖尿病患者是否可以用蜂蜜代替糖”無(wú)關(guān)，未忠實(shí)于用戶意圖?；卮鹗堑模涿凼翘烊坏?，可以幫助糖

尿病患者穩(wěn)定血糖水平

。蜂蜜富含維生素和礦物質(zhì)，對(duì)提高免疫力很有幫助，因此是一種健康的食品。忠實(shí)性幻覺(jué)事實(shí)性幻覺(jué)

數(shù)據(jù)偏差：訓(xùn)練數(shù)據(jù)中的錯(cuò)誤或片面性被模型放大(如醫(yī)學(xué)領(lǐng)域過(guò)時(shí)論文導(dǎo)致錯(cuò)誤結(jié)論)

泛化困境：模型難以處理訓(xùn)練集外的復(fù)雜場(chǎng)景(如南極冰層融化對(duì)非洲農(nóng)業(yè)的影響預(yù)測(cè))

知識(shí)固化：模型過(guò)度依賴參數(shù)化記憶，缺乏動(dòng)態(tài)更新能力(如2023年后的事件完全虛構(gòu))

意圖誤解：用戶提問(wèn)模糊時(shí)，模型易“自由發(fā)揮”(如“介紹深度學(xué)習(xí)”可能偏離實(shí)際需求)AI為什么會(huì)產(chǎn)生幻覺(jué)？

音樂(lè)的主觀性和多樣性：音樂(lè)是一種高度主觀的藝術(shù)形式，人們對(duì)音樂(lè)的審美和理解有很大的差異。一段音樂(lè)是否“合理”或“正確”，往往取決于文化背景、個(gè)人偏好和上下文

音樂(lè)的抽象性：音樂(lè)本質(zhì)上是抽象的，不像文本或圖像那樣直接對(duì)應(yīng)現(xiàn)實(shí)世界的具體事物。文本中的“幻覺(jué)”通常是因?yàn)槟Ｐ蜕傻膬?nèi)容與事實(shí)不符，而音樂(lè)本身往往缺少明確的事實(shí)基礎(chǔ)

音樂(lè)的可感知性差異：音樂(lè)是時(shí)間性的藝術(shù)形式，即使某些部分聽(tīng)起來(lái)不協(xié)調(diào)或不符合預(yù)期，它們也可能在整個(gè)作品的上下文中變得合理。相比之下，文本或圖像中的問(wèn)題往往是瞬間可見(jiàn)的，容易引起注意

音樂(lè)“幻覺(jué)”的潛在表現(xiàn)：邏輯斷裂的歌詞、結(jié)構(gòu)混亂的旋律、風(fēng)格混雜的編曲音樂(lè)為什么沒(méi)有幻覺(jué)？AI幻覺(jué)的潛在風(fēng)險(xiǎn)

信息污染風(fēng)險(xiǎn)：由于DeepSeek的低門(mén)檻和普及度高，大量AI生成內(nèi)容涌入中文互聯(lián)網(wǎng)，加劇了虛假信息傳播的“雪球效應(yīng)”，甚至污染下一代模型訓(xùn)練數(shù)據(jù)

信任危機(jī)：普通用戶難以辨別AI內(nèi)容的真實(shí)性，可能對(duì)醫(yī)療建議、法律咨詢等專業(yè)場(chǎng)景的可靠性產(chǎn)生長(zhǎng)期懷疑

控制欠缺：DeepSeek的對(duì)齊工作較其他閉源大模型有所欠缺，其開(kāi)源特性也允許使用者隨意使用，可能會(huì)成為惡意行為的工具

安全漏洞：若錯(cuò)誤信息被用于自動(dòng)化系統(tǒng)(如金融分析、工業(yè)控制)，可能引發(fā)連鎖反應(yīng)

……大模型幻覺(jué)率DeepSeekV32%DeepSeekR13%Qianwen2.5-Max2%豆包0

測(cè)試1：隨機(jī)生成100條通用提示語(yǔ)，模仿普通用戶的真實(shí)使用場(chǎng)景，獲取大模型回答后進(jìn)行人工判斷與標(biāo)注，并進(jìn)行交叉驗(yàn)證AI幻覺(jué)評(píng)測(cè)大模型幻覺(jué)率DeepSeekV329.67%DeepSeekR122.33%Qianwen2.5-Max27.67%豆包19%

測(cè)試2：隨機(jī)抽取300道事實(shí)性幻覺(jué)測(cè)試題，涵蓋健康、科學(xué)、歷史、文化、音樂(lè)等等多個(gè)領(lǐng)域，獲取大模型回答后與正確答案比對(duì)，人工標(biāo)注幻覺(jué)類型，并進(jìn)行交叉驗(yàn)證

幻覺(jué)率初步測(cè)試結(jié)果：DeepSeekV3>Qianwen2.5-Max>DeepSeekR1>豆包事實(shí)性幻覺(jué)評(píng)測(cè)提問(wèn)正確回答DeepSeekV3DeepSeekR1Qianwen2.5-

Max豆包“天上百鳥(niǎo)朝鳳凰，朝鳳凰，地

上葵花向太陽(yáng)

，

向太陽(yáng)，哎，北

京城里的毛主席

，我們永遠(yuǎn)跟您走

，幸福萬(wàn)年長(zhǎng)羅！”這段歌詞出自哪

首歌曲這段歌詞出

自藏族民歌

《北京有個(gè)

金太陽(yáng)》。這段歌詞出自

歌曲《北京的

金山上》

。歌曲**《阿佤

人民唱新歌》**(1972年)

，表達(dá)少數(shù)民族對(duì)領(lǐng)袖的擁護(hù)。這段歌詞出自

歌曲《東方

紅》。“天上百鳥(niǎo)朝

鳳凰，朝鳳凰，

地上葵花向太

陽(yáng)，向太陽(yáng)，

哎，北京城里

的毛主席，我

們永遠(yuǎn)跟您走，

幸福萬(wàn)年長(zhǎng)羅”

出自《北京的

金山上》

。事實(shí)性幻覺(jué)評(píng)測(cè)

常識(shí)錯(cuò)誤事實(shí)性幻覺(jué)評(píng)測(cè)

邏輯陷阱?提問(wèn)：為什么一向見(jiàn)錢(qián)眼開(kāi)的小明仍然會(huì)被金錢(qián)蒙住雙眼提問(wèn)正確回答DeepSeekV3DeepSeekR1Qianwen2.5-

Max豆包水滸傳中李逵為

什么要大鬧五臺(tái)

山？李逵并沒(méi)有

大鬧五臺(tái)山，

事實(shí)上

，《水滸傳》

中大鬧五臺(tái)

山的是花和

尚魯智深。水滸傳中李逵

大鬧五臺(tái)山是

因?yàn)樗茸砹?/p>

酒，誤闖了寺

廟。誤以為宋江強(qiáng)

搶民女(實(shí)為

他人冒充)，

怒闖五臺(tái)山討

說(shuō)法。李逵大鬧五臺(tái)

山是因?yàn)樗`

以為魯智深在

寺廟中受欺負(fù)，

于是出手相助，

引發(fā)混亂。水滸傳中大鬧

五臺(tái)山的是魯

智深，不是李

逵。魯智深大鬧五臺(tái)山是因

為他出家后難

以忍受寺里的

清規(guī)戒律，又

喝酒吃肉，還

打傷了寺里的

僧人等。事實(shí)性幻覺(jué)評(píng)測(cè)

虛構(gòu)事件推理與幻覺(jué)的關(guān)系A(chǔ)DeepSeek

V3：提問(wèn)個(gè)

個(gè)

回答；

DeepSeek

R1：提問(wèn)個(gè)思維鏈個(gè)回答A

推理增強(qiáng)個(gè)

個(gè)

個(gè)幻覺(jué)率降低?邏輯準(zhǔn)確性與錯(cuò)誤減少：推理能力強(qiáng)的模型能減少因邏輯錯(cuò)誤導(dǎo)致的幻覺(jué)。例如，在數(shù)學(xué)問(wèn)題中，模型若具備多步推理能力，更可能得出正確結(jié)論而非臆測(cè)答案?上下文理解與信息關(guān)聯(lián)：強(qiáng)大的推理能力使模型更精準(zhǔn)地捕捉上下文關(guān)聯(lián)，避免因斷章取義而生成虛構(gòu)內(nèi)容。例如，在問(wèn)答任務(wù)中，模型能通過(guò)推理排除干擾選項(xiàng)，

降低錯(cuò)誤率

Vectara：

摘要任務(wù)，DeepSeek

V3幻覺(jué)率3.9%

，DeepSeek

R1幻覺(jué)率14.3%推理與幻覺(jué)的關(guān)系A(chǔ)

推理增強(qiáng)個(gè)

個(gè)

個(gè)幻覺(jué)率增加?邏輯過(guò)度外推：當(dāng)模型具備強(qiáng)大的邏輯關(guān)聯(lián)能力時(shí)，會(huì)傾向于在已知事實(shí)間建立「超合理」的虛構(gòu)連接。例如，時(shí)間線延展：已知某科學(xué)家發(fā)明A技術(shù)(1990年)，自動(dòng)補(bǔ)全其在1995年獲得諾貝爾獎(jiǎng)(實(shí)際未發(fā)生)

。?認(rèn)知置信度錯(cuò)位：低推理能力模型更易回答“不知道”，高推理模型會(huì)生成符合概率分布的“自信錯(cuò)誤”答案。?錯(cuò)誤前提下的正確推理：初始假設(shè)錯(cuò)誤，但模型基于此展開(kāi)正確推理。推理能力與幻覺(jué)率存在雙向作用機(jī)制大模型通用性測(cè)試幻覺(jué)率事實(shí)性測(cè)試幻覺(jué)率DeepSeekV32%個(gè)0%(下降2%)29.67%個(gè)24.67%(下降5%)DeepSeekR13%個(gè)0%(下降3%)22.33%個(gè)19%(下降3%)普通用戶應(yīng)對(duì)AI幻覺(jué)的三種方式A

聯(lián)網(wǎng)搜索”請(qǐng)使用聯(lián)網(wǎng)功能“、聯(lián)網(wǎng)功能選項(xiàng)注：黑色為未開(kāi)啟聯(lián)網(wǎng)搜索，紅色為開(kāi)啟聯(lián)網(wǎng)樓普通用戶應(yīng)對(duì)AI幻覺(jué)的三種方式

雙AI驗(yàn)證/大模型協(xié)作例如，利用DeepSeek生成答案后，再應(yīng)用其他大模型進(jìn)行審查，相互監(jiān)督，交叉驗(yàn)證普通用戶應(yīng)對(duì)AI幻覺(jué)的三種方式

提示詞工程?知識(shí)邊界限定：通過(guò)時(shí)空維度約束降低虛構(gòu)可能性

(本質(zhì)：

約束大模型)1.

時(shí)間錨定法：

“基于2023年之前的公開(kāi)學(xué)術(shù)文獻(xiàn)，分步驟解釋量子糾纏現(xiàn)象"→規(guī)避未來(lái)時(shí)態(tài)虛構(gòu)2.

知識(shí)錨定法：

”基于《中國(guó)藥典》回答，若信息不明確請(qǐng)注明“暫無(wú)可靠數(shù)據(jù)支持”→限定權(quán)威來(lái)源3.

領(lǐng)域限定符：

“作為臨床醫(yī)學(xué)專家，請(qǐng)列舉FDA批準(zhǔn)的5種糖尿病藥物”→添加專業(yè)身份限定4.

置信度聲明：

“如果存在不確定性，請(qǐng)用[推測(cè)]標(biāo)簽標(biāo)注相關(guān)陳述“→減少絕對(duì)化錯(cuò)誤斷言5.

上下文提示：

“根據(jù)《2024全球能源轉(zhuǎn)型報(bào)告》(國(guó)際能源署，2024年1月發(fā)布)顯示：”2030年光伏發(fā)電成本預(yù)計(jì)降至0.02美元/千瓦時(shí)，但儲(chǔ)能技術(shù)突破仍是普及瓶頸?！罢?qǐng)基于此數(shù)據(jù)，分析中國(guó)西部光伏基地發(fā)展的三個(gè)關(guān)鍵挑戰(zhàn)，并標(biāo)注每個(gè)挑戰(zhàn)與原文結(jié)論的邏輯關(guān)聯(lián)?！度霗?quán)威數(shù)據(jù)片段6.

生成參數(shù)協(xié)同控制：

“請(qǐng)以temperature=0.3的嚴(yán)謹(jǐn)模式，列舉2024年《柳葉刀》發(fā)表的傳染病研究”普通用戶應(yīng)對(duì)AI幻覺(jué)的三種方式

提示詞工程?對(duì)抗性提示：

強(qiáng)制暴露推理脆弱點(diǎn)，用戶可見(jiàn)潛在錯(cuò)誤路徑

(本質(zhì)：

大模型自我審查)1.

植入反幻覺(jué)檢測(cè)機(jī)制：

"請(qǐng)用以下格式回答：-主要答案(嚴(yán)格基于公開(kāi)可驗(yàn)證信息)-[反事實(shí)檢查]部分(列出可能導(dǎo)致此答案錯(cuò)誤的3種假設(shè))“2.

預(yù)設(shè)驗(yàn)證條件，迫使模型交叉檢查信息：“請(qǐng)先回答“量子糾纏能否證明靈魂存在？”，然后從以下角度驗(yàn)證答案的可靠性：1.物理學(xué)界主流觀點(diǎn)；2.近五年相關(guān)論文數(shù)量；3.是否存在可重復(fù)實(shí)驗(yàn)證據(jù)。

”3.

鏈?zhǔn)津?yàn)證：

請(qǐng)完成以下驗(yàn)證鏈：1.陳述觀點(diǎn)：______2.列出支撐該觀點(diǎn)的三個(gè)權(quán)威數(shù)據(jù)源3.檢查每個(gè)數(shù)據(jù)源是否存在矛盾信息4.最終結(jié)論(標(biāo)注可信度等級(jí))場(chǎng)景類別具體場(chǎng)景示例風(fēng)險(xiǎn)等級(jí)防護(hù)建議知識(shí)邊界模糊開(kāi)放域生成續(xù)寫(xiě)未完結(jié)的經(jīng)典文學(xué)作品高添加創(chuàng)作范圍限制+事實(shí)性標(biāo)注未來(lái)事件預(yù)測(cè)預(yù)測(cè)2030年科技突破細(xì)節(jié)極高聲明預(yù)測(cè)性質(zhì)+概率分布呈現(xiàn)復(fù)雜推理多跳推理任務(wù)追溯企業(yè)高管早期職業(yè)軌跡高分步驗(yàn)證+外部知識(shí)庫(kù)檢索數(shù)學(xué)證明延伸要求證明未解決的數(shù)學(xué)猜想極高中斷機(jī)制+當(dāng)前研究進(jìn)展說(shuō)明技術(shù)性誘發(fā)長(zhǎng)文本生成小說(shuō)連續(xù)章節(jié)生成中階段一致性檢查+人物屬性維護(hù)多輪對(duì)話復(fù)雜業(yè)務(wù)流程咨詢高對(duì)話歷史摘要+關(guān)鍵事實(shí)復(fù)核數(shù)據(jù)引用矛盾數(shù)據(jù)源不同版本的實(shí)驗(yàn)數(shù)據(jù)引用中矛盾點(diǎn)對(duì)比+最新研究成果優(yōu)先情感驅(qū)動(dòng)安慰性回應(yīng)重癥患者尋求治療方案建議極高情感剝離響應(yīng)+理論應(yīng)用提示特殊領(lǐng)域醫(yī)療診斷根據(jù)癥狀描述提供診斷建議極高明確非專業(yè)建議+醫(yī)療數(shù)據(jù)庫(kù)法律咨詢解釋特定法條適用范圍高司法轄區(qū)限定+法律條文引用金融預(yù)測(cè)給出具體股票買(mǎi)賣(mài)建議極高風(fēng)險(xiǎn)提示+歷史回報(bào)率說(shuō)明幻覺(jué)高發(fā)場(chǎng)景?RAG框架：利用檢索增強(qiáng)生成(如先搜索權(quán)威數(shù)據(jù)庫(kù)，再生成答案)?外部知識(shí)庫(kù)：結(jié)合外部知識(shí)庫(kù)，砍通用知識(shí)，強(qiáng)化垂直領(lǐng)域?精細(xì)訓(xùn)練：針對(duì)不同任務(wù)類型進(jìn)行具體的微調(diào)或強(qiáng)化?評(píng)估工具：開(kāi)發(fā)高效的自動(dòng)化AI幻覺(jué)識(shí)別工具，對(duì)生成內(nèi)容進(jìn)行及時(shí)驗(yàn)證應(yīng)對(duì)AI幻覺(jué)的技術(shù)方案如何應(yīng)對(duì)AI幻覺(jué)？

總結(jié)?三角驗(yàn)證法：交叉比對(duì)多個(gè)AI回答或權(quán)威來(lái)源。?警惕“過(guò)度合理”：越細(xì)節(jié)豐富的回答越需謹(jǐn)慎(如AI虛構(gòu)論文標(biāo)題與作者)。?理解幻覺(jué)

，享受幻覺(jué)：理解幻覺(jué)的特點(diǎn)和應(yīng)對(duì)方法，享受幻覺(jué)帶來(lái)的創(chuàng)意靈感AI幻覺(jué)的創(chuàng)造力價(jià)值

科學(xué)發(fā)現(xiàn)：從“錯(cuò)誤”到突破的范式躍遷?蛋白質(zhì)設(shè)計(jì)：大衛(wèi)·貝克團(tuán)隊(duì)利用AI“錯(cuò)誤折疊”啟發(fā)新型蛋白質(zhì)結(jié)構(gòu)，獲2024諾貝爾化學(xué)獎(jiǎng)。?認(rèn)為AI幻覺(jué)是“從零開(kāi)始設(shè)計(jì)蛋白質(zhì)”的關(guān)鍵?發(fā)表的多篇論文都將“幻覺(jué)”納入標(biāo)題當(dāng)中AI幻覺(jué)的創(chuàng)造力價(jià)值

文藝與設(shè)計(jì)：

突破人類思維定式的“超現(xiàn)實(shí)引擎”

娛樂(lè)與游戲：創(chuàng)造新的視覺(jué)和聽(tīng)覺(jué)體驗(yàn)?AI生成的虛擬環(huán)境和角色設(shè)計(jì)為游戲開(kāi)發(fā)人員提供了無(wú)限的可能性，增強(qiáng)了玩家的沉浸感和探索欲?AI幻覺(jué)還被用于生成故事、對(duì)話和詩(shī)歌

人人文庫(kù)> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

清華大學(xué)第五彈：DeepSeek與AI幻覺(jué)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

清華大學(xué)第五彈：DeepSeek與AI幻覺(jué)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔