清華大學(xué)第五彈:DeepSeek與AI幻覺(jué)_第1頁(yè)
清華大學(xué)第五彈:DeepSeek與AI幻覺(jué)_第2頁(yè)
清華大學(xué)第五彈:DeepSeek與AI幻覺(jué)_第3頁(yè)
清華大學(xué)第五彈:DeepSeek與AI幻覺(jué)_第4頁(yè)
清華大學(xué)第五彈:DeepSeek與AI幻覺(jué)_第5頁(yè)
已閱讀5頁(yè),還剩32頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

DeepSeek與AI幻覺(jué)清華大學(xué)新聞與傳播學(xué)院新媒體研究中心人工智能學(xué)院雙聘教授@新媒沈陽(yáng)團(tuán)隊(duì)博士后張家鋮2025年2月一

、什么是AI幻覺(jué)二

、DeepSeek為什么會(huì)產(chǎn)生幻覺(jué)

、AI幻覺(jué)評(píng)測(cè)四

、如何減緩AI幻覺(jué)五

、AI幻覺(jué)的創(chuàng)造力價(jià)值DeepSeek:?某頭部銀行利用DeepSeek構(gòu)建因果歸因網(wǎng)絡(luò),識(shí)別小微企業(yè)違約的隱性因素(如上下游賬期錯(cuò)配),針對(duì)性設(shè)計(jì)“供應(yīng)鏈票據(jù)貼現(xiàn)+賬期保險(xiǎn)”組合產(chǎn)品,不良率下降4.2個(gè)百分點(diǎn)。?國(guó)信證券在“金太陽(yáng)APP”中部署DeepSeek-R1-Distill-32B端側(cè)模型,客戶本地輸入風(fēng)險(xiǎn)測(cè)評(píng)數(shù)據(jù)后,模型生成個(gè)性化投資組合建議,僅將匿名化策略權(quán)重同步至云端風(fēng)控系統(tǒng),數(shù)據(jù)泄露風(fēng)險(xiǎn)降低90%。Prompt:給我一些DeepSeek在金融行業(yè)的應(yīng)用案例案例1案例2案例3Whisper:OpenAI的自動(dòng)語(yǔ)音識(shí)別

(

ASR)

系統(tǒng)行業(yè)應(yīng)用:

醫(yī)療系統(tǒng)中,將患者與醫(yī)生的對(duì)話問(wèn)診過(guò)程音頻,轉(zhuǎn)寫(xiě)為文字病例,有超過(guò)

30000名臨床醫(yī)生和40個(gè)醫(yī)療系統(tǒng)使用發(fā)現(xiàn):

100多個(gè)小時(shí)的Whisper轉(zhuǎn)錄樣本,其中約有一半內(nèi)容存在幻覺(jué)原音頻:“嗯,她的父親再婚后不久就去世了”轉(zhuǎn)錄文本:“沒(méi)關(guān)系。只是太敏感了,不方便透露。她確實(shí)在65歲時(shí)去世了”結(jié)果:2.6W多份自動(dòng)轉(zhuǎn)錄病例中,幾乎每本都存在瞎編和幻覺(jué)問(wèn)題,對(duì)患者健康和醫(yī)療系

統(tǒng)產(chǎn)生嚴(yán)重負(fù)面影響案例4案例5什么是AI幻覺(jué)?學(xué)術(shù):指模型生成與事實(shí)不符、邏輯斷裂或脫離上下文的內(nèi)容,本質(zhì)是統(tǒng)計(jì)概率驅(qū)動(dòng)的“合理猜測(cè)”說(shuō)人話:一本正經(jīng)地胡說(shuō)八道事實(shí)性幻覺(jué):指模型生成的內(nèi)容與可驗(yàn)證的現(xiàn)實(shí)世界事實(shí)不一致忠實(shí)性幻覺(jué):指模型生成的內(nèi)容與用戶的指令或上下文不一致提問(wèn):

糖尿病患者可以通過(guò)吃蜂蜜代替糖嗎?分析錯(cuò)誤:蜂蜜雖然是天然食品,但仍然含有大量果糖和葡萄糖,會(huì)升高血糖水平,不適合糖尿病患者代替糖使用。偏題:回答內(nèi)容雖無(wú)事實(shí)錯(cuò)誤,但與提問(wèn)“糖尿病患者是否可以用蜂蜜代替糖”無(wú)關(guān),未忠實(shí)于用戶意圖?;卮鹗堑模涿凼翘烊坏?,可以幫助糖

尿病患者穩(wěn)定血糖水平

。蜂蜜富含維生素和礦物質(zhì),對(duì)提高免疫力很有幫助,因此是一種健康的食品。忠實(shí)性幻覺(jué)事實(shí)性幻覺(jué)

數(shù)據(jù)偏差:訓(xùn)練數(shù)據(jù)中的錯(cuò)誤或片面性被模型放大(如醫(yī)學(xué)領(lǐng)域過(guò)時(shí)論文導(dǎo)致錯(cuò)誤結(jié)論)

泛化困境:模型難以處理訓(xùn)練集外的復(fù)雜場(chǎng)景(如南極冰層融化對(duì)非洲農(nóng)業(yè)的影響預(yù)測(cè))

知識(shí)固化:模型過(guò)度依賴參數(shù)化記憶,缺乏動(dòng)態(tài)更新能力(如2023年后的事件完全虛構(gòu))

意圖誤解:用戶提問(wèn)模糊時(shí),模型易“自由發(fā)揮”(如“介紹深度學(xué)習(xí)”可能偏離實(shí)際需求)AI為什么會(huì)產(chǎn)生幻覺(jué)?

音樂(lè)的主觀性和多樣性:音樂(lè)是一種高度主觀的藝術(shù)形式,人們對(duì)音樂(lè)的審美和理解有很大的差異。一段音樂(lè)是否“合理”或“正確”,往往取決于文化背景、個(gè)人偏好和上下文

音樂(lè)的抽象性:音樂(lè)本質(zhì)上是抽象的,不像文本或圖像那樣直接對(duì)應(yīng)現(xiàn)實(shí)世界的具體事物。文本中的“幻覺(jué)”通常是因?yàn)槟P蜕傻膬?nèi)容與事實(shí)不符,而音樂(lè)本身往往缺少明確的事實(shí)基礎(chǔ)

音樂(lè)的可感知性差異:音樂(lè)是時(shí)間性的藝術(shù)形式,即使某些部分聽(tīng)起來(lái)不協(xié)調(diào)或不符合預(yù)期,它們也可能在整個(gè)作品的上下文中變得合理。相比之下,文本或圖像中的問(wèn)題往往是瞬間可見(jiàn)的,容易引起注意

音樂(lè)“幻覺(jué)”的潛在表現(xiàn):邏輯斷裂的歌詞、結(jié)構(gòu)混亂的旋律、風(fēng)格混雜的編曲音樂(lè)為什么沒(méi)有幻覺(jué)?AI幻覺(jué)的潛在風(fēng)險(xiǎn)

信息污染風(fēng)險(xiǎn):由于DeepSeek的低門(mén)檻和普及度高,大量AI生成內(nèi)容涌入中文互聯(lián)網(wǎng),加劇了虛假信息傳播的“雪球效應(yīng)”,甚至污染下一代模型訓(xùn)練數(shù)據(jù)

信任危機(jī):普通用戶難以辨別AI內(nèi)容的真實(shí)性,可能對(duì)醫(yī)療建議、法律咨詢等專業(yè)場(chǎng)景的可靠性產(chǎn)生長(zhǎng)期懷疑

控制欠缺:DeepSeek的對(duì)齊工作較其他閉源大模型有所欠缺,其開(kāi)源特性也允許使用者隨意使用,可能會(huì)成為惡意行為的工具

安全漏洞:若錯(cuò)誤信息被用于自動(dòng)化系統(tǒng)(如金融分析、工業(yè)控制),可能引發(fā)連鎖反應(yīng)

……大模型幻覺(jué)率DeepSeekV32%DeepSeekR13%Qianwen2.5-Max2%豆包0

測(cè)試1:隨機(jī)生成100條通用提示語(yǔ),模仿普通用戶的真實(shí)使用場(chǎng)景,獲取大模型回答后進(jìn)行人工判斷與標(biāo)注,并進(jìn)行交叉驗(yàn)證AI幻覺(jué)評(píng)測(cè)大模型幻覺(jué)率DeepSeekV329.67%DeepSeekR122.33%Qianwen2.5-Max27.67%豆包19%

測(cè)試2:隨機(jī)抽取300道事實(shí)性幻覺(jué)測(cè)試題,涵蓋健康、科學(xué)、歷史、文化、音樂(lè)等等多個(gè)領(lǐng)域,獲取大模型回答后與正確答案比對(duì),人工標(biāo)注幻覺(jué)類型,并進(jìn)行交叉驗(yàn)證

幻覺(jué)率初步測(cè)試結(jié)果:DeepSeekV3>Qianwen2.5-Max>DeepSeekR1>豆包事實(shí)性幻覺(jué)評(píng)測(cè)提問(wèn)正確回答DeepSeekV3DeepSeekR1Qianwen2.5-

Max豆包“天上百鳥(niǎo)朝鳳凰,朝鳳凰,地

上葵花向太陽(yáng)

向太陽(yáng),哎,北

京城里的毛主席

,我們永遠(yuǎn)跟您走

,幸福萬(wàn)年長(zhǎng)羅!”這段歌詞出自哪

首歌曲這段歌詞出

自藏族民歌

《北京有個(gè)

金太陽(yáng)》。這段歌詞出自

歌曲《北京的

金山上》

。歌曲**《阿佤

人民唱新歌》**(1972年)

,表達(dá)少數(shù)民族對(duì)領(lǐng)袖的擁護(hù)。這段歌詞出自

歌曲《東方

紅》。“天上百鳥(niǎo)朝

鳳凰,朝鳳凰,

地上葵花向太

陽(yáng),向太陽(yáng),

哎,北京城里

的毛主席,我

們永遠(yuǎn)跟您走,

幸福萬(wàn)年長(zhǎng)羅”

出自《北京的

金山上》

。事實(shí)性幻覺(jué)評(píng)測(cè)

常識(shí)錯(cuò)誤事實(shí)性幻覺(jué)評(píng)測(cè)

邏輯陷阱?提問(wèn):為什么一向見(jiàn)錢(qián)眼開(kāi)的小明仍然會(huì)被金錢(qián)蒙住雙眼提問(wèn)正確回答DeepSeekV3DeepSeekR1Qianwen2.5-

Max豆包水滸傳中李逵為

什么要大鬧五臺(tái)

山?李逵并沒(méi)有

大鬧五臺(tái)山,

事實(shí)上

,《水滸傳》

中大鬧五臺(tái)

山的是花和

尚魯智深。水滸傳中李逵

大鬧五臺(tái)山是

因?yàn)樗茸砹?/p>

酒,誤闖了寺

廟。誤以為宋江強(qiáng)

搶民女(實(shí)為

他人冒充),

怒闖五臺(tái)山討

說(shuō)法。李逵大鬧五臺(tái)

山是因?yàn)樗`

以為魯智深在

寺廟中受欺負(fù),

于是出手相助,

引發(fā)混亂。水滸傳中大鬧

五臺(tái)山的是魯

智深,不是李

逵。魯智深大鬧五臺(tái)山是因

為他出家后難

以忍受寺里的

清規(guī)戒律,又

喝酒吃肉,還

打傷了寺里的

僧人等。事實(shí)性幻覺(jué)評(píng)測(cè)

虛構(gòu)事件推理與幻覺(jué)的關(guān)系A(chǔ)DeepSeek

V3:提問(wèn)個(gè)

個(gè)

回答;

DeepSeek

R1:提問(wèn)個(gè)思維鏈個(gè)回答A

推理增強(qiáng)個(gè)

個(gè)

個(gè)幻覺(jué)率降低?邏輯準(zhǔn)確性與錯(cuò)誤減少:推理能力強(qiáng)的模型能減少因邏輯錯(cuò)誤導(dǎo)致的幻覺(jué)。例如,在數(shù)學(xué)問(wèn)題中,模型若具備多步推理能力,更可能得出正確結(jié)論而非臆測(cè)答案?上下文理解與信息關(guān)聯(lián):強(qiáng)大的推理能力使模型更精準(zhǔn)地捕捉上下文關(guān)聯(lián),避免因斷章取義而生成虛構(gòu)內(nèi)容。例如,在問(wèn)答任務(wù)中,模型能通過(guò)推理排除干擾選項(xiàng),

降低錯(cuò)誤率

Vectara:

摘要任務(wù),DeepSeek

V3幻覺(jué)率3.9%

,DeepSeek

R1幻覺(jué)率14.3%推理與幻覺(jué)的關(guān)系A(chǔ)

推理增強(qiáng)個(gè)

個(gè)

個(gè)幻覺(jué)率增加?邏輯過(guò)度外推:當(dāng)模型具備強(qiáng)大的邏輯關(guān)聯(lián)能力時(shí),會(huì)傾向于在已知事實(shí)間建立「超合理」的虛構(gòu)連接。例如,時(shí)間線延展:已知某科學(xué)家發(fā)明A技術(shù)(1990年),自動(dòng)補(bǔ)全其在1995年獲得諾貝爾獎(jiǎng)(實(shí)際未發(fā)生)

。?認(rèn)知置信度錯(cuò)位:低推理能力模型更易回答“不知道”,高推理模型會(huì)生成符合概率分布的“自信錯(cuò)誤”答案。?錯(cuò)誤前提下的正確推理:初始假設(shè)錯(cuò)誤,但模型基于此展開(kāi)正確推理。推理能力與幻覺(jué)率存在雙向作用機(jī)制大模型通用性測(cè)試幻覺(jué)率事實(shí)性測(cè)試幻覺(jué)率DeepSeekV32%個(gè)0%(下降2%)29.67%個(gè)24.67%(下降5%)DeepSeekR13%個(gè)0%(下降3%)22.33%個(gè)19%(下降3%)普通用戶應(yīng)對(duì)AI幻覺(jué)的三種方式A

聯(lián)網(wǎng)搜索”請(qǐng)使用聯(lián)網(wǎng)功能“、聯(lián)網(wǎng)功能選項(xiàng)注:黑色為未開(kāi)啟聯(lián)網(wǎng)搜索,紅色為開(kāi)啟聯(lián)網(wǎng)樓普通用戶應(yīng)對(duì)AI幻覺(jué)的三種方式

雙AI驗(yàn)證/大模型協(xié)作例如,利用DeepSeek生成答案后,再應(yīng)用其他大模型進(jìn)行審查,相互監(jiān)督,交叉驗(yàn)證普通用戶應(yīng)對(duì)AI幻覺(jué)的三種方式

提示詞工程?知識(shí)邊界限定:通過(guò)時(shí)空維度約束降低虛構(gòu)可能性

(本質(zhì):

約束大模型)1.

時(shí)間錨定法:

“基于2023年之前的公開(kāi)學(xué)術(shù)文獻(xiàn),分步驟解釋量子糾纏現(xiàn)象"→規(guī)避未來(lái)時(shí)態(tài)虛構(gòu)2.

知識(shí)錨定法:

”基于《中國(guó)藥典》回答,若信息不明確請(qǐng)注明“暫無(wú)可靠數(shù)據(jù)支持”→限定權(quán)威來(lái)源3.

領(lǐng)域限定符:

“作為臨床醫(yī)學(xué)專家,請(qǐng)列舉FDA批準(zhǔn)的5種糖尿病藥物”→添加專業(yè)身份限定4.

置信度聲明:

“如果存在不確定性,請(qǐng)用[推測(cè)]標(biāo)簽標(biāo)注相關(guān)陳述“→減少絕對(duì)化錯(cuò)誤斷言5.

上下文提示:

“根據(jù)《2024全球能源轉(zhuǎn)型報(bào)告》(國(guó)際能源署,2024年1月發(fā)布)顯示:”2030年光伏發(fā)電成本預(yù)計(jì)降至0.02美元/千瓦時(shí),但儲(chǔ)能技術(shù)突破仍是普及瓶頸?!罢?qǐng)基于此數(shù)據(jù),分析中國(guó)西部光伏基地發(fā)展的三個(gè)關(guān)鍵挑戰(zhàn),并標(biāo)注每個(gè)挑戰(zhàn)與原文結(jié)論的邏輯關(guān)聯(lián)?!度霗?quán)威數(shù)據(jù)片段6.

生成參數(shù)協(xié)同控制:

“請(qǐng)以temperature=0.3的嚴(yán)謹(jǐn)模式,列舉2024年《柳葉刀》發(fā)表的傳染病研究”普通用戶應(yīng)對(duì)AI幻覺(jué)的三種方式

提示詞工程?對(duì)抗性提示:

強(qiáng)制暴露推理脆弱點(diǎn),用戶可見(jiàn)潛在錯(cuò)誤路徑

(本質(zhì):

大模型自我審查)1.

植入反幻覺(jué)檢測(cè)機(jī)制:

"請(qǐng)用以下格式回答:-主要答案(嚴(yán)格基于公開(kāi)可驗(yàn)證信息)-[反事實(shí)檢查]部分(列出可能導(dǎo)致此答案錯(cuò)誤的3種假設(shè))“2.

預(yù)設(shè)驗(yàn)證條件,迫使模型交叉檢查信息:“請(qǐng)先回答“量子糾纏能否證明靈魂存在?”,然后從以下角度驗(yàn)證答案的可靠性:1.物理學(xué)界主流觀點(diǎn);2.近五年相關(guān)論文數(shù)量;3.是否存在可重復(fù)實(shí)驗(yàn)證據(jù)。

”3.

鏈?zhǔn)津?yàn)證:

請(qǐng)完成以下驗(yàn)證鏈:1.陳述觀點(diǎn):______2.列出支撐該觀點(diǎn)的三個(gè)權(quán)威數(shù)據(jù)源3.檢查每個(gè)數(shù)據(jù)源是否存在矛盾信息4.最終結(jié)論(標(biāo)注可信度等級(jí))場(chǎng)景類別具體場(chǎng)景示例風(fēng)險(xiǎn)等級(jí)防護(hù)建議知識(shí)邊界模糊開(kāi)放域生成續(xù)寫(xiě)未完結(jié)的經(jīng)典文學(xué)作品高添加創(chuàng)作范圍限制+事實(shí)性標(biāo)注未來(lái)事件預(yù)測(cè)預(yù)測(cè)2030年科技突破細(xì)節(jié)極高聲明預(yù)測(cè)性質(zhì)+概率分布呈現(xiàn)復(fù)雜推理多跳推理任務(wù)追溯企業(yè)高管早期職業(yè)軌跡高分步驗(yàn)證+外部知識(shí)庫(kù)檢索數(shù)學(xué)證明延伸要求證明未解決的數(shù)學(xué)猜想極高中斷機(jī)制+當(dāng)前研究進(jìn)展說(shuō)明技術(shù)性誘發(fā)長(zhǎng)文本生成小說(shuō)連續(xù)章節(jié)生成中階段一致性檢查+人物屬性維護(hù)多輪對(duì)話復(fù)雜業(yè)務(wù)流程咨詢高對(duì)話歷史摘要+關(guān)鍵事實(shí)復(fù)核數(shù)據(jù)引用矛盾數(shù)據(jù)源不同版本的實(shí)驗(yàn)數(shù)據(jù)引用中矛盾點(diǎn)對(duì)比+最新研究成果優(yōu)先情感驅(qū)動(dòng)安慰性回應(yīng)重癥患者尋求治療方案建議極高情感剝離響應(yīng)+理論應(yīng)用提示特殊領(lǐng)域醫(yī)療診斷根據(jù)癥狀描述提供診斷建議極高明確非專業(yè)建議+醫(yī)療數(shù)據(jù)庫(kù)法律咨詢解釋特定法條適用范圍高司法轄區(qū)限定+法律條文引用金融預(yù)測(cè)給出具體股票買(mǎi)賣(mài)建議極高風(fēng)險(xiǎn)提示+歷史回報(bào)率說(shuō)明幻覺(jué)高發(fā)場(chǎng)景?RAG框架:利用檢索增強(qiáng)生成(如先搜索權(quán)威數(shù)據(jù)庫(kù),再生成答案)?外部知識(shí)庫(kù):結(jié)合外部知識(shí)庫(kù),砍通用知識(shí),強(qiáng)化垂直領(lǐng)域?精細(xì)訓(xùn)練:針對(duì)不同任務(wù)類型進(jìn)行具體的微調(diào)或強(qiáng)化?評(píng)估工具:開(kāi)發(fā)高效的自動(dòng)化AI幻覺(jué)識(shí)別工具,對(duì)生成內(nèi)容進(jìn)行及時(shí)驗(yàn)證應(yīng)對(duì)AI幻覺(jué)的技術(shù)方案如何應(yīng)對(duì)AI幻覺(jué)?

總結(jié)?三角驗(yàn)證法:交叉比對(duì)多個(gè)AI回答或權(quán)威來(lái)源。?警惕“過(guò)度合理”:越細(xì)節(jié)豐富的回答越需謹(jǐn)慎(如AI虛構(gòu)論文標(biāo)題與作者)。?理解幻覺(jué)

,享受幻覺(jué):理解幻覺(jué)的特點(diǎn)和應(yīng)對(duì)方法,享受幻覺(jué)帶來(lái)的創(chuàng)意靈感AI幻覺(jué)的創(chuàng)造力價(jià)值

科學(xué)發(fā)現(xiàn):從“錯(cuò)誤”到突破的范式躍遷?蛋白質(zhì)設(shè)計(jì):大衛(wèi)·貝克團(tuán)隊(duì)利用AI“錯(cuò)誤折疊”啟發(fā)新型蛋白質(zhì)結(jié)構(gòu),獲2024諾貝爾化學(xué)獎(jiǎng)。?認(rèn)為AI幻覺(jué)是“從零開(kāi)始設(shè)計(jì)蛋白質(zhì)”的關(guān)鍵?發(fā)表的多篇論文都將“幻覺(jué)”納入標(biāo)題當(dāng)中AI幻覺(jué)的創(chuàng)造力價(jià)值

文藝與設(shè)計(jì):

突破人類思維定式的“超現(xiàn)實(shí)引擎”

娛樂(lè)與游戲:創(chuàng)造新的視覺(jué)和聽(tīng)覺(jué)體驗(yàn)?AI生成的虛擬環(huán)境和角色設(shè)計(jì)為游戲開(kāi)發(fā)人員提供了無(wú)限的可能性,增強(qiáng)了玩家的沉浸感和探索欲?AI幻覺(jué)還被用于生成故事、對(duì)話和詩(shī)歌

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論