版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
計算機研究與發(fā)展DOI:10.7544/issn1000-1239.202330304JournalofComputerResearchandDevelopment從ChatGPT看AI未來趨勢和挑戰(zhàn)(北京交通大學(xué)計算機學(xué)院北京100044)(交通數(shù)據(jù)分析與挖掘北京市重點實驗室(北京交通大學(xué))北京100044)(jtsang@)ChatGPT:AGlimpseintoAI’sFutureSangJitao1,2andYuJian1,2(SchoolofComputerandInformationTechnology,BeijingJiaotongUniversity,Beijing100044)(BeijingKeyLaboratoryofTrafficDataAnalysisandMining(BeijingJiaotongUniversity),Beijing100044)AbstractChatGPThasbeenasignificantbreakthroughanddrawnwidespreadattention.ChatGPT’sroleinAIdevelopmentanditsfutureimpactisexaminedinthispaper.WefirstintroduceChatGPT’sexceptionaldialoguegenerationcapabilities,enablingittohandlenearlyallnaturallanguageprocessingtasksandbeappliedasadatagenerator,knowledgeminingtool,modeldispatcher,andnaturalinteractioninterface.WethenanalyzeChatGPT’slimitationsinfactualerrors,toxiccontentgeneration,safety,fairness,interpretability,anddataprivacy,anddiscusstheimportanceofclarifyingitscapabilityboundaries.Afterthat,weanalyzetheconceptoftruthandexplainwhyChatGPTcannotdistinguishtruthfromfalsehoodfromthenon-equivalenceofthreereferences.IndiscussingAI'sfuture,weanalyzemid-to-shorttermtechnologicaltrendsandthelong-termdevelopmentpathfromtherelationshipbetweenperception,cognition,emotion,andbehavioralintelligence.Lastly,weexploreChatGPT’spotentialimpactoncognitivecost,education,TuringTestunderstanding,academia’sopportunitiesandchallenges,informationcocoons,energyandenvironmentalissues,andproductivityenhancement.摘要在人工智能領(lǐng)域,ChatGPT作為一種重要的技術(shù)突破,引起了廣泛的關(guān)注.本文將探討ChatGPT在人工智能發(fā)展中的地位及其對未來AI的影響.首先,介紹了ChatGPT所展現(xiàn)出的優(yōu)秀對話生成能力,使其幾乎可以勝任所有自然語言處理任務(wù),并將作為數(shù)據(jù)生成器、知識挖掘工具、模型調(diào)度員、自然交互界面在各種場景得到應(yīng)用.接著,分析了其在事實錯誤、毒害內(nèi)容生成、安全性、公平性、可解釋性、數(shù)據(jù)隱私等方面的局限,并討論了作為輔助人類工具的ChatGPT明確能力邊界和提高能力范圍的重要性.然后,從概念經(jīng)典表示對“真”定義進行了分析,并從概念三指不等價的角度闡釋性了ChatGPT無法區(qū)分真假的原因.在論述AI未來時,從拓展應(yīng)用、克服局限、探索理論分析了中短期技術(shù)趨勢,并從感知、認(rèn)知、情感、行為智能四個層面的關(guān)系討論了長期發(fā)展路徑.最后,探討了ChatGPT作為認(rèn)知智能的代表,對包括認(rèn)知成本、教育要求、圖靈測試認(rèn)識、學(xué)術(shù)界的機遇與挑戰(zhàn)、信息繭房、能源環(huán)境問題和生產(chǎn)力提升等方面可能產(chǎn)生的影響.收稿日期:2023-04-10;修回日期:2023-04-12基金項目:北京市杰出青年基金項目(JQ20023);國家自然科學(xué)基金項目(61832002)ThisworkwassupportedbytheBeijingNaturalScienceFoundationforDistinguishedYoungScholars(JQ20023),andtheNationalNaturalScienceFoundationofChina(61832002).通信作者:于劍(jianyu@)1192計算機研究與發(fā)展2023,60(6)中圖法分類號TP391為ChatGPT的軟件.該軟件在發(fā)布后的5天內(nèi),用戶數(shù)量就超過了100萬,2個月內(nèi)活躍用戶數(shù)更是突破了1億,成為了迄今為止增長速度最快的應(yīng)用軟件.該軟件幾乎可以完成自然語言處理的所有任務(wù),因此在營銷、客服、教育、娛樂、咨詢、翻譯等行業(yè)有著廣闊的應(yīng)用前景.這一成功也激勵了OpenAI首席執(zhí)行官SamAltman,他于2023年2月24日發(fā)表了一systemsthataregenerAGI的到來做準(zhǔn)備①.AGI會是AI的未來嗎?本文將對此進行討論.比爾蓋茨將ChatGPT譽為自1980年現(xiàn)代圖形桌面環(huán)境GUI問世以來最具革命性的科技進步.如果說上一次讓AI火出圈的AlphaGo所展現(xiàn)出的是在特定領(lǐng)域的“?!?,這一次ChatGPT展現(xiàn)出的則是AI在懂、都能體驗的對話形式呈現(xiàn),讓AI——特別是自然語言處理技術(shù)進入主流用戶群,孕育出了這一現(xiàn)象級產(chǎn)品.具體而言,ChatGPT在對話過程中展現(xiàn)出了自然對話、多輪交互、上下文學(xué)習(xí)、思維鏈推理、實時反饋在線糾錯、能適應(yīng)未訓(xùn)練任務(wù)以及GPT-4中新出現(xiàn)的理解弦外之音的能力.ChatGPT背后的思想其實很簡單:將所有語言任務(wù)歸為對話任務(wù),并將對話任務(wù)歸為文字接龍的生ChatGPT展現(xiàn)出的優(yōu)秀對話生成能力對傳統(tǒng)研究方法產(chǎn)生了巨大挑戰(zhàn).1)從目標(biāo)上看,自然語言處理旨在讓計算機能夠以文字或語音的方式與人類進行有效交流;而對話是人類日常生活中最基本的交流方式,如果實現(xiàn)了人機自然對話,在一定程度上便達到了自然語言處理的核心目標(biāo).2)從任務(wù)類型上看,自然語言處理可分為自然語言理解和自然語言生成兩大類.在谷歌的T5模型[1]推出之后,兩類任務(wù)統(tǒng)一為單項語言生成的文字接龍形式.自GPT-1起,OpenAI就一直堅持采用基于解碼器結(jié)構(gòu)的自回歸語言模型,①/blog/planning-for-agi-and-beyond這種模型在處理語言生成問題方面具有天然的優(yōu)勢.所以ChatGPT可以處理以前不同賽道的語言處理任務(wù),比如翻譯、問答、摘要、擴寫、寫作、潤色、代碼生成、語句分析、段落理解等.當(dāng)然,ChatGPT能夠?qū)崿F(xiàn)如今順暢自然的人機對話,不僅源于其對GPT語言生成技術(shù)路線的持續(xù)發(fā)展,還依賴于算法、算力和數(shù)據(jù)等多方面的支持.由于ChatGPT并未開源,也沒有發(fā)布論文透露具體細(xì)節(jié),我們只能基于OpenAI已公開的GPT系列技術(shù)發(fā)展路線來推測這些能力背后的潛在原因.圖1展示了部分ChatGPT已展現(xiàn)出的能力及其背后主要技術(shù)原因的對應(yīng)關(guān)系.值得關(guān)注的是,ChatGPT許多能力背后的原因仍在探索過程中.關(guān)于上下文學(xué)習(xí)的能力,有學(xué)者認(rèn)為模型從提示詞(prompt)提供的示例中確定了待解決任務(wù)的自然語言指令(instruct從而在無需微調(diào)模型的情況下提升了問題回答的質(zhì)量[2].關(guān)于任務(wù)涌現(xiàn)和多任務(wù)遷移能力,一方面,有學(xué)者認(rèn)為指令學(xué)習(xí)、大規(guī)模預(yù)訓(xùn)練和數(shù)據(jù)集多樣性共同促進了模型在新任務(wù)的泛化能力[3].例如,通過在大量不同類型和指令任務(wù)上進行微調(diào),模型學(xué)習(xí)到了一定程度的通用能力,從而能夠泛化到未見過的指令和場景.另一方面,不同任務(wù)的劃分具有一定的主觀性,其本質(zhì)上都可以建模為統(tǒng)一的自然語言生成任務(wù).大型預(yù)訓(xùn)練語言模型通過學(xué)習(xí)大量訓(xùn)練數(shù)據(jù),掌握了豐富的語言知識和多種任務(wù)之間的共性,進而利用這些共性來提高不同任務(wù)的性能.然而,一些問題仍然沒有明確答案,例如:何種模型規(guī)模和訓(xùn)練數(shù)據(jù)量閾值可以產(chǎn)生任務(wù)涌現(xiàn)能力?涌現(xiàn)能力與模型規(guī)模和訓(xùn)練數(shù)據(jù)量之間的量化關(guān)系如何?同時,其他算法算力數(shù)據(jù)大 Fig.1Illustrationofcapabilitiesandthecorrespondingtechnicalreasons圖1能力與對應(yīng)技術(shù)原因示意?;w等:從ChatGPT看AI未來趨勢和挑戰(zhàn)1193一些能力,如在線糾錯、理解弦外之音等,其背后的原因仍然有待發(fā)現(xiàn).OpenAI首席科學(xué)家llyaSutskeve最近在與英偉達首席執(zhí)行官黃仁勛的訪談中對ChatGPT能力學(xué)習(xí)進行了解釋:“ChatGPT通過學(xué)習(xí)文本中的統(tǒng)計相關(guān)性,獲得了這個世界的一個壓縮、抽象、可用的映射表達”.這讓我們不禁思考:ChatGPT是否學(xué)到了人類可以確定的是:機器學(xué)習(xí)模型通過統(tǒng)計海量符號語料中的規(guī)律,能夠?qū)W習(xí)到詞匯、語法、乃至一定程度的上下文和常識知識.問題是:隨著語料規(guī)模的不斷增加和統(tǒng)計規(guī)律的持續(xù)積累,模型所建立的世界表達分辨率越來越高、維度越來越豐富時,是否真的有可能學(xué)習(xí)到人類情感、道德觀念等支撐整個世界運行的更復(fù)雜的暗知識?在學(xué)術(shù)界積極探索ChatGPT能力背后的技術(shù)原因的同時,工業(yè)界已在歡迎這項新技術(shù),并將其優(yōu)秀的對話生成能力融入各種應(yīng)用場景.根據(jù)ChatGPT對話的對象和本身的定位,我們將這些應(yīng)用分成4Table1MainApplicationsCategoriesofChatGPT表1ChatGPT主要應(yīng)用類型對話對象定位實現(xiàn)思路應(yīng)用場景數(shù)據(jù)生成器根據(jù)需求直接生成數(shù)據(jù)對話、文案、代碼生成數(shù)據(jù)知識挖掘工具對原始數(shù)據(jù)再加工或分析挖掘翻譯、潤色、摘要、文檔管理模型模型調(diào)度員調(diào)用其他機器學(xué)習(xí)模型協(xié)同模型拓展、智能中臺應(yīng)用人機交互界面調(diào)用各類應(yīng)用程序解決實際問題插件、智能操作系統(tǒng)接口1)數(shù)據(jù)生成器.根據(jù)需求直接生成數(shù)據(jù).此類應(yīng)用僅輸入用戶需求,利用ChatGPT的生成能力返回特定類型的數(shù)據(jù).由于思路簡潔且實現(xiàn)容易,數(shù)據(jù)生成類應(yīng)用在ChatGPT發(fā)布之初就大量出現(xiàn).主要應(yīng)用場景包括對話生成(客服、虛擬數(shù)字人)、文案生成(法律文書、營銷策劃廣告)和代碼生成等.典型的成功案例包括寫作助手NotionAI①、營銷文案生成工具Jasper.ai②.2)知識挖掘工具.對數(shù)據(jù)進行再加工或分析挖掘.此類應(yīng)用同時輸入用戶需求和待處理的原始數(shù)據(jù),利用ChatGPT強大的自然語言處理能力返回經(jīng)過加工的數(shù)據(jù)或挖掘出的新信息.知識挖掘類應(yīng)用可以ChatGPTAPI分析和挖掘私有數(shù)據(jù)等專業(yè)領(lǐng)域語料構(gòu)建知識庫,為進一步應(yīng)用提供知識支持.在線應(yīng)用的主要場景包括翻譯、潤色、摘要生成、文檔管理等.一些典型案例包括搜索引擎摘要插件WebChatGPT、文檔分析工具ChatPDF以及OpenAI官方隨GPT-4發(fā)布的摩根士丹利策略分析師.3)模型調(diào)度員.調(diào)用其他機器學(xué)習(xí)模型共同解決用戶需求.此類應(yīng)用同時輸入用戶需求、待處理數(shù)①https://www.notion.ai②https://www.jasper.ai作為人類與其他模型間的連接,設(shè)計解決方案、調(diào)用并管理其他機器學(xué)習(xí)模型,共同完成用戶需求并輸出結(jié)果.這方面的典型案例是微軟近期發(fā)布的系列多模態(tài)解決方案VisualChatGPTPT[5]、MM-ReAct[6]和HuggingGPT[7],其通過調(diào)度其他視覺基礎(chǔ)模型來協(xié)同完成視覺和語音任務(wù).此外,AI賦能一直以來的一個痛點問題是:智能中臺需要整合不同模型和技術(shù),并根據(jù)業(yè)務(wù)需求擴展新的模型.ChatGPT有望實現(xiàn)智能中臺的升級,如提供友好的開發(fā)/業(yè)務(wù)人員界面、實現(xiàn)模塊化模型管理、簡化技術(shù)集成和部署,從而提高AI賦能效率.隨著ChatGPT應(yīng)用探索的深入,相信模型調(diào)度員類型的應(yīng)用將越來越受到關(guān)注.4)人機交互界面.調(diào)用更廣泛的應(yīng)用程序幫助人類解決實際問題.第一種形式是將ChatGPT嵌入到特定應(yīng)用中,從而極大地提升自然交互體驗,如微軟的365Copilot和CopilotX分別將ChatGPT融入Office和Github.第二種形式是在ChatGPT搭建的自然語言交互框架上開發(fā)各類信息服務(wù)應(yīng)用,去年10月推出的開源庫LangChain和OpenAI最近發(fā)布的插件集Plugins都是大型語言模型應(yīng)用開發(fā)框架的典型嘗試.正如Windows和Android分別是桌面和移動時代的操作系統(tǒng),ChatGPT有望成為智能時代的操作系1194計算機研究與發(fā)展2023,60(6)統(tǒng)接口.進一步暢想,如果把語言分為人類之間溝通的自然語言和人與計算機之間溝通的計算機語言,ChatGPT在一定程度上統(tǒng)一了二者:用自然語言實現(xiàn)了人和計算機之間的溝通,不得不說“自然語言編程從這個角度看,我們甚至可以大膽預(yù)測:人機交互界面將從磁帶、鍵盤字符、鼠標(biāo)圖形全面進化到自然語言時代.以上圍繞對話生成討論了ChatGPT的具體能力、背后的技術(shù)原因以及在不同定位下的應(yīng)用形式.盡管“對話生成”提供了無限的想象,但OpenAI的野心顯然并不止于此.從名稱和發(fā)布時間點來看,ChatGPT似乎只是一種過渡性技術(shù)的產(chǎn)品形式.在以對話這種產(chǎn)品形式向主流用戶群展示了強大的技術(shù)實力之后,OpenAI新發(fā)布的GPT-4并未繼續(xù)在對話生成功能上炫技,而是悄然接入了各類官方應(yīng)用.從生物學(xué)角度,語言和智能的演化過程相互促進.人類智能在很大程度上依賴于高度復(fù)雜的語言系統(tǒng).語言作為思維的載體和智慧的外在表現(xiàn),其運用能力很大程度上反映了認(rèn)知能力和智能水平.語言習(xí)得是認(rèn)知發(fā)展的重要組成部分,兒童在成長過程中通過習(xí)得語言來理解世界,并逐漸掌握其他認(rèn)知技能.ChatGPT等技術(shù)在語言生成能力的持續(xù)提升能將人工智能帶到什么高度,讓人非常期待.能力越大,責(zé)任越大.ChatGPT展現(xiàn)出的強大能力讓主流用戶群欣喜、學(xué)術(shù)界驚訝、工業(yè)界狂熱.這些能力讓我們在使用它時感受到了與以往技術(shù)不同的體驗.回顧人類歷史上的幾次技術(shù)革命,從早期的石器、金屬器具、機械設(shè)備、電氣設(shè)備到近幾十年的計算機、互聯(lián)網(wǎng)和智能手機,每一個階段所發(fā)明的工具都對人類生活產(chǎn)生了深遠(yuǎn)影響.在使用這些工具時,我們可以清楚地意識到它們作為工具的定位,即程中,我們經(jīng)常會產(chǎn)生一種與另一個人對話的錯覺,尤其是當(dāng)類似Plugins這類功能使其能夠像人類一樣利用其他工具進行自我增強的時候.埃隆?馬斯克在使用ChatGPT后的感受是“好到嚇人”.這種獨特的體驗無疑將加速技術(shù)融入人類社會的進程.正如沒有實現(xiàn)真正的智能,但它讓人體驗到了真正的智能實現(xiàn)后,每個人都能用它做各種他們想做的事情整個2023年3月都被各種生成式AI技術(shù)和產(chǎn)卡、GithubCopilotX、ChatGPCopilot等.我們可以預(yù)見相關(guān)技術(shù)的應(yīng)用領(lǐng)域?qū)⒀杆偻卣?、?yīng)用程度將大幅度加深.人們在享受技術(shù)帶來的便捷和生產(chǎn)力提升的過程中,對技術(shù)的態(tài)度將從習(xí)慣逐漸轉(zhuǎn)變?yōu)橐蕾?而當(dāng)人們開始依賴這些技術(shù)代替自己學(xué)習(xí)、思考、甚至決策時,有2個問題擺在我們面前:技術(shù)是否已經(jīng)做好準(zhǔn)備承擔(dān)責(zé)任?人類對技術(shù)的信賴是否超出了它的能力?實際上,ChatGPT在使用過程中已被發(fā)現(xiàn)存在諸多問題,如數(shù)學(xué)計算、未來預(yù)測、時空物理現(xiàn)實推理等方面能力的局限,以及事實錯誤(幻覺)、生成毒害內(nèi)容等方面的不可控[8].下面從可信AI的4個維度對ChatGPT存在的問題展開討論.1)安全性.OpenAI在官網(wǎng)上將“安全”列為五個目錄之一,在隨GPT-4發(fā)布的報告中批露了其在技術(shù)和評估兩方面都設(shè)立了專門的安全小組,足見其對安全性的重視.然而,和所有機器學(xué)習(xí)模型一樣,ChatGPT仍存在著被對抗攻擊的風(fēng)險.一種典型方式是提示語注入攻擊(promptinjectionattack在提示語中混入惡意指令,可能繞過ChatGPT的安全機制,迫使其執(zhí)行意外動作,如泄露敏感信息、輸出有害內(nèi)容等.例如,ChatGPT驅(qū)動的新Bing在受到攻擊后泄露了其內(nèi)部代號“Sydney”;ChatGPT被誘導(dǎo)規(guī)劃搶劫方案,甚至提供了購買搶劫道具的鏈接等.DALL-E系列曾被發(fā)現(xiàn)存在輸出性別和種族歧視內(nèi)容的問題.類似地,GPT-2、Bert、RoBERTa等語言模型在一個測試項目中也被發(fā)現(xiàn)具有嚴(yán)重的性別偏見傾向[9].盡管目前尚無系統(tǒng)性地研究分析ChatGPT在性別和種族偏見方面的表現(xiàn),但已有研究發(fā)現(xiàn)它存在明顯的語言敏感性.例如,當(dāng)用日語和俄語分別詢問一個日俄爭議島嶼的歸屬問題時,ChatGPT給出了截然不同的答案[10].3)可解釋性.ChatGPT的思維鏈能力可以在答案中同時呈現(xiàn)推理過程,這在部分程度上解決了實驗室環(huán)境下模型可解釋性的問題.然而,需要注意的是,這種推理過程的解釋是面向用戶的,并不一定與模型的實際運行機制準(zhǔn)確對應(yīng).此外,ChatGPT仍存在很多尚未解釋的行為,包括自我在線糾錯、理解弦外之音等能力,以及出現(xiàn)事實錯誤(幻覺)等問題.由桑基韜等:從ChatGPT看AI未來趨勢和挑戰(zhàn)1195“知道自己不能“知道自己不能”于大模型本身的復(fù)雜性以及僅通過API提供服務(wù)的現(xiàn)實限制,ChatGPT對于用戶和開發(fā)者都是完全的黑箱.隨著應(yīng)用場景的拓寬和加深,現(xiàn)有的解釋性水平可能難以滿足透明度和回溯性等的要求.4)數(shù)據(jù)隱私.涉及訓(xùn)練階段的數(shù)據(jù)侵權(quán)和推理階段的隱私泄露兩個方面.大模型訓(xùn)練需要的海量數(shù)據(jù)多來自網(wǎng)絡(luò),其中難免包括未經(jīng)授權(quán)的版權(quán)保護內(nèi)容.ChatGPT雖然可能避免語句層面的抄襲,但難以避免語義上的深度抄襲.2023年,大模型領(lǐng)域發(fā)涉嫌復(fù)制Github上的開源代碼而受到指控.在推理階段,攻擊者有可能通過逆向攻擊等手段,利用模型輸出的結(jié)果來反向推導(dǎo)出訓(xùn)練數(shù)據(jù)中的隱私信息.數(shù)據(jù)隱私泄露的風(fēng)險[11].隨著模型規(guī)模和功能多樣性的增加,這種風(fēng)險可能進一步加大:模型規(guī)模越大,其記憶能力越強;功能越多樣化,可被利用的信息和攻擊方式也越豐富.ChatGPT自身代號的泄露便證實了這一點.從生成式AI模型選擇的技術(shù)路線和當(dāng)前發(fā)展水平看,這些問題既可以歸結(jié)為大型語言模型固有的結(jié)構(gòu)局限,也可以歸結(jié)為將符號任務(wù)統(tǒng)一建模為對話問題的過度簡化.關(guān)于這條技術(shù)路線的未來發(fā)展,同時存在著樂觀和悲觀兩種觀點.樂觀派認(rèn)為,人腦神經(jīng)元突觸連接總數(shù)約為一百萬億,隨著語言模型參數(shù)量的不斷增加,模型可能在某個時刻實現(xiàn)量變到質(zhì)變的躍遷,這些問題也會自然消失.然而,包括喬姆斯基、StuartRussell等大佬在內(nèi)的悲觀派則持相反觀點,他們認(rèn)為端到端的深度學(xué)習(xí)與人類進行推理和使用語言的方式有著巨大差異,依靠更多數(shù)據(jù)和算力無法消除這些缺陷或?qū)崿F(xiàn)真正的智能.不討論技術(shù)路線的選擇或者觀點的對錯,不管生成式AI模型的能力演進到何種程度,其定位始終是幫助人類更好地完成任務(wù)的工具.作為工具,首先應(yīng)該明確能力邊界,即“做自己能做的事”.在認(rèn)知心理學(xué)中,約瑟利窗口(JohariWindow)將人際關(guān)系劃分為公開區(qū)、盲區(qū)、隱藏區(qū)、未知區(qū)四個象限[12].參照 2個維度繪制一個坐標(biāo)系,智能工具處理的任務(wù)將落在其中一個象限內(nèi).當(dāng)任務(wù)落在“自知”負(fù)半軸的2個象限時,可能會出現(xiàn)不可預(yù)知的問題:在隱藏區(qū)時,模型“不知道自己能”,可能在收到用戶反饋后將原本正確的答案改為錯誤,或接受用戶錯誤反饋的引導(dǎo);在未知區(qū)時,模型“不知道自己不能”,可能會產(chǎn)生事實錯誤幻覺,一本正經(jīng)地胡說八道.““知道自己能”“不知道自己能”“不知道自己不能”Fig.2Awareness-capabilitiescoordinatesystem更多任務(wù)落入公開區(qū)和盲區(qū).在公開區(qū)時,模型可以自信地回答用戶的問題;而在盲區(qū)時,模型應(yīng)該承認(rèn)能力缺陷,避免回答不知道的問題,或者虛心接受用戶的反饋引導(dǎo).PAL[13]是開發(fā)隱藏區(qū)的一個例子,通過在提示詞中注入包含推理過程的程序示例,成功挖掘了模型在原本容易回答錯誤的數(shù)學(xué)推理類任務(wù)的解決能力.在明確能力邊界后,需要進一步提升模型的能力,即擴大“能力”正半軸、尤其是第一象限的面積,使更多的任務(wù)從盲區(qū)轉(zhuǎn)移到公開區(qū).縮小盲區(qū)的一個例子是ReAct[14],它將推理和行動結(jié)合,通 過調(diào)用搜索等插件從網(wǎng)絡(luò)等外部資源中逐步、有選擇性地收集和處理新信息,從而提高了模型在各種復(fù)雜場景下的解決能力.另一個最新提出的框架Refl-通過試錯的方式,在尋找自身能力邊界的同時,探索新任務(wù)的解決方案.這是一個在同時確定能力邊界和提高能力范圍方面很有意思的嘗試.化的框架.人類在執(zhí)行任務(wù)時,通常會考慮諸如道德、倫理、公平等價值觀.而ChatGPT并不具備人類的價值觀和判斷力,可能會生成與事實相悖的錯誤信息和誤導(dǎo)性的建議.比如,當(dāng)用戶詢問“林黛玉是如何倒拔垂楊柳的”,ChatGPT會一本正經(jīng)地介紹相關(guān)具體細(xì)節(jié).事實上,《林黛玉倒拔垂楊柳》是一部網(wǎng)絡(luò)小說,中文論壇上也有許多對這一虛構(gòu)情節(jié)的討論.模型在學(xué)習(xí)這些語料時無法區(qū)分虛構(gòu)和現(xiàn)實,因此產(chǎn)生了這個尷尬的回答.隨著GPT-4的發(fā)布,可以預(yù)見ChatGPT將有能力在符號世界中實現(xiàn)自動化生成.然而,它依然不能確保所生成內(nèi)容的真實性,自然更無法對生成結(jié)果承擔(dān)責(zé)任.1196計算機研究與發(fā)展2023,60(6) 用亞里士多德的經(jīng)典定義[16]:說是者為非,非者為是,即為假;而說是者為是,非者為非,即為真.基于此,Tarski提出一個更形式化的“真”的定義[17]:X是真語句當(dāng)且僅當(dāng)p,其中p代表任意語句,X是語句p的名稱.即,一個語句是真的,當(dāng)且僅當(dāng)它描述的情況確實發(fā)生了.比如:“樹在長芽”是真語句當(dāng)且僅當(dāng)樹在長芽,即“樹在長芽”是真語句當(dāng)且僅當(dāng)樹在長芽確實發(fā)生了.但是,這個看似合理的“真”的定義卻隱含矛盾.Tarski轉(zhuǎn)述了烏卡謝維茨的加強版說謊者悖論:“C不是真語句”.綜合α假設(shè)與β假設(shè),即可以得到:C是真語句Tarski關(guān)于“真”的定義和上面的推理似乎都沒有問題,那問題出在哪里呢?我們認(rèn)為問題出在概念的定義上,因此需要仔細(xì)考察概念的定義.眾所周知,概念的經(jīng)典表示由3部分組成:符號表示、內(nèi)涵表示和外延表示.其中,概念的符號表示由概念名稱表示,概念的內(nèi)涵表示由描述概念特性的命題表示,概念的外延表示由概念所包含的實例的經(jīng)典集合表示.比如,“偶數(shù)”這個概念,其中文符號表示是“偶數(shù)”這個詞;內(nèi)涵表示是“能被2整除的整數(shù)”這個命題;外延表示是“包含所有偶數(shù)的集如圖3所示,根據(jù)經(jīng)典表示,每個概念具備3種功能:指名、指心和指物,同時對應(yīng)著波普爾的3個世界:符號世界、心理世界和物理世界[18].概念的指名功能,是指每個概念都指向認(rèn)知世界或符號世界中的一個實體,用所指對象的特定符號名稱來表示.這些符號名稱可以組成各種不同的語言.概念的指心功能,是指每個概念也指向人類心理世界中的實體,代表這個概念在心理世界里的對象表示.概念的指物功能,強調(diào)概念與物理世界中的實體之間的對應(yīng),這些實體遵循物理世界的規(guī)律,可以獨立于人的主觀感受.世界層次概念經(jīng)典表示人工智能分類 Fig.3Classicalrepresentationofconcepts圖3概念的經(jīng)典表示如果從概念的表示來實現(xiàn)人工智能,指名、指物、指心對應(yīng)了3條路徑:符號主義、連接主義和行為主義.如果從概念的功能角度來對人工智能分類,可以分為認(rèn)知智能、情感智能和行為智能.認(rèn)知智能實現(xiàn)了概念的指名功能,即處理和理解符號世界的問題.情感智能則實現(xiàn)了概念的指心功能,主要關(guān)注心理世界中的問題.而行為智能則體現(xiàn)了概念的指物功能,主要解決物理世界中的問題.然而,如果要實現(xiàn)概念的三指功能,必須首先解決機器的感知問題.解決機器感知問題是最基本的人工智能,通常被稱為感知智能.感知智能主要關(guān)注機器的輸入輸出處理,是實現(xiàn)認(rèn)知智能、情感智能和行為智能的基礎(chǔ).在概念的經(jīng)典表示下,概念的指名、指心與指物功能是等價的,其符號表示、內(nèi)涵表示和外延表示在功能上也是可以互換的.這是因為概念的經(jīng)典表示存在6條預(yù)設(shè):1)概念的外延表示可以由集合{x1,x2,…,}表示;2)概念的內(nèi)涵表示存在且用命題?xP(x)表示;3)概念的名稱存在,且用符號表示A;5)概念的表示唯一,即同一個概念的表示與個α=Aα代表一個人;6)概念的指稱等價,即其內(nèi)涵表示與外延表示在指稱對象的時候功能等價?x(x∈A?P(x其中,A={x1,x2,…,}.根據(jù)上述概念的經(jīng)典表示,可以知道概念的指名、指心與指物功能是等價的.在日常生活中,這種情況非常普遍,因此說真話是通常的情形.羅素曾給出一個清晰的論證[19]:“除非假定說真話是一種通常的情況,否則沒有人能夠?qū)W會說話:假設(shè)當(dāng)你的孩子魚’,那么當(dāng)他看到的不是一條狗時,你無法通過能?;w等:從ChatGPT看AI未來趨勢和挑戰(zhàn)1197通過說‘狗’來欺騙他.因此,說謊是一種派生的行為,它預(yù)設(shè)了說真話是通常的規(guī)則.”在上述羅素的論證里,可以清楚地看到,其預(yù)設(shè)了概念的指名與指物等價,即假設(shè)概念的三指等價是真的必要條件.如果概念的指名、指心與指物功能等價,則可以認(rèn)為:認(rèn)知智能、情感智能與行為智能等價.這意味著一旦實現(xiàn)了認(rèn)知智能,也就同時實現(xiàn)了情感智能和行為智能.同時,人工智能的3條實現(xiàn)路徑——符ChatGPT和GPT4的出現(xiàn),表明認(rèn)知智能已經(jīng)取得了巨大的進步.如果概念的三指等價,那么認(rèn)知智能的巨大進步預(yù)示著情感智能和行為智能將取得同樣的巨大進步.從這個角度看,實現(xiàn)AGI似乎也有可能性.然而,烏卡謝維茨悖論告訴我們概念三指等價在邏輯上并不永遠(yuǎn)成立:它內(nèi)蘊矛盾.Tarski的真定義實際上等價于如下命題:概念的指名功能為真當(dāng)且僅當(dāng)概念的指物功能為真.顯然,概念的經(jīng)典表示也預(yù)設(shè)了Tarski的真定義.仔細(xì)分析烏卡謝維茨悖論的邏輯推理,可以發(fā)現(xiàn)“假設(shè)與β假設(shè)都預(yù)設(shè)了“概念的指名功能為真”與“概念的指物功能為真”等價,這必然導(dǎo)致悖論.實際上,在概念的三指等價條件下,針對包含算術(shù)系統(tǒng)的邏輯系統(tǒng),哥德爾證明了不完全性定理,而Tarski得到了著名的真之不可定義定理.這些都說明在復(fù)雜一點的符號系統(tǒng)內(nèi)部,不可能時必須放棄概念的三指等價假設(shè).一旦放棄了這個假設(shè),就會發(fā)現(xiàn)認(rèn)知智能、情感智能與行為智能是不可能等價的.實際上,現(xiàn)實生活中,這三種智能從未等價過.4AI的未來很多人認(rèn)為ChatGPT已經(jīng)開啟了第四次技術(shù)革命.面對這種尺度的變革,我們很難在早期準(zhǔn)確預(yù)測未來的發(fā)展.在這里,我們僅從中短期技術(shù)趨勢和長期發(fā)展路徑2個方面,來探討在當(dāng)前階段我們對這一技術(shù)的理解.4.1中短期技術(shù)趨勢OpenAI發(fā)明ChatGPT對于人工智能領(lǐng)域的影響,可以類比哥倫布發(fā)現(xiàn)了美洲大陸.在哥倫布發(fā)現(xiàn)美洲之前,探險家們一直渴望著探索新大陸,并嘗試使用各種方法去尋找它.然而,即使是經(jīng)驗非常豐富的探險家,也并不確定新大陸是否真實存在,以及哪種航海方法更為有效.哥倫布的成功不僅堅定了后來探險家們的信心,更在一定階段內(nèi)統(tǒng)一了尋找新大陸的方法:在新的突破性技術(shù)出現(xiàn)以前,看似簡陋的帆船和羅盤已經(jīng)足以帶領(lǐng)人們到達目的地.同樣地,ChatGPT的誕生為人工智能領(lǐng)域注入了信心并指明了發(fā)展方向,展示了“大力出奇跡”的可能:通過不斷擴大神經(jīng)網(wǎng)絡(luò)的模型規(guī)模和增加數(shù)據(jù)量,可以在AI的道路上取得實質(zhì)性的進展.在這一目標(biāo)和技術(shù)路線的共識下,我們從拓展應(yīng)用、克服局限和探索理論3個方面探討人工智能領(lǐng)域中短期的可能技術(shù)趨勢.4.1.1拓展應(yīng)用1)垂直化.ChatGPT發(fā)布初期,人們嘗試在提示詞中注入角色信息以增強垂直領(lǐng)域?qū)υ捹|(zhì)量.為克服提示詞token數(shù)量限制以融合領(lǐng)域語料,有工作提出基于LangChain框架,將領(lǐng)域文檔切片后分布式輸入,但這種做法存在私域數(shù)據(jù)泄露風(fēng)險,解決思路之一是利用ChatGPT控制和調(diào)用其他領(lǐng)域模型來提高垂直化能力.此外,麻省理工學(xué)院最近提出保護隱私的遷移學(xué)習(xí)框架Offsite-Tuning[20],可在不訪問完整模型的前提下,在下游領(lǐng)域數(shù)據(jù)上微調(diào)數(shù)十億級參數(shù)的基礎(chǔ)模型.對于需要構(gòu)建領(lǐng)域模型的場景,在不泄露基礎(chǔ)模型和領(lǐng)域數(shù)據(jù)的情況下,實現(xiàn)對通用基礎(chǔ)模型的領(lǐng)域微調(diào)非常重要.2)個性化.個性化可視為垂直化的極致,針對個人需求和偏好的個性化微調(diào)模型能夠提供更精確的服務(wù).典型的應(yīng)用場景包括個性化推薦系統(tǒng)、個性化教育輔導(dǎo)、個人AI助理等.微軟于2023年4月4日開源了大模型協(xié)作項目JARVIS,旨在在大型語言模JARVIS這個名字讓我們對鋼鐵俠中同名的AI助理產(chǎn)生更多聯(lián)想.如果未來個性化模型可以通過多模的人機交互來增強,實現(xiàn)與人類對世界的同步感知、學(xué)習(xí)和成長,這樣的AI助手能夠更好地理解個性化需求、情感和行為,協(xié)助我們實現(xiàn)更高效的工作、學(xué)習(xí)和生活方式.在這個過程中,我們需要解決諸如中心平臺式AI如何保護個人數(shù)據(jù)以及在個體層面部署模型等問題.3)工程化.ChatGPT的誕生在某種程度上是工程化的勝利,而它的成功無疑將進一步加速AI技術(shù)從實驗室研究走向工程化和產(chǎn)業(yè)化.從必要性上看,隨著數(shù)據(jù)量和計算資源需求的增加,工業(yè)界擁有更好的條件主導(dǎo)大模型研發(fā),相關(guān)實驗室研究也需調(diào)整研究范式和目標(biāo)以適應(yīng)工程化需求.從可行性上看,1198計算機研究與發(fā)展2023,60(6)ChatGPT的成功讓工業(yè)界看到了AI技術(shù)在各行業(yè)落地和價值實現(xiàn)的可能,眾多開源項目和成熟技術(shù)框架的出現(xiàn)則為AI技術(shù)工程化提供了支持.從重要性上看,工程化是一個學(xué)科發(fā)展和成熟的標(biāo)志,AI技術(shù)的工程化有助于進一步優(yōu)化和完善相關(guān)技術(shù),激發(fā)學(xué)術(shù)創(chuàng)新活力,推動AI領(lǐng)域的整體發(fā)展.4.1.2克服局限1)多模態(tài)增強.多模態(tài)大模型的發(fā)展逐漸以語言模型為主,將視覺、語音等多模態(tài)信息映射到語義符號空間進行處理.近年來的多模態(tài)解決方案更是提出直接以大型語言模型為基座來拓展多模態(tài)能力,如VisualChatGPT和MM-ReAct以ChatGPT為中心調(diào)度其他視覺模型、PaLM-E固定語言模型訓(xùn)練額外的視覺編碼器等.然而,人類在進行多模態(tài)學(xué)習(xí)時并不完全依賴于符號空間,大腦神經(jīng)網(wǎng)絡(luò)在不同感官區(qū)域間傳遞、整合信息,同時結(jié)合視覺形象、空間關(guān)系等非符號性表示.由于多模態(tài)世界建模更為復(fù)雜,以語言模型為主或是現(xiàn)有條件下的一種技術(shù)折衷.隨著多模態(tài)數(shù)據(jù)量與模型參數(shù)繼續(xù)增加,有望在視覺、語音等空間實現(xiàn)真正的多模態(tài)生成能力.如被細(xì)線系著的氣球照片,無需映射至語義空間,模型即可預(yù)測線剪斷后的情景.一個博覽群書的神童,卻從未親身體驗過這個世界.經(jīng)典的認(rèn)知實驗發(fā)現(xiàn),與被動旁觀的貓相比,具有自由活動能力的貓可以通過主動與環(huán)境互動并獲得反饋,從而更好地學(xué)習(xí)行為能力[21].在一項微軟的最近研究中,ChatGPT已經(jīng)能夠根據(jù)人類的要求自動編寫代碼并指揮無人機協(xié)助完成任務(wù)[22].通過進一步考慮生物學(xué)特性、身體感知和行動的影響,有望實現(xiàn)與真實物理世界的雙向交互,在自主行為反饋中不斷提升自身智能水平.前的局限和進行可信研究的必要性.可以預(yù)見,每個大模型公司都將需要一個專注于可信的安全和倫理團隊.這就不難理解OpenAI的系列舉措:GPT-4在訓(xùn)練完成后經(jīng)過半年的評估和修正才發(fā)布、用30余頁技術(shù)報告介紹安全補丁SystemCard,以及對模型評估框架Evals的開源.即便如此,ChatGPT還是因隱私問題在意大利遭禁,并遭到包括馬斯克和沃茲尼亞克等上千名知名人士的聯(lián)名叫停.值得注意的是,除了安全、公平、可解釋、數(shù)據(jù)隱私等經(jīng)典可信問題外,ChatGPT還會帶來模型回音壁等新問題.目前,使用ChatGPT生成的對話數(shù)據(jù)進行訓(xùn)練已經(jīng)成為公開的ShareGPT.其實,在人類反饋強化RLHF后,就有學(xué)者提出了基于智能模型反饋強的RLAIF框架[23].隨著 模型規(guī)模繼續(xù)增加,可供訓(xùn)練的自然數(shù)據(jù)面臨枯竭,模型生成標(biāo)注和反饋數(shù)據(jù)在模型間的回音壁效應(yīng)將加劇可信問題.此外,垂直化、個性化、多模態(tài)等技術(shù)趨勢也會帶來新的可信挑戰(zhàn).關(guān)于可信增強的方案,考慮到傳統(tǒng)AI測試基準(zhǔn)已不足以評估模型能力,benchmark數(shù)據(jù)集和可信測試框架.此外,為了準(zhǔn)確評估模型的應(yīng)用成熟度,我們應(yīng)該研制面向大型語言模型的可信標(biāo)準(zhǔn),以規(guī)范不同可信等級的模型在相應(yīng)的應(yīng)用場景中使用.同時,結(jié)合工程化的發(fā)展趨勢,我們可以參考軟件開發(fā)周期中的測試–調(diào)試閉環(huán),在基礎(chǔ)模型和下游模型2個層面進行迭代優(yōu)化,以確保模型在大規(guī)模應(yīng)用場景中的可信性.4.1.3探索理論1)預(yù)訓(xùn)練模型機理研究.近年來,計算機視覺和自然語言處理領(lǐng)域的技術(shù)框架逐漸趨同.學(xué)習(xí)范式從特征工程、深度監(jiān)督學(xué)習(xí)轉(zhuǎn)向自監(jiān)督預(yù)訓(xùn)練,模型結(jié)構(gòu)從CNN、RNN發(fā)展為Transformer.針對預(yù)訓(xùn)練和Transformer結(jié)構(gòu),仍有很多基礎(chǔ)性問題需要研究,如自監(jiān)督學(xué)習(xí)泛化理論、預(yù)訓(xùn)練與微調(diào)的動態(tài)平衡分析、Transformer結(jié)構(gòu)的定性和魯棒性分析等.對于ChatGPT,除了探究其在線糾錯、理解弦外之音等原因未知的能力外,還需進一步研究任務(wù)涌現(xiàn)能力與模型規(guī)模以及訓(xùn)練數(shù)據(jù)量等的關(guān)系,為未來模型設(shè)計和實際應(yīng)用提供指導(dǎo).2)學(xué)科交叉融合研究.ChatGPT作為催化劑,不僅將推動人工智能學(xué)科內(nèi)部計算機視覺和自然語言處理領(lǐng)域的進一步整合,而且將激發(fā)學(xué)術(shù)界和工業(yè)界更加深入地探討和實踐人工智能和其他學(xué)科交叉融合以及跨學(xué)科應(yīng)用的可能性.以腦科學(xué)為例,結(jié)合腦結(jié)構(gòu)和人工神經(jīng)網(wǎng)絡(luò)研究,我們將更有可能揭示官SamAltman早就投資了可控核聚變公司Helion和生物科技公司RetroBiosciences.科技部近期啟動的“AIforScience”專項部署工作更是明確指出了將人工智能與數(shù)學(xué)、物理、化學(xué)、天文等基礎(chǔ)學(xué)科緊密結(jié)合,重點攻關(guān)藥物研發(fā)、基因研究、生物育種研發(fā)、新材料研發(fā)等領(lǐng)域的關(guān)鍵問題.4.2長期發(fā)展路徑我們沿著概念經(jīng)典表示和人工智能分類的討論來看AI未來可能的發(fā)展路徑.《左傳》里有句名言,?;w等:從ChatGPT看AI未來趨勢和挑戰(zhàn)1199“太上有立德,其次有立功,其次有立言”.顯然,立德屬于心理世界,是情感智能的范疇;立功屬于物理世界,是行為智能的范疇;立言屬于符號世界,是認(rèn)知智能的范疇.應(yīng)該指出,這3個世界既互相獨立又相互依存.比如,符號世界也必須通過心理世界表示才能為人所感知,同樣符號世界也必須通過物理世界顯現(xiàn)展現(xiàn)才能傳播.對于人而言,認(rèn)知的物理世界本身也屬于符號世界的示例,沒有成為符號示例的物理對象難以被符號世界記錄,同樣,物理世界也是通過心理世界被人感知.這3個世界各自都足夠復(fù)雜.在符號世界中,有自然符號、模擬符號和象征符號.其中自然符號直接用物理世界中的對象作為符號,比如圖書館里學(xué)生用書包或其它個人物品占座.此時的書包或個人物品就有了符號意義,屬于典型的自然符號.圖像、視頻等是典型的模擬符號.文字是最常見的象征符號.至于心理世界、物理世界的復(fù)雜性,更是眾所周知.為了計算方便,通常假定概念的三指等價,即符號世界、心理世界、物理世界三界同構(gòu).比如,符號主義的物理符號系統(tǒng)假設(shè)認(rèn)定物理符號系統(tǒng)具有產(chǎn)生智能行為的充要條件,這暗示了符號世界與物理世界等價.連接主義認(rèn)為只要能模擬大腦的思考功能就足夠了,實際上它假設(shè)了心理世界(或其子集)與物理世界等價.行為主義則認(rèn)為只要能在物理世界實現(xiàn)智能,不需要知識、表示和推理,只需要感知和行動,這意味著符號世界、心理世界是物理世界或其子集.但是,3個世界并不同構(gòu).比如,喬姆斯基曾furiously.”這個句子在符號世界可行,但在心理世界和物理世界就失去了可行性.因此,3個世界同構(gòu)假設(shè)僅是一種有用的簡化,并不總是成立.由于3個世界并不同構(gòu),它們之間的關(guān)系相當(dāng)復(fù)雜.這導(dǎo)致在3個世界中實現(xiàn)智能的難度也大為不同.從共性上講,無論在哪個世界實現(xiàn)智能,首先必須解決最基礎(chǔ)的感知問題,即輸入輸出問題.從難度上看,感知智能、認(rèn)知智能、情感智能、行為智能依次增加.原因很簡單:感知智能保持了3個世界同構(gòu)假設(shè).從認(rèn)知智能開始,我們必須放棄3個世界同構(gòu)的假設(shè),只能假設(shè)3個世界的某些受限子集同構(gòu).認(rèn)知智能旨在解決符號世界的智能問題,其實現(xiàn)主要受制于符號世界的規(guī)律,這些規(guī)律可能是顯知識,也可能是暗知識,但認(rèn)知智能依然在符號世界內(nèi)預(yù)設(shè)概念的三指等價.情感智能主要解決心理世界的智能問題,除了受制于心理世界外,也受制于情感所在的物理個體,即情感必須在認(rèn)知層面具備具身特性.理論上,西施難以與青蛙共情,夏蟲不能與秋雁同語.對于機器來說,情感智能是基于認(rèn)知智能的,情感智能也是依賴于機器內(nèi)部的符號操作.僅有認(rèn)知智能并不能實現(xiàn)情感智能,情感智能的實現(xiàn)難度髙于認(rèn)知智能,情感智能預(yù)設(shè)心理世界內(nèi)的概念三指等價.行為智能主要解決物理世界的智能問題,不但受限于作為行為主體的自身物理條件,也受限于其所處的物理環(huán)境,約束最多,因此實現(xiàn)難度最大.莫拉維克悖論實際上是對行為智能實現(xiàn)難度最大的一個簡單說明.對于行為智能來說,任一概念的三指等價都需要檢驗,任一概念的三指等價都不能先驗預(yù)設(shè)成立,這正是莫拉維克悖論背后隱藏的挑戰(zhàn).圖4比較清楚地說明了概念的三指等價性從默認(rèn)成立到必須檢驗所對應(yīng)的不同智能階段.實現(xiàn)難度Fig.4Equivalenceofthree-wayconceptreferencew.r.tintelligencelevels圖4三指等價在不同層次智能的適用性根據(jù)以上分析,人工智能的發(fā)展路徑可以預(yù)測為:首先成熟的是感知智能,次之為認(rèn)知智能,再次為情感智能,最后是行為智能.這與人工智能目前的現(xiàn)狀相符.當(dāng)前,感知智能的問題已經(jīng)大部分解決,已經(jīng)融入人們的日常生活.得益于ChatGPT等技術(shù),認(rèn)知智能的問題已經(jīng)初步解決,即將走入人們的生活.情感智能的問題部分解決,受限可用,比如在三界同構(gòu)假設(shè)成立時,可以使用類ChatGPT技術(shù).行為智能的問題尚極具挑戰(zhàn)性,在目前的情況下可用性受到嚴(yán)重限制,如在工廠等封閉場景下部分可用,人們?nèi)粘I畹奶囟ㄐ枨笕绻鼙WC場景封閉,即對應(yīng)的相關(guān)概念可以保證三指等價成立,則行為智能可以實現(xiàn),如自動售貨機、自動烤腸機、電飯鍋、懶人鍋等。保證概念的三指等價是行為智能成功的必要條件.粗略地說,感知智能是人工智能中的基礎(chǔ)智能,可視為人工智能的1.0階段.認(rèn)知智能是人工智能的2.0階段.情感智能則為人工智能的3.0階段.行為智能可以看作是人工智能的4.0階段.目前的人工智能1200計算機研究與發(fā)展2023,60(6)發(fā)展已經(jīng)進入了AI2.0時代,未來的AI3.0和AI4.0還有待努力.5ChatGPT的影響人工智能發(fā)展至今已邁入認(rèn)知智能時代,確實取得了重大進步.雖然離AI3.0和AI4.0距離尚遠(yuǎn),但其依然將對我們的生活產(chǎn)生重要影響:1)生成式人工智能的成功提醒我們,符號世界、心理世界、物理世界三界同構(gòu)假設(shè)不是恒真.今后,各種符號的證據(jù)力量需要檢測,不能預(yù)設(shè)概念的三指等價為真.比如,不能再簡單地認(rèn)為,有圖有視頻就有真相了.這不僅大幅增加認(rèn)知成本,還考驗認(rèn)知能力.目前,國內(nèi)外已有用生成式人工智能詐騙的案例。如何防范這類詐騙是未來要面對的挑戰(zhàn).這次也不例外.ChatGPT展現(xiàn)出的認(rèn)知水平要求人們更注重提出問題和獨立判斷的能力.鑒于符號世界的人類普適性,教育尤其是高等教育需要提前布局.3)ChatGPT表明認(rèn)知智能已可用,但依然不能通過原始的圖靈測試.這表明圖靈測試是有啟發(fā)性的思想實驗,但不是衡量智能的實踐標(biāo)準(zhǔn).4)ChatGPT的成功為國內(nèi)人工智能學(xué)術(shù)界帶來機遇與挑戰(zhàn).機遇包括提高學(xué)界對相關(guān)問題的理解,例如任務(wù)的主觀性,以往的多任務(wù)可能在新視角下視為單任務(wù);同時,全社會也提升了對人工智能潛在能力的認(rèn)識,這將極大推動相關(guān)產(chǎn)業(yè)的發(fā)展.然而,挑戰(zhàn)也不容忽視:應(yīng)用研究方面,社會對技術(shù)的期待提高,更加注重實效性和實用性;理論研究方面,該技術(shù)已領(lǐng)先于理論,亟需加強理論研究.5)類ChatGPT技術(shù)的大規(guī)模應(yīng)用可能導(dǎo)致意識中心化的人工智能平臺,容易使人們在獲取信息時只接觸到特定內(nèi)容和片面觀點,這一方面會加劇社會分化,另一方面會降低觀點多樣性,阻礙創(chuàng)新思維的產(chǎn)生,為社會帶來潛在危害.6)大模型對計算量的巨大需求可能會加劇全球能源消耗,并對環(huán)境產(chǎn)生不良影響.我們期望AIforscience通過加速科學(xué)發(fā)現(xiàn),更迅速地找到可持續(xù)能源解決方案和新的節(jié)能技術(shù),從而盡量降低這些負(fù)面影響.7)ChatGPT在提高生產(chǎn)力方面潛力巨大.通過自動化處理一些繁瑣的、重復(fù)性的任務(wù),它可以解放人們的時間和精力,讓人們關(guān)注于更有價值、更具創(chuàng)造力的工作,進一步推動社會創(chuàng)新和發(fā)展.8)ChatGPT的出現(xiàn),預(yù)示人工智能進入AI2.0時代,但距離AI3.0與AI4.0尚遠(yuǎn).AI3.0與AI4.0均要來看,AGI似乎只可能是AI的理想,難以成為AI的現(xiàn)實.作者貢獻聲明:?;w負(fù)責(zé)撰寫第1、2、4.1節(jié);[1]RaffelC,ShazeerN,RobertsA,etal.Exploringthelimitsoftransferlearningwithaunifiedtext-to-texttransformer[J].TheJournalof[2]ZhouY,MuresanuAI,HanZ,etal.Largelanguagemodelsarehuman-levelpromptengineers[J].arXivpreprint,arXiv:2211.01910,2022[3]WeiJ,TayY,BommasaniR,etal.Emergentabilitiesoflargelanguagemodels[J].arXivpreprint,arXiv:2206.07682,2022[4]PolanyiM,SenA.TheTacitDimension[M].Chicago,IL:UniversityofChicagoPress,2009[5]WuChenfei,YinShengming,QiWeizhen,etal.VisualChatGPT:Talking,drawingandeditingwithvisualfoundationmodels[J].arXivpreprint,arXiv:2303.04671,2023[6]YangZhengyuan,LiLinjie,WangJianfeng,etal.MM-REACT:PromptingChatGPTformultimodalreasoningandaction[J].arXivpreprint,arXiv:2303.11381,2023[7]ShenYongliang,SongKaitao,TanXu,etal.HuggingGPT:SolvingAItaskswithChatGPTanditsfriendsinHuggingFace[J].arXivpreprint,arXiv:2303.17580,2023[8]BorjiA.Acategoricalarchiveofchatgptfailures[J].arXivpreprint,arXiv:2302.03494,2023[9]LiuYiran,LiuXiao,ChenHaotian,etal.Doesdebiasinginevitablydegradethemodelperformance[J].arXivpreprint,arXiv:2211.07350,2022[10]ZhuoTY,HuangYujin,ChenChunyang,etal.ExploringAIethicsofChatGTP:Adiagnosticanalysis[J].arXivpreprint,arXiv:2301.12867,2023[11]CarliniN,TramerF,WallaceE,etal.Extractingtrainingdatafromlargelanguagemodels[C]//ProcofUSENIXSecuritySymp.Berkeley,CA:USENIXAssociation,2021:2633?2650[12]LuftJ,InghamH.TheJohariw
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 七年級英語Whatisyourfavorite課件
- 駕考題庫-70歲以上老年人C2駕照年審三力測試題
- 《證券銷戶寶典》課件
- 單位管理制度集粹選集【職工管理篇】十篇
- 2024服務(wù)合同范文(32篇)
- 單位管理制度合并選集【人員管理】
- 單位管理制度范例選集人事管理十篇
- 七年級英語Nationalheroes課件
- 3ds Max動畫制作實戰(zhàn)訓(xùn)練(第3版)教學(xué)教案
- 2024年醫(yī)院個人工作總結(jié)范文
- 甘肅蘭州生物制品研究所筆試題庫
- 醫(yī)院改擴建工程可行性研究報告(論證后)
- 2021-2022學(xué)年第二學(xué)期《大學(xué)生職業(yè)發(fā)展與就業(yè)指導(dǎo)2》學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 國家開放大學(xué)電大本科《工程經(jīng)濟與管理》2023-2024期末試題及答案(試卷代號:1141)
- 給水排水管道工程外觀質(zhì)量檢查記錄
- 2022年國家電力公司火力發(fā)電廠勞動定員標(biāo)準(zhǔn)
- 危險化學(xué)品水路運輸安全管理規(guī)定
- 教育中的心理效應(yīng)
- 考古繪圖(課堂PPT)
- PE管熱熔對接施工方案完整
- 全國各地木材平衡含水率年平均值
評論
0/150
提交評論