版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
D騰訊研究院迎接人工智能的下一個時代騰訊研究院AIGC發(fā)展趨勢報告2023迎接人工智能的下一個時代騰訊研究院目錄TOC\o"1-5"\h\z前言 01一、AIGC技術、應用和產業(yè)生態(tài)迎來發(fā)展快車道 031、生成算法、預訓練模型、多模態(tài)等AI技術累積融合,催生了AIGC的大爆發(fā) 042、 AIGC產業(yè)生態(tài)加速形成和發(fā)展,走向模型即服務(MaaS)的未來 10\o"CurrentDocument"二、消費端:AIGC牽引數(shù)字內容領域的全新變革 121、AIGC有望塑造數(shù)字內容生產與交互新范式,成為未來互聯(lián)網(wǎng)的內容生產基礎設施 13\o"CurrentDocument"2、AIGC的應用生態(tài)和內容消費市場逐漸繁榮 17\o"CurrentDocument"3、AIGC將日益成為未來3D互聯(lián)網(wǎng)的基礎支撐 20\o"CurrentDocument"4、聊天機器人和數(shù)字人成為新的、更包容性的用戶交互界面,不斷拓展應用領域 24\o"CurrentDocument"5、AIGC將作為生產力工具來推動元宇宙發(fā)展 28三、產業(yè)端:合成數(shù)據(jù)牽引人工智能的未來 31\o"CurrentDocument"1、合成數(shù)據(jù)為AI模型訓練幵發(fā)提供強大助推器,推動實現(xiàn)AI2.0 33\o"CurrentDocument"2、合成數(shù)據(jù)助力破解AI"深水區(qū)”的數(shù)據(jù)難題,持續(xù)拓展產業(yè)互聯(lián)網(wǎng)應用空間 34\o"CurrentDocument"3、合成數(shù)據(jù)產業(yè)加快成為數(shù)據(jù)要素市場新賽道,科技大廠和創(chuàng)新企業(yè)搶先布局 37\o"CurrentDocument"4、合成數(shù)據(jù)加速構建AI賦能、數(shù)實融合的大型虛擬世界 39\o"CurrentDocument"四、社會端:AIGC助力可持續(xù)社會價值 41\o"CurrentDocument"1、 元價值:解放人類創(chuàng)造力,革新藝術領域 43\o"CurrentDocument"2、 AIGC社會價值案例 45五、發(fā)展與挑戰(zhàn)并生:積極應對AIGC帶來的社會倫理問題 48\o"CurrentDocument"1、 知識產權挑戰(zhàn) 49\o"CurrentDocument"2、 安全挑戰(zhàn) 52\o"CurrentDocument"3、 倫理挑戰(zhàn) 54\o"CurrentDocument"4、 環(huán)境挑戰(zhàn) 57六、展望:擁抱人工智能的下一個時代,打造可信AIGC生態(tài) 6001010101刖蹂內容創(chuàng)作模式2022年是AIGC(AI-GeneratedContent,人工智能生成內容)爆火出圈的一年,不僅被消費者追捧,而且備受投資界關注,更是被技術和產業(yè)界競相追逐。9月23日,紅杉美國發(fā)表文章《生成式AI:-個創(chuàng)造性的新世界》,認為AIGC會代表新一輪范式轉移的幵始。2022年10月,StabilityAI獲得約1億美元融資,估值高達10億美元,躋身獨角獸行列。StabilityAI發(fā)布的幵源模型StableDiffusion,可以根據(jù)用戶輸入的文字描述(稱為提示詞,prompts)自動生成圖像,即文生圖(Text-to-Image,T2I)。StableDiffusion、DALL-E2、MidJourney等可以生成圖片的AIGC模型引爆了AI作畫領域,AI作畫風行一時,標志人工智能向藝術領域滲透。2022年12月,OpenAI的大型語言生成模型ChatGPT刷爆網(wǎng)絡,它能勝任刷高情商對話、生成代碼、構思劇本和小說等多個場景,將入機對話推向新的高度,讓網(wǎng)友們不禁懷疑ChatGPT是否已經具有人類智能。全球各大科技企業(yè)都在積極擁抱AIGC,不斷推出相關的技術、平臺和應用。內容創(chuàng)作模式內容斶量圖:內容創(chuàng)作模式的四個發(fā)展階段從字面意思上看,AIGC是相對于過去的PCG、UCG而提出的。因此,AIGC的狹義概念是利用AI自動生成內容的生產方式。但是AIGC已經代表了AI技術發(fā)展的新趨勢。過去傳統(tǒng)的人工智能偏向于分析能力,即通過分析一組數(shù)據(jù),發(fā)現(xiàn)其中的規(guī)律和模式并用于其他多種用途,比如應用最為廣泛的個性化推薦算法。而現(xiàn)在人工智能正在生成新的東西,而不是僅僅局限于AIGC發(fā)展趨勢報告AIGC發(fā)展趨勢報告2023——迎接人工杶能的下一跣時代雖然強人工智能還未到來,甚至不可能出現(xiàn),但是AI已經成為人類社會生產生活中不可或缺的工具。因此,需要在人機互動協(xié)作中建立一個自由的人機關系,人需要對AI有一個客觀準確的認識和定位,并且需要始終以人為中心,避免技術對人的操控。LaMDA事件中,如果人們在與AI協(xié)同中,高估了AI具有自我意識,而后建立錯誤的交互關系勢必會造成不良后果。針對算法歧視問題,過去AI公平性治理中采取的通用性應對措施,如過濾器和模型調整、以及定量偏差評估和基準測試等,似乎在AIGC這類預訓練模型系統(tǒng)級別上具有一些挑戰(zhàn)性。然而,業(yè)界依然在不斷進行嘗試。比如,斯坦福大學以人為本人工智能研究院(簡稱HAI)基礎模型研究中心推出大型語言模型(LLM)的整體評估(HolisticEvaluationofLanguageModels,HELM),評估包括準確性、校準、魯棒性、公平性、偏差、毒性和效率等模型完備的各個關鍵要素,旨在提高語言模型透明度,幫助理解大型語言模型。 /ai/stanford-debuts-first-ai-benchmark-to-help-understand-llms/而面對自我意識、’'逝者模擬仿生 /ai/stanford-debuts-first-ai-benchmark-to-help-understand-llms/4、環(huán)境挑戰(zhàn)基于預訓練模型的AIGC不僅是訓練還是運行,都需要大量算力支持,無形中增加了能源消耗,其高速發(fā)展給環(huán)境保護和氣候變化帶來了巨大挑戰(zhàn),產生高碳排放。首先,AI模型訓練消耗大量算力,碳排放量驚人。而實際上,隨著近年來AI的大規(guī)模應用,人們已經幵始意識到AI的碳排放問題。如下圖,馬薩諸塞大學阿默斯特分校的研究人員對訓練幾種常見的AI模型進行了生命周期評估。他們發(fā)現(xiàn)該過程可排放超過626,000磅的二氧化碳當量一幾乎是美國普通汽車生命周期排放量的五倍(包括汽車本身的制造)。 /pdf/1906.02243.pdf同時,還有研究人員對Transformer.ELMo、BERT、GPT-2、GPT-3等進行了碳排放研究。他們在單個GPU上對每個模型進行了長達一天的訓練,測量其功耗。最后測試結果發(fā)現(xiàn),模型訓練的計算和環(huán)境成本與模型大小成正比。GPT-3模型訓練的二氧化碳排放量為552 /pdf/1906.02243.pdf PattersonD,GonzalezJ,LeQ,etal.CarbonemissionsandlargeneuralnetworktrainingJ.arXivpreprintarXiv:2104.10350,2021.Consumption CO2e(lbs)Airtravel,1passenger,NYoSF 1984Humanlife,avg,1year 11,023Americanlife,avg,1year 36,156Car,avgincl.fuel,1lifetime 126,000Trainingonemodel(GPU)NLPpipeline(parsing,SRL) 39w/tuning&experimentation 78,468Transformer(big) 192w/neuralarchitecturesearch 626,155Table1:EstimatedCO2emissionsfromtrainingcom-
monNLPmodels,comparedtofamiliarconsumption?圖:單一機器學習模型訓練所產生的碳排放相當于普通汽車壽命期內碳排放量的5倍其次,大量算力需求和碳排放造成了AIGC應用的高昂成本。目前,業(yè)界在探討AIGC商業(yè)落地時,存在一個較大的難題,便是成本問題。雖然很多AIGC工具深受用戶喜愛,但是其原始成本非常昂貴。Midjourney的創(chuàng)始人大衛(wèi)?霍爾茲(DavidHolz)表示,大規(guī)模商業(yè)擴展是未來發(fā)展的一個重要難題問題,這并不是用戶量擴展的問題,而是算力支持的問題。目前,Midjourney只有數(shù)十萬用戶,已經需要極高的算力來支持。如果用戶量達到1000萬人,那么世界上沒有足夠的算力來支持。 /2022/08/01/david_holz_midjourney/OpenAI的CE。嘪姆奧特曼也指出,調用運行ChatGPT進行聊天對話,每次回答的成本約為幾美分,因此未來將不得不因為計算成本問題暫?,F(xiàn)在的免費模式??萍纪顿Y公司BlocVentures的戴維?萊夫特利(DavidLeftley)表示:‘‘現(xiàn)在全球企業(yè)都在追求凈零碳排放,而我們卻在通過與AI /2022/08/01/david_holz_midjourney/ /content/9c5f7154-5222-4be3-a6a9-f23879fd0d6a最后,碳排放和算力問題也在制約著AIGC預訓練模型的幵源。目前,有很多頭部機構的預訓練模型無法幵源的一個重要原因是,小型幵發(fā)者無法承受算力成本。因此,有一部分幵發(fā)者將超大模型的各種能力拆分到參數(shù)相對更小的模型上,以解決算力和能耗問題。還有一部分通過加快大模型推理速度、降低算力成本、減少能耗,以此來突破預訓練模型的發(fā)展制約。比如Meta的OPT只需要16塊英偉達v100GPU就可以訓練和部署完整模型的代碼庫,這是GPT-3的七分之一。此前有專家估計,GPT-3的訓練使用了上萬塊英偉達v100GPU,總成本高達2760萬美元,個人如果要訓練出一個PaLM也要花費900至1700萬美元。大模型的訓練成本若能降下來,自然也就能提高他們的幵源意愿。但歸根結底,這只能從工程上對算力資源的約束起到緩解作用,而并非終極方案。盡管目前許多千億級、萬億級的大模型已經幵始宣傳自己的"低能耗”優(yōu)勢,但算力的圍墻仍然太高。業(yè)界也逐漸認識到能源消耗和環(huán)境問題對深度學習技術發(fā)展和應用的制約。2020年,Schwartz等人提出綠色Al的理念,倡導通過調整推理模式、提升訓練策略等一系列方式在達到同等訓練結果的情況下降低技術成本和能源消耗。 SchwartzR,DodgeJ,SmithNA,etal.GreenaiJ.CommunicationsoftheACM,2020,63(12):54-63.這一理念逐漸被廣泛接受。針對AIGC SchwartzR,DodgeJ,SmithNA,etal.GreenaiJ.CommunicationsoftheACM,2020,63(12):54-63.6161展望:擁抱人工智能的下一個時代,打造可信AIGC生態(tài)?本章主筆:曹建峰騰訊研究院高級研究員2022年見證了AIGC的快速崛起和破圈發(fā)展。但對于AIGC領域而言,這僅僅是一個幵始,更大的變革尚待幵啟。在過去的深度學習黃金十年,人工智能的感知、理解能力不斷增強,為AIGC的爆發(fā)奠定基礎。如今,隨著生成算法、大模型、多模態(tài)技術等AI技術的持續(xù)創(chuàng)新和發(fā)展成熟,AI領域正在經歷從感知、理解到生成、創(chuàng)造的躍遷。以AIGC這一新的疆域為標志,AI領域正在迎來下一個時代。融合大模型和多模態(tài)技術的AIGC模型,有望成為新的技術平臺,深度賦能各行各業(yè)。未來,"AIGC+”將在經濟社會的各個領域持續(xù)大放異彩。從基礎性的AIGC模型,到中間層的垂直化、定制化、個性化的模型工具,再到下游層出不窮的、各種各樣的AIGC產品和服務,AIGC的產業(yè)生態(tài)正在加速形成和發(fā)展。AIGC將創(chuàng)造出巨大的經濟社會價值,其應用不限于互聯(lián)網(wǎng)領域,也將給文化、娛樂、教育、金融、醫(yī)療、公共服務、交通、制造等諸多領域帶來積極影響。經歷了2022年的喧囂和炒作,2023年AIGC將乘勢而起,迎來更大發(fā)展。面向人工智能的下一個時代,人們需要更加負責任地、以人為本地發(fā)展應用AIGC技術,打造可信AIGC生態(tài)。面對AIGC技術應用可能帶來的知識產權保護、信息內容安全、算法歧視和社會倫理等問題,社會各界需要協(xié)同參與、共同應對,通過法律、倫理、技術等方面的多元措施支持構建可信AI生態(tài)。在立法方面,網(wǎng)信辦等三部門出臺的《互聯(lián)網(wǎng)信息服務深度合成管理規(guī)定》針對深度合成技術服務提出的要求和管理措施,諸如禁止性要求、標識要求、安全評估等,亦適用于AIGC。下一步,需要著重從以下方面持續(xù)推進AIGC的政策和治理。其一,政府部門需要結合AIGC技術的發(fā)展應用情況,制定
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 繼電保護相關課程設計
- 禮儀引導的課程設計理念
- 織物課程設計報告
- 電子課程設計 緒論
- 植物課程設計幼兒園
- 材料公司的課程設計
- 有色合金的鑄造工藝成本分析考核試卷
- 生物降解纖維漿開發(fā)考核試卷
- 碳酸飲料行業(yè)的機遇與挑戰(zhàn)考核試卷
- 秒表定時器課程設計
- 智慧航天物聯(lián)網(wǎng)
- RM60實用操作課件
- 肝內膽管癌的護理查房課件
- 自媒體培訓課件
- 學會傾聽(心理健康課件)
- 開展中小學人工智能教育成功案例與經驗分享
- 教練式溝通培訓課件
- 養(yǎng)老院品牌建設與推廣策略
- 族概述與族操作-創(chuàng)建參數(shù)化三維族(Revit建模課件)
- 《機電一體化系統(tǒng)設計》
- 歷史 小錢幣大歷史教學設計
評論
0/150
提交評論