版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
Web3時代的生產(chǎn)力工具AIGC2023P.PAGEP.PAGE22022:AIGC崛起之年 3AIGC是什么? 5AIGC發(fā)展簡史 6技術(shù) 6自然語言處理技術(shù)NLP 6AIGC生成模型 9當(dāng)我們開始用AIGC——商業(yè)模式的探索 14AIGC的未來發(fā)展趨勢 18面臨的挑戰(zhàn) 19未來的發(fā)展方向 20投資策略:AIGC的軟硬件與數(shù)據(jù)集 20風(fēng)險提示 21圖表目錄圖表1:紅框為網(wǎng)站頭條文章位置,為AI創(chuàng)作 3圖表2:官網(wǎng)展示應(yīng)用場景 4圖表3:AI生成的喬布斯訪談博客 4圖表4:《幻覺東京》AI重制版 5圖表5:內(nèi)容生成的四階段 5圖表6:AIGC發(fā)展歷程 6圖表7:自然語言理解三大發(fā)展階段 7圖表8:自然語言生成6步驟 7圖表9:微軟ApacheSpark功能 8圖表10:Transformer與其他神經(jīng)網(wǎng)絡(luò)英德翻譯質(zhì)量對比 9圖表11:Transformer與其他神經(jīng)網(wǎng)絡(luò)英法翻譯質(zhì)量對比 9圖表12:Transformer模型結(jié)構(gòu) 9圖表13:GAN的兩個組成 10圖表14:GAN架構(gòu) 10圖表15:DALL-E2可以根據(jù)文字描述生成圖片 11圖表16:擴散模型訓(xùn)練原理 12圖表17:擴散模型與其他模型比較 12圖表18:正態(tài)分布函數(shù)疊加 13圖表19:DALL-E2工作過程舉例 13圖表20:Jasper的應(yīng)用場景 14圖表21:通過AIGC撰寫的AIGC報告 15圖表22:通過AIGC生成的圖片 15圖表23:MidJourney用戶案例 16圖表24:Phenaki2分鐘視頻生成案例 17圖表25:Delysium中的虛擬人玩家 18圖表26:GitHubCopilot 18圖表27:AIGC生成的圖片在細節(jié)上效果較差 19圖表28:AIGC投資標的 211.2022:AIGC崛起之年VCAIAI923AIAIGC(AI-GeneratedContent202210StabilityAI1.01達10億美元,躋身獨角獸行列,由Coatue、LightspeedPartners和O'ShaughnessyVenturesLLCStabilityAIStableDiffusionStableDiffusionAIAIGCAI配AI圖表1:紅框為網(wǎng)站頭條文章位置,為AI創(chuàng)作資料來源:巴比特官網(wǎng),國盛證券研究所除了繪畫以外,文字、音頻、視頻均可通過AI來生成。JasperAIInstagram2021700004000202220221113日P.PAGEP.PAGE10圖表2:官網(wǎng)展示應(yīng)用場景資料來源:Jasper,國盛證券研究所3:AI
Podcast.aiAI的語JoeRogan資料來源:Podcast.ai官網(wǎng),國盛證券研究所AI1603AIAIGC基于AIGC圖表4:《幻覺東京》AI重制版資料來源:公開資料,國盛證券研究所NLP(NaturalLanguageProcessing)(DiffusionAdversarialNetwork)GANAIGC是什么?AIGC1.02.0PGCUGCInstagramB的內(nèi)容來自于UGC圖表5:內(nèi)容生成的四階段資料來源:A16Z,國盛證券研究所AIGCAIAIGC發(fā)展簡史AIGC的發(fā)展可以大致分為以下三個階段:2050年代—90AIGC902110106:AIGC
近年來,AIGC的發(fā)展迅速,從原來作為邊緣側(cè)服務(wù)于企業(yè)、機構(gòu)的角色變?yōu)榱爽F(xiàn)在段
1950年,圖靈提出著名的“圖靈測試”,給出判斷機器是否具有”智能“的實驗方法1957年,第一支由計算機創(chuàng)作的弦樂四重奏《依利亞克組曲》完成1966年,世界第一款可人機對話的機器人Eliza問世80年代中期,IBM創(chuàng)造語音控制打字機段2007年,世界第一部完全由人工智能創(chuàng)作的小說《1theroad》問世2012年,微軟展示全自動同傳系統(tǒng)段2014年,IanJGoodfellow提出生成對抗網(wǎng)絡(luò)GAN2017年,微軟“小冰”推出世界首部100%由人工智能創(chuàng)作的詩集《陽光失了玻璃窗》2018年,英偉達發(fā)布StyleGan模型可自動生成高質(zhì)量圖片2018年,人工智能生成畫作在佳士得以43.25萬美成交,成為首個出售的人工智能藝術(shù)品2019年,DeepMind發(fā)布DVD-GAN模型用以生成連續(xù)視頻2021年,OpenAI推出DALL-E,主要應(yīng)用于文本與圖像交互生成內(nèi)容資料來源:《AIGC白皮書》,國盛證券研究所技術(shù)隨著NLP(NaturalLanguageProcessing,自然語言處理)技術(shù)和擴散模型(DiffusionModel)的發(fā)展,AI不再僅作為內(nèi)容創(chuàng)造的輔助工具,創(chuàng)造生成內(nèi)容成為了可能。自然語言處理技術(shù)NLP自然語言處理最早可以追溯到1950年,圖靈發(fā)表論文“計算機器與智能”,提出“圖靈測試”的概念作為判斷智能的條件。這一測試包含了自動語意翻譯和自然語言生成。自然語言處理技術(shù)可以分為兩個核心任務(wù):自然語言理解NLU計算機在理解上有很多難點,所以NLU3786
自然語言生成GNLG到現(xiàn)在的高級NLG內(nèi)容確定文本結(jié)構(gòu)內(nèi)容確定文本結(jié)構(gòu)句子聚合語法化參考表達式生成語言實現(xiàn)子。參考表達式生成需要識別出內(nèi)容的領(lǐng)域,然后使用該領(lǐng)域(而不是其他領(lǐng)域)的詞匯。NLG最終傳達的信息要多。NLP主要被應(yīng)用在四個方面:youtubenetflix圖表9:微軟ApacheSpark功能資料來源:微軟官網(wǎng),國盛證券研究所商業(yè)上,NLP主要被應(yīng)用在一下領(lǐng)域:文字處理工作,如:名稱實體辨識(NER)、分類、摘要和關(guān)聯(lián)擷取。AI(RNN)NLP年由Google(LSTM)RNNGPTCommonCrawl圖表10:Transformer與其神網(wǎng)絡(luò)英翻譯量對比 圖表11:Transformer與其神網(wǎng)絡(luò)英翻譯量對比資料來:GoogleResearch,盛證券究所 資料來:GoogleResearch,盛證券究所NLPRNN不必像RNN圖表12:Transformer模型結(jié)構(gòu)資料來源:GoogleResearch,國盛證券研究所AIGC生成模型近年來,AIGC的快速發(fā)展歸功于生成算法領(lǐng)域的技術(shù)積累,其中包含了:生成對抗網(wǎng)絡(luò)(DiffusionModel)AIGC生成對抗網(wǎng)絡(luò)GAN(GenerativeAdversarialNetworks)2014J.Goodfellow圖表13:GAN的兩個組成資料來源:EasyAi,國盛證券研究所GAN圖表14:GAN架構(gòu)資料來源:公開資料,國盛證券研究所其優(yōu)點在于:缺點:(ModeCollapse)GANs擴散模型DiffusionModel擴散模型是一種新型的生成模型,可生成各種高分辨率圖像。在OpenAI,NvidiaGoogle圖表15:DALL-E2可以根據(jù)文字描述生成圖片資料來源:OpenAI官網(wǎng),國盛證券研究所擴散模型的生成邏輯相比其他的模型更接近人的思維模式,也是為什么近期AIGC擁有了開放性的創(chuàng)造力。本質(zhì)上,擴散模型的工作原理是通過連續(xù)添加高斯噪聲來破壞訓(xùn)練數(shù)據(jù),然后通過反轉(zhuǎn)這個噪聲過程來學(xué)習(xí)恢復(fù)數(shù)據(jù)。訓(xùn)練后,我們可以通過簡單地將隨機采樣的噪聲傳遞給學(xué)習(xí)的去噪過程來生成數(shù)據(jù)。(latentvariable)q(????|?????1)??1……??????0??0????????(?????1|????)圖表16:擴散模型訓(xùn)練原理資料來源:AssemblyAI,國盛證券研究所相比于其他模型,擴散模型的優(yōu)勢在于生成的圖像質(zhì)量更高,且無需通過對抗性訓(xùn)練,這使得其訓(xùn)練的效率有所提升。同時,擴散模型還具有可擴展性和并行性。圖表17:擴散模型與其他模型比較資料來源:Github”whatarediffusionmodels?”,國盛證券研究所高斯噪聲是一種概率密度函數(shù)符合正態(tài)分布的函數(shù),當(dāng)AIGC運用擴散模型來生成內(nèi)容的時候,是通過在一副純白的畫布(隨機白噪聲)上逐步去噪來生成最終的目標畫作。即用戶給出的文本描述形容詞,來從一個模糊的概念逐步具象。我們可以簡化為多個正態(tài)分布函數(shù)的疊加,模型選擇其中重疊的區(qū)間輸出,這也是一個逐步縮小范圍的過程。這與人類的思維模式很類似。AIAI在柯基身上。圖表18:正態(tài)分布函數(shù)疊加資料來源:Wikipedia,國盛證券研究所簡述完原理以后,我們可以通過目前非常先進的AI圖像生成應(yīng)用DALL-E2來舉例闡述具體的工作過程:(Prior)OpenAI的Clip4-AIGC圖表19:DALL-E2工作過程舉例資料來源:AssemblyAI,國盛證券研究所除了上述提到的自然語言處理技術(shù)和AIGC生成算法模型以外,超級計算機和算力這些硬件作為基礎(chǔ)設(shè)施也是不可或缺的。在機器學(xué)習(xí)的過程中,需要通過大量的訓(xùn)練來實現(xiàn)更準確的結(jié)果,這樣的計算量普通的電腦是無法完成的,目前主要由英偉達A100構(gòu)建的計算集群完成,而國內(nèi)外的初創(chuàng)企業(yè)也會通過云實現(xiàn)。AIGC——商業(yè)模式的探索AIGCAIGCAIGC服務(wù)SaaS文字創(chuàng)作20:Jasper
AIGCJasper1.25億美15Jasper2021AIAIJasperJasperJasper7Airbnb、Ibm202140009000資料來源:Jasper,國盛證券研究所AIGCAIGCJasper很快就生成了一篇AIGCAIGCJasperAPP圖表21:通過AIGC撰寫的AIGC報告資料來源:Jasper,國盛證券研究所圖像創(chuàng)作22AIGC
MidJourneyNLP()AIAIGC創(chuàng)資料來源:MidJourneyBot和無界版圖,國盛證券研究所近期,OpenAI已經(jīng)與全球最大的版權(quán)圖片供應(yīng)商之一的Shutterstock達成深度合作,Shutterstock將開始出售利用OpenAI的DALL-E生成的圖片,并禁止銷售非DALL-E生成的圖片,完成深度獨家綁定。AIGC圖表23:MidJourney用戶案例資料來源:MidJourney,國盛證券研究所視頻創(chuàng)作Google推出了AIDEMOImagen基ImagenVideoPhenakiAIGC24:Phenaki2音頻剪輯AIGC游戲開發(fā)AIGCAIGC來創(chuàng)建場景和NPCAIGCDelysium202220221113日圖表25:Delysium中的虛擬人玩家資料來源:Delysium,國盛證券研究所代碼生成GitHubCopilot是一個GitHub和OpenAIAI或者正在編輯的代碼上下文為開發(fā)者提供代碼建議。官方介紹其已經(jīng)接受了來自GitHub圖表26:GitHubCopilot資料來源:GitHub,國盛證券研究所AIGC的未來發(fā)展趨勢AIGC是PGC、UGC之后,全新的內(nèi)容生產(chǎn)方式。不僅能提升內(nèi)容生產(chǎn)的效率以滿足我們飛速增長的內(nèi)容需求,也能夠豐富內(nèi)容的多樣性。在2022年百度世界大會上,李彥宏提到了:“AIGC將走過三個發(fā)展階段:第一個階段是“助手階段”,AIGC用來輔助AIGCAI面臨的挑戰(zhàn)下圖是筆者通過AIGC生成的一副“美女與布偶貓”的圖片,從這一張圖片我們可以發(fā)現(xiàn)有兩個問題:AIGC圖表27:AIGC生成的圖片在細節(jié)上效果較差資料來源:MidJourney,國盛證券研究所那么造成以上的這些問題和差距的原因在哪里呢?
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 九年級歷史下冊單元評價檢測課件
- 《證劵基礎(chǔ)知識最終》課件
- 《激光切割工藝》課件
- 荒山綠化項目可行性研究報告
- 《人力資源管理奧秘》課件
- 股份解禁協(xié)議三篇
- 專業(yè)畢業(yè)實習(xí)報告4篇
- 2023年-2024年企業(yè)主要負責(zé)人安全教育培訓(xùn)試題及答案(易錯題)
- 2024員工三級安全培訓(xùn)考試題帶解析答案可打印
- 2023年-2024年項目部安全管理人員安全培訓(xùn)考試題附答案【培優(yōu)A卷】
- (完整word版)Word信紙(A4橫條直接打印版)模板
- 鋼結(jié)構(gòu)件運輸專項方案
- 物業(yè)公司車輛進出登記表
- DCS基礎(chǔ)培訓(xùn)課程(和利時)課件
- 員工消防安全教育培訓(xùn)
- HART-375手操器說明書
- 文學(xué)批評與實踐-四川大學(xué)中國大學(xué)mooc課后章節(jié)答案期末考試題庫2023年
- (52)-12.1服裝的審美形態(tài)11.4
- 力行“五育”并舉融合“文化”育人
- 上海中心大廈介紹
- 管道試壓記錄表
評論
0/150
提交評論