行研新視角:AIGC助推元宇宙進(jìn)程加速未來商業(yè)化場(chǎng)景探究1723424049_第1頁
行研新視角:AIGC助推元宇宙進(jìn)程加速未來商業(yè)化場(chǎng)景探究1723424049_第2頁
行研新視角:AIGC助推元宇宙進(jìn)程加速未來商業(yè)化場(chǎng)景探究1723424049_第3頁
行研新視角:AIGC助推元宇宙進(jìn)程加速未來商業(yè)化場(chǎng)景探究1723424049_第4頁
行研新視角:AIGC助推元宇宙進(jìn)程加速未來商業(yè)化場(chǎng)景探究1723424049_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

行研新視角2024年4月16日請(qǐng)務(wù)必閱讀免責(zé)條款圖片來源:百度2新視角:AIGC將極大的推動(dòng)元宇宙的發(fā)展,元宇宙中大量的數(shù)字原生內(nèi)容,需要由AI來幫助中的數(shù)字身份塑造、元世界打造提供數(shù)據(jù)與算法服務(wù),實(shí)現(xiàn)渲染、交互驅(qū)動(dòng)、智能計(jì)目前海外互聯(lián)網(wǎng)巨頭紛紛入局GPT大模型研發(fā),技術(shù)都在周期性迭代,各家都基于自身的生態(tài)和研發(fā)優(yōu)勢(shì)開發(fā)。目前市場(chǎng)上頭部互聯(lián)網(wǎng)企業(yè)(微軟、谷歌、亞馬遜)最新研發(fā)的大模型不僅在文本處理能力上不斷提升,同時(shí)也在多模態(tài)能力上日益精進(jìn),單次處理的內(nèi)容上限已經(jīng)能夠達(dá)到百萬token級(jí)別。知識(shí)儲(chǔ)備上已經(jīng)擁有與人類本科生水平相當(dāng)?shù)闹R(shí)和理解能力,再次定義了AI的高度。隨著互聯(lián)網(wǎng)用戶對(duì)在線內(nèi)容的消費(fèi)和支付意愿一直增加,未來將構(gòu)建一個(gè)內(nèi)容龐大且快速增長(zhǎng)的元宇宙生態(tài)將創(chuàng)造更大的商業(yè)化潛力。隨著技術(shù)的不斷進(jìn)步,元宇宙的概念也逐漸被越來越多的人所認(rèn)可。元宇宙的出現(xiàn)將會(huì)帶來許多變革,它將會(huì)改變?nèi)藗兊纳罘绞?、社交方式、娛樂方式等等。在元宇宙中,人們可以穿梭于不同的虛擬現(xiàn)實(shí)世界之間,與其他玩家進(jìn)行交互,體驗(yàn)更加豐富、更加真實(shí)的虛擬世界。同時(shí),元宇宙也將會(huì)成為一個(gè)新的經(jīng)濟(jì)體系,人們可以在其中交易虛擬物品、虛擬貨幣等等,在這個(gè)極具活力的生態(tài)中,商業(yè)化空間巨大。1.AIGC將推動(dòng)元宇宙發(fā)展 5 51.2組成元宇宙概念的拼圖逐漸完整 71.3為什么元宇宙還沒實(shí)現(xiàn)? 91.4AIGC如何提升元宇宙內(nèi)容生成效率 2.頭部大模型技術(shù)在競(jìng)爭(zhēng)中不斷精進(jìn) 3.文字以外的領(lǐng)域同樣在發(fā)生變革 3.2AI能夠自行通關(guān)游戲,虛擬角色將更擬真 4.未來商業(yè)化場(chǎng)景暢想 5.相關(guān)標(biāo)的 6.風(fēng)險(xiǎn)提示 34圖目錄圖1:AIGC最典型的商業(yè)化產(chǎn)品:ChatGPT 6圖2:AIGC未來將是元宇宙重要內(nèi)容創(chuàng)作來源 6圖3:GPTAI通過重復(fù)學(xué)習(xí)實(shí)現(xiàn)高概率結(jié)果 7圖4:目前自然語言大模型訓(xùn)練仍在突飛猛進(jìn) 7圖5:元宇宙是虛擬與現(xiàn)實(shí)結(jié)合的混合生態(tài) 8圖6:構(gòu)成元宇宙的八大要素缺一不可 8圖6:Chatgpt的文字生成能力展示 圖7:Midjourney的圖片生成能力展示 圖8:FakeYou的音頻生成能力展示 圖9:SORA的視頻生成能力展示 圖10:GPT經(jīng)過多次升級(jí),目前已經(jīng)能夠滿足更多的內(nèi)容生成 圖12:Claude3號(hào)稱花最少得錢獲取最優(yōu)秀的用戶體驗(yàn) 圖13:AI繪畫已經(jīng)從簡(jiǎn)單生成圖片已經(jīng)進(jìn)化到理解和推理繪畫的內(nèi)容 圖14:SORA概念視頻上線,生成內(nèi)容時(shí)長(zhǎng)1分鐘 圖15:Cradle能直接根據(jù)游戲內(nèi)的提示和教程生成對(duì)應(yīng)的可執(zhí)行代碼 表目錄表1:AIGC技術(shù)升級(jí)將助力元宇宙加速實(shí)現(xiàn) 9表2:三大廠商模型測(cè)評(píng)能力對(duì)比 表3:三大廠商模型付費(fèi)會(huì)員使用價(jià)格對(duì)比 表4:GPT4.0在各項(xiàng)功能上有較大突破 表5:AIGC及元宇宙相關(guān)概念標(biāo)的估值 2151.AIGC將推動(dòng)元宇宙發(fā)展1.1被稱為下一代風(fēng)口的AIGC到底是什么AIGC(AIGeneratedContent)是由AI生成的內(nèi)容,其特點(diǎn)是自動(dòng)化生產(chǎn)、高效。隨著自然語言生成技術(shù)NLG和AI模型的成熟,AIGC逐漸受到大家的關(guān)注,目前已經(jīng)可以自動(dòng)生成文字、圖片、音頻、視頻,甚至3D模型和代碼。我們認(rèn)為AIGC將極大的推動(dòng)元宇宙的發(fā)展,元宇宙中大量的數(shù)字原生內(nèi)容,需要由AI來幫助完成創(chuàng)作。AIGC是利用人工智能技術(shù)來生成內(nèi)容,被認(rèn)為是繼PGC、UGC之后的新型內(nèi)容創(chuàng)作方式。AIGC依托高效的數(shù)據(jù)、算法、場(chǎng)景學(xué)習(xí)優(yōu)勢(shì),能夠?yàn)橛脩粼谠钪嬷械臄?shù)字身份塑造、元世界打造提供數(shù)據(jù)與算法服務(wù),實(shí)現(xiàn)渲染、交互驅(qū)動(dòng)、智能計(jì)算、數(shù)據(jù)開放與數(shù)字資產(chǎn)流通功能,高效產(chǎn)出元宇宙文本、圖片、視頻等優(yōu)質(zhì)內(nèi)容,以及虛實(shí)交互的直播、社交場(chǎng)景。未來AIGC的應(yīng)用能夠持續(xù)擴(kuò)展元宇宙技術(shù)創(chuàng)新應(yīng)用領(lǐng)域,豐富更多虛擬現(xiàn)實(shí)應(yīng)用場(chǎng)景。元宇宙構(gòu)成要素包括硬件設(shè)備、軟件平臺(tái)、虛擬現(xiàn)實(shí)技術(shù)、人工智能、區(qū)塊鏈等。硬件設(shè)備包括虛擬現(xiàn)實(shí)眼鏡、手套、體感設(shè)備等,可以讓用戶身臨其境地感受到虛擬現(xiàn)實(shí)空間。軟件平臺(tái)則提供了一個(gè)開放的環(huán)境,使得用戶可以自由地創(chuàng)建和分享內(nèi)容。虛擬現(xiàn)實(shí)技術(shù)則是元宇宙的核心,它可以讓用戶在虛擬現(xiàn)實(shí)空間中進(jìn)行交互和溝通。人工智能則可以為元宇宙中的角色賦予智能,讓他們更加真實(shí)。區(qū)塊鏈則為元宇宙提供了一個(gè)去中心化的管理方式,使得用戶可以自由地交換和共享數(shù)字資產(chǎn)??傊钪媸且粋€(gè)融合了多種技術(shù)的數(shù)字世界,它將給人類帶來更加廣闊的想象空間和無限的可能性。6愛內(nèi)容質(zhì)量所限金產(chǎn)能所限UGCPGCAIGCChatGPT是首個(gè)成熟的AIGC產(chǎn)品ChatGPT是由OpenAI公司開發(fā)的一種基于Transformer架構(gòu)的先進(jìn)語言模型,成為機(jī)器學(xué)習(xí)并輸出內(nèi)容的首個(gè)應(yīng)用類工具,它擁有強(qiáng)大的語言理解和生成能力,能夠模擬人類的溝通方式,提供更為高效、自然的表達(dá)方式。這種模型在各種場(chǎng)景下具有廣泛的應(yīng)用潛力,包括但不限于在線聊天、智能語音助手以及自然語言處理任務(wù)等。ChatGPT通過持續(xù)的學(xué)習(xí)和優(yōu)化算法,不斷提升自身的性能和準(zhǔn)確性,從而更好地滿足用戶的多樣化需求。作為AIGC領(lǐng)域中的一種具體應(yīng)用和產(chǎn)品,ChatGPT屬于文本生成范疇,其優(yōu)點(diǎn)在于能夠生成流暢、連貫且富有邏輯的文本內(nèi)容。當(dāng)GPT模型在參考了千億甚至萬億級(jí)數(shù)據(jù)后,經(jīng)過大模型預(yù)訓(xùn)練,可以基本掌握自然語言處理規(guī)律,但此階段錯(cuò)誤率較高,通過人工標(biāo)注錯(cuò)誤答案,并不斷進(jìn)行反饋學(xué)習(xí),于是在參考數(shù)據(jù)足夠多、算力足夠強(qiáng)大的情況下,GPT模型可通過“涌現(xiàn)”效應(yīng)產(chǎn)生較強(qiáng)類人智能。在與用戶的交互中,ChatGPT能夠展現(xiàn)出自然、有趣的對(duì)話風(fēng)格,為用戶帶來良好的使用體驗(yàn)。ChatGPT的局限性在于它主要依賴概率進(jìn)行文本生成,有時(shí)可能會(huì)產(chǎn)生不正確或不合適的文本內(nèi)容。為了提升模型的性能,需要借助人類用戶的反饋進(jìn)行強(qiáng)化學(xué)習(xí)。盡管如此,ChatGPT仍然無法完全替代人類在某些復(fù)雜、精細(xì)的溝通場(chǎng)景中的作用。ChatGPT作為一種基于Transformer的語言模型,在文本生成7和自然語言處理領(lǐng)域具有顯著的優(yōu)勢(shì)和廣泛的應(yīng)用前景。隨著技術(shù)的不斷進(jìn)步為人類的生活和工作帶來更多便利。果圖4:目前自然語言大模型訓(xùn)練仍在突飛猛進(jìn)不完整的句子不完整的句子美高嗎GPT=GenerativePre-trainedTransformer資料來源:Google論文、國(guó)元證券經(jīng)紀(jì)(香港)整理資料來源:Google論文、國(guó)元證券經(jīng)紀(jì)(香港)整理1.2組成元宇宙概念的拼圖逐漸完整元宇宙生態(tài)當(dāng)前仍處于初級(jí)階段我們認(rèn)為元宇宙正引領(lǐng)一場(chǎng)劃時(shí)代的技術(shù)革命,其深遠(yuǎn)影響將重塑人類社會(huì)的面貌。元宇宙作為人類運(yùn)用數(shù)字技術(shù)精心構(gòu)建的虛擬世界,不僅映射了現(xiàn)實(shí)世界的豐富多樣,更超越了其界限,為用戶提供了一個(gè)可與現(xiàn)實(shí)世界無縫交互的數(shù)字生活空間。它整合了5G、云計(jì)算、人工智能、虛擬現(xiàn)實(shí)、區(qū)塊鏈、數(shù)字貨幣、物聯(lián)網(wǎng)、人機(jī)交互等核心底層技術(shù),并對(duì)芯片、顯示屏幕、電池等硬件技術(shù)提出了更高的升級(jí)要求。在這個(gè)虛擬世界中,各種素材的生成、交互,以及設(shè)備的接入、數(shù)據(jù)傳輸?shù)汝P(guān)鍵環(huán)節(jié),均依賴于人工智能的精準(zhǔn)驅(qū)動(dòng),這要求端側(cè)必須擁有強(qiáng)大的算力支撐。元宇宙的構(gòu)建包含八大核心要素:身份、朋友、沉浸感、低延遲、多元化、隨時(shí)隨地、經(jīng)濟(jì)系統(tǒng)和文明。根據(jù)Roblox等上市公司的深入研究,元宇宙展現(xiàn)出8五大鮮明特征與屬性:社會(huì)與空間的交融屬性、科技賦能的超越現(xiàn)實(shí)延伸、人、機(jī)與人工智能的共創(chuàng)共生、真實(shí)感與現(xiàn)實(shí)世界的精準(zhǔn)映射,以及虛擬資產(chǎn)與服務(wù)的自由交易與流通。本質(zhì)上,元宇宙是對(duì)現(xiàn)實(shí)世界的深度虛擬化與數(shù)字化,這一過程需要對(duì)內(nèi)容生產(chǎn)、經(jīng)濟(jì)系統(tǒng)、用戶體驗(yàn)以及實(shí)體世界內(nèi)容的深度融合進(jìn)行大量創(chuàng)新性的改造。然而,元宇宙的發(fā)展并非一蹴而就,而是在共享的基礎(chǔ)設(shè)施、統(tǒng)一的標(biāo)準(zhǔn)及協(xié)議的支撐下,由眾多工具、平臺(tái)的不斷融合與進(jìn)化而最終成形?;跀U(kuò)展現(xiàn)實(shí)技術(shù),元宇宙為用戶提供了前所未有的沉浸式體驗(yàn);借助數(shù)字孿生技術(shù),它生成了現(xiàn)實(shí)世界的精準(zhǔn)鏡像;通過區(qū)塊鏈技術(shù),元宇宙搭建了一個(gè)去中心化的經(jīng)濟(jì)體系。在這一體系中,虛擬世界與現(xiàn)實(shí)世界在經(jīng)濟(jì)、社交、身份等多個(gè)系統(tǒng)上實(shí)現(xiàn)了緊密融合,每個(gè)用戶都被賦予了內(nèi)容生產(chǎn)和世界編輯的權(quán)力,從而共同塑造這個(gè)充滿無限可能的數(shù)字新世界。圖5:元宇宙是虛擬與現(xiàn)實(shí)結(jié)合的混合生態(tài)圖6:構(gòu)成元宇宙的八大要素缺一不可圖5:元宇宙是虛擬與現(xiàn)實(shí)結(jié)合的混合生態(tài)虛擬世集虛擬世集現(xiàn)實(shí)言常界內(nèi)容應(yīng)用端社會(huì)本質(zhì)-社會(huì)屬性達(dá)成資料來源:Google論文、國(guó)元證券經(jīng)紀(jì)(香港)整理資料來源:Google論文、國(guó)元證券經(jīng)紀(jì)(香港)整理AIGC技術(shù)助力元宇宙內(nèi)容快速膨脹互聯(lián)網(wǎng)內(nèi)容生產(chǎn)方式經(jīng)歷了PGC、UGC、AIGC的過程。PGC是專業(yè)生產(chǎn)內(nèi)容,如Web1.0專業(yè)人員生產(chǎn)的文字和視頻,其特點(diǎn)是專業(yè)、內(nèi)容質(zhì)量有保證。UGC是用戶生產(chǎn)內(nèi)容,伴隨Web2.0概念而產(chǎn)生,特點(diǎn)是用戶可以自由上傳內(nèi)容,內(nèi)容豐富,因此用戶數(shù)成為了各家爭(zhēng)奪的資源。到了Web3.0,由于元宇宙概念興起,需要大量的內(nèi)容來支持生態(tài)擴(kuò)張,單靠人工創(chuàng)作效率及商業(yè)化潛力太低,因此AIGC技術(shù)將助力元宇宙加速實(shí)現(xiàn)。9互聯(lián)網(wǎng)時(shí)代Web1.0Web2.0Web3.0/元宇宙內(nèi)容生產(chǎn)方式特點(diǎn)發(fā)展核心PGC(專業(yè)生產(chǎn))UGC(用戶生產(chǎn))專業(yè)、質(zhì)量有保證自由上傳、內(nèi)容豐富網(wǎng)絡(luò)傳輸用戶數(shù)量AIGC(AI生產(chǎn))高效率算力資料來源:國(guó)元證券經(jīng)紀(jì)(香港)整理元宇宙是指一個(gè)由虛擬世界和現(xiàn)實(shí)世界相互連接的綜合性數(shù)字世界,可以為用戶提供更為全面、便捷的服務(wù)和娛樂體驗(yàn)。在那里人們可以做一些在正常生活中不可能做或者不方便做的事情,同時(shí)這個(gè)生態(tài)又是跟現(xiàn)實(shí)十分接近的虛擬世界,因此人們可以在這個(gè)世界中獲得大量的成就感和滿足。這一概念早在2021年就開始興起,科技行業(yè)巨頭們紛紛為進(jìn)軍元宇宙領(lǐng)域布局,大家也對(duì)元宇宙的未來一片看好:例如2021年3月美國(guó)Roblox公司首次將“元宇宙”寫進(jìn)招股說明書,2021年8月字節(jié)跳動(dòng)收購(gòu)了VR硬件公司PICO,2021年10月Facebook更名為Meta。但是發(fā)展至現(xiàn)在市面上依然沒有成型的元宇宙生態(tài),資本市場(chǎng)的熱度也有所下降。我們認(rèn)為其主要制約因素有以下幾點(diǎn):擴(kuò)展性和性能:元宇宙需要處理大量的虛擬世界、虛擬物品和用戶,對(duì)于系統(tǒng)的擴(kuò)展性和性能提出了挑戰(zhàn)。在目前的技術(shù)水平下,實(shí)現(xiàn)大規(guī)模、高并發(fā)的元宇宙體驗(yàn)仍然面臨技術(shù)限制。人工智能與自主行為:元宇宙中的虛擬角色和虛擬物品通常由人工智能控制,但目前的人工智能技術(shù)在模擬人類行為和情感方面仍存在局限性。實(shí)現(xiàn)更加智能化和自主化的虛擬角色和虛擬物品仍然是一個(gè)技術(shù)挑戰(zhàn)。設(shè)備和設(shè)施:要在元宇宙中獲得沉浸式體驗(yàn),用戶通常需要使用虛擬現(xiàn)實(shí)(VR)或增強(qiáng)現(xiàn)實(shí)(AR)設(shè)備,如頭戴式顯示器、手柄等。然而,目前這些設(shè)備在成本、便攜性和用戶友好性方面還存在一些限制。云設(shè)備和計(jì)算資源:元宇宙需要強(qiáng)大的計(jì)算資源和硬件設(shè)備的支持,包括高性能計(jì)算機(jī)、GPU、服務(wù)器、傳感器、攝像頭、運(yùn)動(dòng)跟蹤設(shè)備等,以提供更加真實(shí)、高效和流暢的虛擬環(huán)境和交互體驗(yàn)。內(nèi)容生成與內(nèi)容互動(dòng)效率:元宇宙需要大量的內(nèi)容和實(shí)時(shí)調(diào)整的動(dòng)態(tài)環(huán)境,建立一個(gè)交互體驗(yàn)高的元宇宙需要持續(xù)和高效的生成內(nèi)容,同時(shí)也需要后臺(tái)AI來對(duì)用戶與生態(tài)交互進(jìn)行實(shí)時(shí)生成,單靠人力資源創(chuàng)作元宇宙搭建周期過長(zhǎng)。那么從內(nèi)容生成的角度來看目前AIGC的高速發(fā)展將能夠提升生態(tài)內(nèi)容的生成效率,而且由于目前普遍大模型已經(jīng)開始多模態(tài)化,ChatGPT目前可實(shí)現(xiàn)的功能不僅僅局限于聊天,它具有強(qiáng)大的自然語言處理能力,可以完成文本生成、圖像生成、音頻生成與視頻生成等模態(tài),未來還可以進(jìn)行生態(tài)框架生成、3D模型生成等。介于元宇宙需要大量的內(nèi)容進(jìn)行生態(tài)拓展,因此AIGC的高效內(nèi)容生產(chǎn)文本生成模態(tài):ChatGPT可以按照要求高質(zhì)量完成文案生成、撰寫新聞稿在線答疑等任務(wù),某些方面甚至有超越搜索引擎的趨勢(shì)。同時(shí)具備較強(qiáng)上下文連接以及多輪對(duì)話的能力,人機(jī)交互體驗(yàn)感大幅提升?!だm(xù)和一的農(nóng)服,穿多層衣服,特到是保峨的內(nèi)衣福和毛衣,可以讓仰保持四圖像生成模態(tài):目前ChatGPT大致可以實(shí)現(xiàn)三類AI繪畫,一種是通過文字描述生成圖像,另一種是在已有圖像的基礎(chǔ)上借助文字描述生成新的圖像,第三類是先通過文字描述產(chǎn)生圖像,然后在生成圖像的基礎(chǔ)上再借助文字進(jìn)行調(diào)整。如Midjourney、DALL.E2以及國(guó)內(nèi)的文心一格等應(yīng)用軟件。音頻生成模態(tài):目前人工智能內(nèi)容生成在音頻生成領(lǐng)域的應(yīng)用非常廣泛,例如有聲讀物的制作、語音播報(bào)、短視頻配音、音樂合成等領(lǐng)域,目前以GPT技術(shù)為標(biāo)志的人工智能內(nèi)容生成主要有兩種類型:語音合成與歌曲生圖8:FakeYou的音頻生成能力展示州文字轉(zhuǎn)語音Tracr(Oweraatch)-Wegtotc★評(píng)分,37-聲音好聽視頻生成模態(tài):目前ChatGPT已經(jīng)可以實(shí)現(xiàn)直接利用文字描述生成視頻。早在2022年9月,Meta公司推出的Make-A-Video工具就已經(jīng)可以實(shí)現(xiàn)文字描述生成短視頻的功能,谷歌公司也推出了分辨率更高、功能更加強(qiáng)大的視頻內(nèi)容生成軟件,生成的視頻不僅更加清晰,同時(shí)能理解并生成不同風(fēng)格的視頻作品。另外2024年2月15日向公眾展示了由Sora生成的多個(gè)高清視頻,稱該模型能夠生成長(zhǎng)達(dá)一分鐘的視頻。2.頭部大模型技術(shù)在競(jìng)爭(zhēng)中不斷精進(jìn)目前海外互聯(lián)網(wǎng)巨頭紛紛入局GPT大模型研發(fā),技術(shù)都在周期性迭代,各家都基于自身的生態(tài)和研發(fā)優(yōu)勢(shì)開發(fā)。過去十年間,谷歌、臉書、亞馬遜、蘋果和微軟等科技巨頭紛紛開啟AI軍備競(jìng)賽,先后成立專門的AI實(shí)驗(yàn)室,包括谷歌DeepMind、背靠微軟OpenAI和背靠亞馬遜的。其中,被谷歌收購(gòu)的DeepMind因擁有AlphaGo(阿爾法狗)最為家喻戶曉。而大模型是“大算力+強(qiáng)算法”的產(chǎn)物,是人工智能發(fā)展的趨勢(shì)和未來。大模型助力AI實(shí)現(xiàn)從“手工作坊”到“工廠模式”的轉(zhuǎn)變,從而使得AI從實(shí)驗(yàn)室走向規(guī)模化的產(chǎn)業(yè)應(yīng)用。根據(jù)Claude3系列開發(fā)者Anthropic公布的測(cè)試數(shù)據(jù)來看,目前市場(chǎng)上頭部互聯(lián)網(wǎng)企業(yè)(微軟、谷歌、亞馬遜)最新研發(fā)的大模型不僅在文本處理能力上不斷提升,同時(shí)也在多模態(tài)能力上日益精進(jìn),單次處理的內(nèi)容上限已經(jīng)能夠達(dá)到百萬token級(jí)別,意味著單次能夠處理海量信息達(dá)到1小時(shí)的視頻、11小時(shí)的音頻、超過30,000行的代碼庫(kù),或是超過700,000個(gè)單詞。知識(shí)儲(chǔ)備上已經(jīng)擁有與人類本科生水平相當(dāng)?shù)闹R(shí)和理解能力,再次定義了AI的高度。價(jià)格方面,目前由于芯片供應(yīng)及海外電價(jià)等原因,使得價(jià)格偏高,但是預(yù)計(jì)未來隨著技術(shù)更新以及算法持續(xù)優(yōu)化,價(jià)格有優(yōu)化空間,使得更多用戶能夠享受到科技進(jìn)步帶來的紅利。大模型通?;诖笠?guī)模無標(biāo)注數(shù)據(jù)進(jìn)行訓(xùn)練,掌握某種特征和規(guī)則;基于大模型進(jìn)行應(yīng)用開發(fā)時(shí),將大模型進(jìn)行微調(diào),或者不進(jìn)行微調(diào),就可以完成多個(gè)應(yīng)用場(chǎng)景的任務(wù)。與此同時(shí),大模型具有自監(jiān)督學(xué)習(xí)能力,不需要或很少需要通過人工標(biāo)注的數(shù)據(jù)進(jìn)行訓(xùn)練,降低了訓(xùn)練成本,因而能夠加快AI的產(chǎn)業(yè)化進(jìn)程,降低AI應(yīng)用的門檻。通過不斷迭代,大模型能夠具有更強(qiáng)的通用性以及更高的智能程度,從而使得AI更廣泛地賦能各行業(yè)與此同時(shí)目前支持ChatGPT正常運(yùn)行所需耗費(fèi)的資源非常多,同時(shí)決定大模型核心算力水平的GPU供應(yīng)尚集中在少數(shù)國(guó)家手中,雖然GPT技術(shù)是開源的,在沒有充足GPU供給的情況下,難以維持強(qiáng)大且持續(xù)的算力支撐,從而產(chǎn)生通用人工智能技術(shù)研發(fā)的“馬太效應(yīng)”,強(qiáng)者愈強(qiáng),且極易引發(fā)技術(shù)壟斷。因此我們預(yù)計(jì)未來成功的大模型和元宇宙生態(tài)將會(huì)從頭部互聯(lián)網(wǎng)巨頭中產(chǎn)生。表2:三大廠商模型測(cè)評(píng)能力對(duì)比評(píng)估方案測(cè)評(píng)能力Claude3OPUSClaude3SonnetClaude5HaikuGPT-4GPT-3.5UItra83.70%94.40%53.20%74.40%82.00%83.60%87,80%pro96.50%63.50%67.70%86.80%75.00%84.70%MMLUGPOAGSM8KMATHMGSMHumanEalDROP,F1-SCOREBIG-Bench-HardARC-ChallengeHelaSwag知識(shí)儲(chǔ)備水平推理能力數(shù)學(xué)推理評(píng)測(cè)解答數(shù)學(xué)問題測(cè)評(píng)多語吉環(huán)境數(shù)學(xué)能編碼能力文本推理能力混合推理能力知識(shí)問答常識(shí)儲(chǔ)備86.80%95.00%60.10%90.70%94.90%83.10%86.80%96.40%95.40%40.40%92.30%43.10%83.50%78.90%82.90%93.20%89.00%88.90%38.90%75,10%75.90%78.40%73.70%89.20%85.90%86.40%70.00%35.70%28.10%92.00%57.10%52.90%34.10%67.00%48.10%80.90%64.10%83.10%66.60%96.30%85.20%95.30%85.50%價(jià)格對(duì)比0PUS:輸入:15$/1000000tokenSonnet:輸入:3$/1000000tokenHaiku:輸入:0.15$/1000000token19.9$/包月美元,在舊金山創(chuàng)立了OpenAIInc.。2016年,微軟Azure云服務(wù)為OpenAI提供了算力條件。2018年發(fā)布了最早的一代大型模型GPT-1,運(yùn)用幾十億文本檔案的語言資料庫(kù)進(jìn)行訓(xùn)練,模型的參數(shù)量為1.17億個(gè);2019年,GPT-2發(fā)布,模型參數(shù)量提高到15億個(gè),得益于更高的數(shù)據(jù)質(zhì)量和更大的數(shù)據(jù)規(guī)1750億個(gè),其訓(xùn)練參數(shù)是GPT-2的10倍以上,技術(shù)路線上則去掉了初代GPT的微調(diào)步驟,直接輸入自然語言當(dāng)作指示,給GPT訓(xùn)練讀過文字和句子后可接續(xù)問題的能力,同時(shí)包含了更為廣泛的主題。2023年OpenAI正式推出GPT-4,支持多模態(tài)且擁有強(qiáng)大的識(shí)圖能力。具體提升有以下幾點(diǎn):參數(shù)數(shù)量和模型規(guī)模。GPT-4的參數(shù)數(shù)量遠(yuǎn)超過GPT-3.5,達(dá)到了1.8萬億模型架構(gòu)和預(yù)訓(xùn)練技術(shù)。GPT-4采用了更加先進(jìn)的架構(gòu)設(shè)計(jì),使用混合訓(xùn)性能和效率。GPT-4在各種NLP任務(wù)上顯示出比GPT-3.5更好的性能,例種數(shù)據(jù)類型,這使得它能夠進(jìn)行更加智能化的自然語言處理任務(wù)。應(yīng)用場(chǎng)景。GPT-4已經(jīng)被廣泛應(yīng)用于各種自然語言處理任務(wù)中,例如文本對(duì)話和指令性任務(wù)處理。GPT-4能夠更好地理解對(duì)話中的上下文,并能夠圖10:GPT經(jīng)過多次升級(jí),目前已經(jīng)能夠滿足更多的內(nèi)容生成GPT-1GPT-1GPT-2GPT-3文字處理單樣本學(xué)習(xí)Meta-Learning容量提升內(nèi)容微調(diào)不再對(duì)內(nèi)容調(diào)整多樣本學(xué)習(xí)多模態(tài)模型效率提升效率提升(訓(xùn)練參數(shù)150億)(訓(xùn)練參數(shù)1750億)資料來源:OpenAI官網(wǎng)、國(guó)元證券經(jīng)紀(jì)(香港)整理表4:GPT4.0在各項(xiàng)功能上有較大突破GPT-3.5GPT-4.0輸出速度較慢有提升,但不明顯分段能力生成幾百字后停止,需要回復(fù)“繼續(xù)”基本連貫答案質(zhì)量滿足基本需求推理、角色能力有極大提升文字限制最多回復(fù)3000字,但幾百字就結(jié)束最多2.5w字圖片能力無輸出圖片對(duì)接互聯(lián)網(wǎng)無可以通過第三方插件輸出最新互聯(lián)網(wǎng)信息連續(xù)對(duì)話能力最大容量8000個(gè)字最大容量64000個(gè)字模型自然語言模型多模態(tài)模型資料來源:OpenAI官網(wǎng)、國(guó)元證券經(jīng)紀(jì)(香港)整理2.2谷歌:Gemini1.5采用MoE架構(gòu)超長(zhǎng)上下文回溯谷歌于2024年2月宣布推出Gemini1.5,它是一種中型多模式模型,針對(duì)多種任務(wù)的擴(kuò)展進(jìn)行了優(yōu)化,其性能水平與迄今為止最大的模型1.0Ultra類似。Gemini1.5還引入了長(zhǎng)上下文理解方面的突破性實(shí)驗(yàn)特征。Gemini1.5建立在谷歌對(duì)Transformer和MoE架構(gòu)的領(lǐng)先研究之上。傳統(tǒng)Transformer充當(dāng)一個(gè)大型神經(jīng)網(wǎng)絡(luò),而MoE模型則分為更小的神經(jīng)網(wǎng)絡(luò)。根據(jù)給定輸入的類型,MoE模型學(xué)會(huì)選擇性地僅激活其神經(jīng)網(wǎng)絡(luò)中最相關(guān)的路徑。人工智能模型“上下文窗口”用于處理信息的構(gòu)建塊,可以是文字、圖像、視頻、音頻或代碼的整個(gè)部分或子部分。模型的上下文窗口越大,它在給定提示中可以接收和處理的信息就越多,從而使其輸出更加一致、相關(guān)和有用。通過一系列機(jī)器學(xué)習(xí)創(chuàng)新,Gemini1.5Pro增加了1.5Pro的上下文窗口容量,Gemini1.5Pro可以在生產(chǎn)環(huán)境中運(yùn)行多達(dá)100萬個(gè)Token,可以一次性處理大量信息,包括1小時(shí)的視頻、11小時(shí)的音頻、超過30,000行代碼或超過70萬個(gè)單詞的代碼庫(kù)。對(duì)上下文長(zhǎng)度限制在128Ktoken,其檢索質(zhì)量隨著上下文長(zhǎng)度的增加而波動(dòng),平均召回率在128Ktoken處約為50%。相比之下,Gemini1.5Pro在128Ktoken時(shí)保持約70%的召回率,在1MToken時(shí)保持超過60%的召回率。圖11:Gemini1.5在超長(zhǎng)冗余信息中依然保持較高召回率0.8-Numberoftokensincontext2024年3月,亞馬遜云科技與Anthropic展開合作,發(fā)布了新一代大語言模型Claude3家族。包括Haiku、Sonnet和Opus按規(guī)模遞增,依次提供越來越強(qiáng)大的性能,為的是讓用戶根據(jù)特定需求在智能、速度和成本間找到最佳平衡。該快速實(shí)時(shí)響應(yīng),視覺能力提升:Claude3旨在為用戶提供更即時(shí)的任務(wù)響應(yīng)。以速度和成本效益見長(zhǎng)的Haiku模型,能在不到三秒的時(shí)間內(nèi)讀完一個(gè)信息和數(shù)據(jù)密集、約1萬tokens、包含圖表和圖形的arXiv研究論文。同提高準(zhǔn)確度:新一代的Opus、Sonnet和Haiku模型在面對(duì)潛在敏大幅降低了錯(cuò)誤拒絕的概率,能更精準(zhǔn)細(xì)膩地理解問題的真實(shí)意圖,有效支持200K超長(zhǎng)上下文:Claude3提供高達(dá)200Ktoken的上下文窗口能力,提供支持100萬token輸入能力。圖12:Claude3號(hào)稱花最少得錢獲取最優(yōu)秀的用戶體驗(yàn)coST3.文字以外的領(lǐng)域同樣在發(fā)生變革3.1繪圖及電影制作應(yīng)用場(chǎng)景不斷拓寬在AI作畫方面,目前技術(shù)水平在突飛猛進(jìn),其背后的算法模型也在不斷迭代,目前已經(jīng)可以生成可以媲美專業(yè)畫師的作品,生成圖片的效率也從的數(shù)小時(shí)到現(xiàn)在的幾分鐘甚至數(shù)十秒。AI繪畫技術(shù)現(xiàn)在可以在一定程度上模擬人類藝術(shù)家的繪畫風(fēng)格和創(chuàng)作理念,產(chǎn)生出多樣化的藝術(shù)作品。隨著技術(shù)的不斷進(jìn)步,AI繪畫的質(zhì)量和效果也將得到進(jìn)一步提升。未來的AI繪畫技術(shù)可能會(huì)更加精準(zhǔn)地模擬人類的審美和感性需求,從而輸出更高質(zhì)量的繪畫作品。同時(shí),AI繪畫還可能具備更強(qiáng)大的學(xué)習(xí)和進(jìn)化能力,能夠不斷學(xué)習(xí)和優(yōu)化自身的繪畫技巧,提供更加多樣化的創(chuàng)作風(fēng)格。AI繪畫技術(shù)不僅可以應(yīng)用于藝術(shù)創(chuàng)作領(lǐng)域,還可以應(yīng)用于設(shè)計(jì)、游戲開發(fā)和教育等領(lǐng)域,提升行業(yè)創(chuàng)新和效率。目前廣泛應(yīng)用于在游戲開發(fā)中,通過AI繪畫技術(shù)可以用于虛擬角色的繪制和場(chǎng)景的渲染,節(jié)省更多人力成本。圖13:AI繪畫已經(jīng)從簡(jiǎn)單生成圖片已經(jīng)進(jìn)化到理解和推理繪畫的內(nèi)容在AI生成影片方面,美國(guó)人工智能研究公司OpenAI發(fā)布的人工智能文生視頻大模型SORA概念視頻上線后引發(fā)市場(chǎng)極大反響,Sora技術(shù)依托于OpenAI開發(fā)的DALL-E3技術(shù)架構(gòu),被賦予“擴(kuò)散變換器”的稱謂,其核心技術(shù)采用了基于潛在擴(kuò)散模型的去噪方法。雖然Sora目前還處于反饋獲取階段,距離商業(yè)化還有一段時(shí)日,但是未來將會(huì)對(duì)很多行業(yè)產(chǎn)生較大的影響。整個(gè)生成的視頻時(shí)長(zhǎng)有明顯提升,,但是Sora可以直接生成60秒視頻內(nèi)容。第二點(diǎn)是盡管對(duì)物理世界規(guī)律的理解上可能還存在小偏差,但總體上呈現(xiàn)出較好的前后一致性。圖14:SORA概念視頻上線,生成內(nèi)容時(shí)長(zhǎng)1分鐘animatedctyckot,alo3.2AI能夠自行通關(guān)游戲,虛擬角色將更擬真由北京智源人工智能研究院、新加坡南洋理工大學(xué)、北京大學(xué)提出通用計(jì)算機(jī)控制GeneralComputerControl(GCC)-Cradle,使智能體不依賴任何內(nèi)部API直接控制鍵盤、鼠標(biāo)和任何軟件交互,無論開源還是閉源,甚至能玩《荒野大鏢客2》這樣的商業(yè)3A游戲大作。我們相信該技術(shù)一旦成熟,未來AI控制虛擬角色來拓展元宇宙將成為現(xiàn)實(shí)。因?yàn)樵钪嬷蠳PC同樣扮演的重要的角色,通過植入更多的能夠控制虛擬角色的AI將能夠極大程度提升元宇宙的體驗(yàn)真實(shí)感,《西部世界》將不再是熒幕上的電視劇,而會(huì)在元宇宙中得以實(shí)圖15:Cradle能直接根據(jù)游戲內(nèi)的提示和教程生成對(duì)應(yīng)的可執(zhí)行代碼Cradle能夠有效地通過反思來發(fā)現(xiàn)并且糾正錯(cuò)誤20游戲和元宇宙正互為解藥加速合體,元宇宙帶來游戲技術(shù)進(jìn)步,游戲幫元宇宙技術(shù)落地。經(jīng)過多年發(fā)展,除了目前類Roblox元宇宙已經(jīng)成功實(shí)現(xiàn)創(chuàng)作生態(tài)、內(nèi)購(gòu)、廣告、電商等盈利模式,我們認(rèn)為未來還有更多的元宇宙游戲類型可以開發(fā),這包括動(dòng)作類、角色扮演類、體育類、社交類。這里面我們認(rèn)為最終的形態(tài)將很有可能會(huì)像日本小說家川原礫著作《刀劍神域》系列那樣,會(huì)有很多個(gè)小的虛擬世界,每個(gè)虛擬世界都有自己的特點(diǎn)和特色(中古世紀(jì)、超現(xiàn)代、魔法世界等),同時(shí)玩家又可以實(shí)現(xiàn)虛擬人物的無縫穿越,擁有虛擬又真博彩我們認(rèn)為未來元宇宙技術(shù)解決了許多博彩公司正面臨的許多挑戰(zhàn),例如如何更好地吸引年輕客戶,并為他們提供更身臨其境的體驗(yàn)。已經(jīng)有開發(fā)商直接將賭桌搬到VR設(shè)備上。在2015年,ALEA推出SlotsMillion,世界上第一個(gè)VR多玩家在線賭場(chǎng),但是體感和畫面仍有較大提升空間,我們認(rèn)為博彩并不只是比牌面大小,而通過觀察對(duì)手的表情、動(dòng)作來贏得博弈的成就感才是博彩最吸引人的地方。同時(shí)由于元宇宙使用的是WEB3.0技術(shù),因此如果在使用結(jié)算我們認(rèn)為未來元宇宙中大部分的社交都會(huì)是場(chǎng)景化的,元宇宙打破了時(shí)間和空間的限制,技術(shù)賦予社交生態(tài)更多的想象空間。可以隨時(shí)去想去的地方。除了與朋友逛街,參加聚會(huì),看電影,旅行,還可以舉辦的聚會(huì),參加類似線下的活動(dòng),人和人的交流將會(huì)在這個(gè)既虛擬又真實(shí)的環(huán)境中更大膽、更開放。我們認(rèn)為一些特定的人群將會(huì)非常樂意沉浸式體驗(yàn)這種新型社交方式,例如LGBT、二次元等具有代表性的群體。算力和

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論