AIGC行業(yè)專(zhuān)題報(bào)告:從AI技術(shù)演進(jìn)看AIGC_第1頁(yè)
AIGC行業(yè)專(zhuān)題報(bào)告:從AI技術(shù)演進(jìn)看AIGC_第2頁(yè)
AIGC行業(yè)專(zhuān)題報(bào)告:從AI技術(shù)演進(jìn)看AIGC_第3頁(yè)
AIGC行業(yè)專(zhuān)題報(bào)告:從AI技術(shù)演進(jìn)看AIGC_第4頁(yè)
AIGC行業(yè)專(zhuān)題報(bào)告:從AI技術(shù)演進(jìn)看AIGC_第5頁(yè)
已閱讀5頁(yè),還剩14頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

AI(人工智能):第四次生產(chǎn)力革命AI(ArtificialIntelligence):1952年,圖靈在《計(jì)算機(jī)械與智能》一文中提到了“圖靈測(cè)試”來(lái)驗(yàn)證機(jī)器是否具有智能:如果一臺(tái)機(jī)器能夠與人類(lèi)展開(kāi)交流,并且有超過(guò)30%的人無(wú)法在規(guī)定時(shí)間內(nèi)識(shí)別出與自己交談的是人還是機(jī)器,那么這臺(tái)機(jī)器可以被認(rèn)為是具有智能的。后來(lái)科技界又提出了其他界定人工智能的標(biāo)準(zhǔn):例如能否實(shí)現(xiàn)語(yǔ)音識(shí)別、機(jī)器翻譯、自動(dòng)寫(xiě)作等等。本報(bào)告中所提及的人工智能技術(shù),不僅包括具有自然語(yǔ)言處理能力、或通過(guò)圖靈測(cè)試的AI技術(shù),還包括有海量數(shù)據(jù)、超復(fù)雜性、要求實(shí)時(shí)性、人類(lèi)智能暫時(shí)無(wú)法處理的機(jī)器智能技術(shù)。AI發(fā)展原動(dòng)力:提效降本,在新一輪技術(shù)革命中搶占先機(jī)微觀(guān):提效降本,科技讓生活更美好從C端用戶(hù)需求來(lái)看,人工智能解決的是與人相關(guān)的娛樂(lè)、出行、健康等生活場(chǎng)景中的痛點(diǎn)。人工智能在C端的應(yīng)用分為兩方面:1)對(duì)原有勞動(dòng)力的替代與生產(chǎn)力效率的提升:如語(yǔ)音識(shí)別、智能客服、機(jī)器翻譯等;2)新增需求的滿(mǎn)足:如“千人千面”的信息分發(fā)(如抖音、快手、小紅書(shū)等)、內(nèi)容生成(AIGC)、人機(jī)交互(如ChatGPT等)、輔助駕駛、安防等。從B端需求來(lái)看,企業(yè)對(duì)于效率的提升需求旺盛,人工智能在金融、公共安全、醫(yī)療健康等領(lǐng)域均取得了較為普遍的應(yīng)用。宏觀(guān):新一輪技術(shù)革命,贏得未來(lái)國(guó)與國(guó)之間科技競(jìng)爭(zhēng)的主動(dòng)權(quán)人工智能有望引領(lǐng)了蒸汽革命、電氣技術(shù)革命以及信息產(chǎn)業(yè)革命之后的第四次生產(chǎn)力革命。1)18世紀(jì)60年代,英國(guó)率先發(fā)展并完成了第一次工業(yè)革命,在隨后的一個(gè)多世界里成為了世界霸主;2)19世紀(jì)60年代,完成了資產(chǎn)階級(jí)革命或改革的美、德、法、日在第二次工業(yè)革命中崛起,使人類(lèi)進(jìn)入“電氣時(shí)代”;3)進(jìn)入20世紀(jì)中葉,以信息技術(shù)、新能源技術(shù)的代表的第三次科技革命在美國(guó)興起,進(jìn)一步強(qiáng)化了美國(guó)的霸主地位。自2006年以來(lái),Hinton提出深度學(xué)習(xí)算法,令機(jī)器在自主學(xué)習(xí)方面有了革命性的突破,同時(shí),伴隨著海量數(shù)據(jù)的積累、GPU、芯片計(jì)算能力的提升,人工智能的三大要素“算法”、“算力”和“數(shù)據(jù)”皆已準(zhǔn)備就緒。2016年,AlphaGo首次擊敗人類(lèi)問(wèn)鼎世界冠軍,人工智能的關(guān)注度急速攀升。而近期人工智能技術(shù)在安防、金融、醫(yī)療、內(nèi)容分發(fā)領(lǐng)域的持續(xù)落地,使AI技術(shù)在提效降本、解放勞動(dòng)力、提升資源配置效率方面的巨大作用得以顯現(xiàn)。我們認(rèn)為,在本輪變革中具有良好技術(shù)沉淀和全面布局的國(guó)家有望搶得科技的主動(dòng)權(quán)。產(chǎn)業(yè)鏈及發(fā)展歷程:三起兩落,數(shù)據(jù)及算力爆發(fā)帶來(lái)新一輪AI發(fā)展機(jī)遇產(chǎn)業(yè)鏈:基礎(chǔ)層+技術(shù)層+應(yīng)用層總體來(lái)看,人工智能產(chǎn)業(yè)鏈可分為基礎(chǔ)支撐層、技術(shù)層和應(yīng)用層?;A(chǔ)層提供算力,主要包含人工智能芯片、傳感器、大數(shù)據(jù)及云計(jì)算。其中,芯片具有極高的技術(shù)門(mén)檻,且生態(tài)搭建已基本成型。目前該層級(jí)的主要布局玩家為Nvidia、AMD、英特爾等在內(nèi)的國(guó)際科技巨頭,國(guó)內(nèi)在基礎(chǔ)層的布局和實(shí)力均相對(duì)薄弱。技術(shù)層主要解決具體類(lèi)別問(wèn)題,這一層級(jí)主要依托運(yùn)算平臺(tái)和數(shù)據(jù)資源進(jìn)行海量識(shí)別訓(xùn)練和機(jī)器學(xué)習(xí)建模,開(kāi)發(fā)面向不同領(lǐng)域的應(yīng)用技術(shù),包括語(yǔ)音識(shí)別、自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)技術(shù)等??萍季揞^谷歌、IBM、亞馬遜、蘋(píng)果、阿里巴巴、百度都在該層級(jí)深度布局,并涌現(xiàn)了如商湯科技、曠世科技、科大訊飛等諸多獨(dú)角獸公司。應(yīng)用層主要解決場(chǎng)景落地問(wèn)題,利用AI技術(shù)針對(duì)行業(yè)提供產(chǎn)品、服務(wù)和解決方案,其核心是商業(yè)化。得益于人工智能的全球開(kāi)源社區(qū),應(yīng)用層的進(jìn)入門(mén)檻相對(duì)較低,但也是商業(yè)價(jià)值最大的環(huán)節(jié)(典型如算法推動(dòng)在抖音、快手等應(yīng)用端落地)。發(fā)展歷程:60年三起兩落,呈螺旋式發(fā)展回顧人工智能技術(shù)的發(fā)展歷程,我們發(fā)現(xiàn),人工智能所經(jīng)歷的三次興起浪潮均源于底層算法的革命性進(jìn)展,而前兩輪的衰落是由于數(shù)據(jù)處理性能及底層算法的局限,使AI技術(shù)從成熟度以及商業(yè)可行性上無(wú)法落地。2006年,Hinton提出顛覆性的深度學(xué)習(xí)算法,使得AI產(chǎn)業(yè)邁出關(guān)鍵性一步:利用多層神經(jīng)網(wǎng)絡(luò),將人類(lèi)從復(fù)雜的算法歸納中解放出來(lái),只要給予機(jī)器足夠多的數(shù)據(jù),便能使其自動(dòng)歸納出算法,疊加底層算力GPU的不斷發(fā)展及互聯(lián)網(wǎng)時(shí)代海量數(shù)據(jù)的積累,人工智三駕馬車(chē):算法、算力和數(shù)據(jù)皆已準(zhǔn)備就緒,使AI技術(shù)徹底走出實(shí)驗(yàn)室,逐步滲透進(jìn)各個(gè)行業(yè)和場(chǎng)景。第一輪:興于感知神經(jīng)網(wǎng)絡(luò),終于計(jì)算機(jī)性能約束興起:1956年達(dá)特茅斯會(huì)議開(kāi)啟了人工智能的元年,僅在定理層次等證明了AI商用的可能性,實(shí)際應(yīng)用還十分有限。1956年,以約翰·麥卡錫、馬文·明斯基、克勞德·香農(nóng)等為代表的科學(xué)家們?cè)谶_(dá)特茅斯組織了一場(chǎng)為期兩個(gè)月的人工智能夏季研討會(huì),探討如何通過(guò)機(jī)器模擬人類(lèi)學(xué)習(xí)或人類(lèi)智能的其他特征。本次會(huì)議結(jié)束后,很多國(guó)家政府、研究機(jī)構(gòu)、軍方等都開(kāi)始投資人工智能,掀起了第一波人工智能熱潮。在第一波AI的浪潮中,占據(jù)主導(dǎo)地位的思想是邏輯主義,即通過(guò)引入符號(hào)方法進(jìn)行語(yǔ)義處理、將待研究和解決的問(wèn)題轉(zhuǎn)化為可以用計(jì)算機(jī)處理的符號(hào),運(yùn)用邏輯公理進(jìn)行解答,從而實(shí)現(xiàn)人機(jī)互動(dòng)。第一波人工智能浪潮的總體成就有限,僅在定理證明等特定領(lǐng)域取得了成功。受制于計(jì)算機(jī)性能及可獲取的數(shù)據(jù)量,當(dāng)時(shí)的人工智能只能完成玩具式的簡(jiǎn)單任務(wù),在語(yǔ)音、圖像識(shí)別及想起游戲等看似簡(jiǎn)單的任務(wù)上,進(jìn)展都十分有限。衰落:計(jì)算機(jī)的性能制約了早期程序的應(yīng)用,人工智能的發(fā)展首次預(yù)冷。受限于計(jì)算機(jī)的處理性能,當(dāng)時(shí)其所能處理的程序?qū)ο笊偾覐?fù)雜度低,機(jī)器無(wú)法讀取足夠的數(shù)據(jù)實(shí)現(xiàn)智能化,AI自然無(wú)法大規(guī)模落地商用。1973年,學(xué)者萊特希爾發(fā)表了一份具有影響力的評(píng)估報(bào)告《人工智能:一般性的考察》,報(bào)告指出:“迄今為止,人工智能沒(méi)有在任何領(lǐng)域發(fā)生之前預(yù)想的重大影響,人工智能的投入是金錢(qián)的浪費(fèi)”,該報(bào)告發(fā)表后,英國(guó)政府隨后終止了對(duì)愛(ài)丁堡等幾所高效的人工智能項(xiàng)目的支持。到70年代中期,美國(guó)和其他國(guó)家在該領(lǐng)域的投入也大幅度削減,人工智能發(fā)展進(jìn)入寒冬。第二輪:興于BP神經(jīng)網(wǎng)絡(luò),終于專(zhuān)家系統(tǒng)失敗興起:1980年代,Hopfield神經(jīng)網(wǎng)絡(luò)和BT訓(xùn)練算法的提出,使基于AI技術(shù)的專(zhuān)家系統(tǒng)首次得以商用。Hopfield神經(jīng)網(wǎng)絡(luò)是通過(guò)對(duì)動(dòng)物或人腦的基本單元一神經(jīng)元建模和連接,探索模擬動(dòng)物或人腦神經(jīng)系統(tǒng)的學(xué)習(xí)、聯(lián)想、記憶和模式識(shí)別等功能的人工模型?;谠撃P?,IBM等公司開(kāi)發(fā)出了一系列用于模擬專(zhuān)家決策的專(zhuān)家系統(tǒng),使人工智能第一次實(shí)現(xiàn)商業(yè)化落地。衰落:算法局限使計(jì)算結(jié)遭遇瓶頸,人工智能由于實(shí)際商用成本過(guò)高再次衰落。專(zhuān)家系統(tǒng)的維護(hù)成本極高,但神經(jīng)元網(wǎng)絡(luò)只能解決單一問(wèn)題,數(shù)據(jù)量積累到一定程度后,計(jì)算結(jié)果便不再改進(jìn),實(shí)際應(yīng)用價(jià)值有限。1987年,蘋(píng)果和IBM生產(chǎn)的臺(tái)式機(jī)性能超過(guò)了由Symbolics等廠(chǎng)商生產(chǎn)的通用計(jì)算機(jī),專(zhuān)家系統(tǒng)逐漸淘汰。第三輪:興于深度學(xué)習(xí)算法,強(qiáng)于數(shù)據(jù)及算力興起:2006年,Hinton提出了神經(jīng)網(wǎng)絡(luò)DeepLearning算法,將人類(lèi)從復(fù)雜的算法歸納中解放了出來(lái),使人工智能再一次聚焦了學(xué)術(shù)界和產(chǎn)業(yè)界的目光。從底層算法來(lái)講,深度學(xué)習(xí)算法彌補(bǔ)了傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)的缺陷:1)多隱層的人工神經(jīng)網(wǎng)絡(luò)具有優(yōu)異的特征學(xué)習(xí)能力,從而有利于可視化或分類(lèi);2)傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)的訓(xùn)練難度可以通過(guò)“逐層初始化”來(lái)克服。通俗來(lái)講,本輪算法的革命性進(jìn)步在于:不需要人工去提取規(guī)則特征,機(jī)器通過(guò)海量數(shù)據(jù),即可自動(dòng)實(shí)現(xiàn)規(guī)則的特征提取,將最復(fù)雜的“算法歸納”留給機(jī)器去完成。數(shù)據(jù)顯示,自2012年在圖像識(shí)別領(lǐng)域引入深度學(xué)習(xí)算法以來(lái),圖像識(shí)別的錯(cuò)誤率顯著降低。并通過(guò)深度學(xué)習(xí)訓(xùn)練層數(shù)的增長(zhǎng)及優(yōu)化,在2015年通過(guò)ResNet模型使圖像識(shí)別的精度超過(guò)了人眼可達(dá)的精度。強(qiáng)化:底層算力的高速發(fā)展及多維數(shù)據(jù)的快速積累,使本輪人工智能得以爆發(fā)。計(jì)算機(jī)硬件設(shè)施的發(fā)展,如GPU(圖形處理器)、TPU(張量處理器)等新一代芯片及FPGA(現(xiàn)場(chǎng)可編程門(mén)陳列)異構(gòu)計(jì)算服務(wù)器提供了足夠的計(jì)算力,能夠支持人工智能算法的原型。數(shù)據(jù)的可獲得性和質(zhì)量在這一時(shí)期得到了極大的改善,互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等產(chǎn)業(yè)的發(fā)展也為人工智能提供了規(guī)??涨暗挠?xùn)練數(shù)據(jù)。人工智能三大要素:“算法、算力和數(shù)據(jù)”的準(zhǔn)備就緒,使人工智能快速滲透到各產(chǎn)業(yè)中,如安防、金融、醫(yī)療、文娛等。人工智能:技術(shù)流派及我們所處的階段技術(shù)演進(jìn):行為主義+連接主義,誕生深度學(xué)習(xí)技術(shù)AI的技術(shù)流派經(jīng)歷了符號(hào)主義、連接主義和行為主義,在行為主義思想中引入了連接主義的技術(shù),誕生本輪的深度強(qiáng)化學(xué)習(xí)技術(shù)。符號(hào)主義符號(hào)主義又稱(chēng)為邏輯主義,在人工智能早期一直占據(jù)主導(dǎo)地位。該學(xué)派認(rèn)為人工智能源于數(shù)學(xué)邏輯,其實(shí)質(zhì)是模擬人的抽象邏輯思維,用符號(hào)描述人類(lèi)的認(rèn)知過(guò)程。早期的研究思路是通過(guò)基本的推斷步驟尋求完全解,出現(xiàn)了邏輯理論家和幾何定理證明器等。上世紀(jì)70年代出現(xiàn)了大量的專(zhuān)家系統(tǒng),結(jié)合了領(lǐng)域知識(shí)和邏輯推斷,使得人工智能進(jìn)入了工程應(yīng)用。PC機(jī)的出現(xiàn)以及專(zhuān)家系統(tǒng)高昂的成本,使符號(hào)學(xué)派在人工智能領(lǐng)域的主導(dǎo)地位逐漸被連接主義取代。連接主義連接主義又稱(chēng)為仿生學(xué)派,當(dāng)前占據(jù)主導(dǎo)地位。該學(xué)派認(rèn)為人工智能源于仿生學(xué),應(yīng)以工程技術(shù)手段模擬人腦神經(jīng)系統(tǒng)的結(jié)構(gòu)和功能。連接主義最早可追溯到1943年麥卡洛克和皮茨創(chuàng)立的腦模型,由于受理論模型、生物原型和技術(shù)條件的限制,在20世紀(jì)70年代陷入低潮。行為主義行為主義又稱(chēng)為進(jìn)化主義,近年來(lái)隨著AlphaGo取得的突破而受到廣泛關(guān)注。該學(xué)派認(rèn)為人工智能源于控制論,智能行為的基礎(chǔ)是“感知—行動(dòng)”的反應(yīng)機(jī)制,所以智能無(wú)需知識(shí)表示,無(wú)需推斷。智能只是在與環(huán)境交互作用中表現(xiàn)出來(lái),需要具有不同的行為模塊與環(huán)境交互,以此來(lái)產(chǎn)生復(fù)雜的行為。在人工智能的發(fā)展過(guò)程中,符號(hào)主義、連接主義和行為主義等流派不僅先后在各自領(lǐng)域取得了成果,各學(xué)派也逐漸走向了相互借鑒和融合發(fā)展的道路。特別是在行為主義思想中引入連接主義的技術(shù),從而誕生了深度強(qiáng)化學(xué)習(xí)技術(shù),成為AlphaGo戰(zhàn)勝李世石背后最重要的技術(shù)手段。技術(shù)現(xiàn)狀:深度學(xué)習(xí)技術(shù)帶動(dòng)本輪人工智能發(fā)展人工智能算法經(jīng)歷了“既定規(guī)則系統(tǒng)”、“淺層學(xué)習(xí)算法”和“深度學(xué)習(xí)算法”三個(gè)階段,其中,深度學(xué)習(xí)算法徹底將人類(lèi)從復(fù)雜的算法抽象中解放了出來(lái),用深度神經(jīng)網(wǎng)絡(luò)+海量數(shù)據(jù)打破了計(jì)算準(zhǔn)確度的瓶頸,帶動(dòng)了本輪人工智能的爆發(fā)。人工智能算法所經(jīng)歷的三大階段及實(shí)現(xiàn)過(guò)程如下:1)既定規(guī)則系統(tǒng)及其實(shí)現(xiàn)過(guò)程既定規(guī)則系統(tǒng)尚不屬于“機(jī)器學(xué)習(xí)”的范圍,其背后的關(guān)系為人力搭建算法的邏輯關(guān)系。面對(duì)待處理的問(wèn)題,由人提取出問(wèn)題特征、再由人設(shè)定好算法規(guī)則,交由機(jī)器進(jìn)行運(yùn)行。例如,判斷某幅圖片是否為猴子,既定規(guī)則系統(tǒng)執(zhí)行過(guò)程如下:1)人為提取猴子各部分像素特征;2)人為設(shè)定猴子判定規(guī)則,如眼睛、鼻子、嘴巴等部位的像素應(yīng)分別位于哪一區(qū)間內(nèi);3)機(jī)器根據(jù)讀取到的像素及判定規(guī)則,計(jì)算當(dāng)前圖片是否為猴子,輸出結(jié)果“是”或“否”。2)傳統(tǒng)機(jī)器學(xué)習(xí)算法及實(shí)現(xiàn)過(guò)程傳統(tǒng)機(jī)器學(xué)習(xí)算法徹底將人類(lèi)從復(fù)雜的算法抽象中解放了出來(lái),但對(duì)復(fù)雜數(shù)據(jù)的處理受到明顯制約。簡(jiǎn)單來(lái)說(shuō),機(jī)器學(xué)習(xí)是一種實(shí)現(xiàn)人工智能的方法,深度學(xué)習(xí)算法是實(shí)現(xiàn)機(jī)器學(xué)習(xí)的技術(shù)。傳統(tǒng)機(jī)器學(xué)習(xí)算法又稱(chēng)淺層算法,這類(lèi)算法如反向傳播算法(BP算法)、支持向量機(jī)(SVM)、Boosting等,局限性在于對(duì)有限樣本和計(jì)算單元的情況下對(duì)復(fù)雜函數(shù)的表示能力有限,對(duì)復(fù)雜數(shù)據(jù)的處理受到制約。例如,在圖像識(shí)別領(lǐng)域,淺層學(xué)習(xí)的識(shí)別準(zhǔn)確率較低,主要原因?yàn)樵撍惴ǖ奶幚磉壿嬈驕\層,不能窮舉復(fù)雜的情景,在準(zhǔn)確率達(dá)到一定程度后,即使再投入更多數(shù)據(jù),準(zhǔn)確率依然無(wú)法提升。如判斷某幅圖片是否為猴子,傳統(tǒng)機(jī)器學(xué)習(xí)算法執(zhí)行過(guò)程如下:1)人為提取猴子各部分像素特征;2)機(jī)器自動(dòng)歸納猴子的判定規(guī)則,如眼睛、鼻子、嘴巴等部位的像素應(yīng)分別位于哪一區(qū)間內(nèi);3)機(jī)器根據(jù)讀取到的像素及判定規(guī)則,計(jì)算當(dāng)前圖片是否為猴子,輸出結(jié)果“是”或“否”。3)深度學(xué)習(xí)算法及實(shí)現(xiàn)過(guò)程深度學(xué)習(xí)與傳統(tǒng)的機(jī)器學(xué)習(xí)最主要的區(qū)別在于:隨著數(shù)據(jù)規(guī)模的增加,其判斷準(zhǔn)確度也在不斷增長(zhǎng)。判斷準(zhǔn)確度的提升,使人工智能技術(shù)可大規(guī)模應(yīng)用于語(yǔ)音識(shí)別、圖像識(shí)別等多個(gè)領(lǐng)域。2006年,Hinton提出深度學(xué)習(xí)算法,該算法與傳統(tǒng)的機(jī)器學(xué)習(xí)算法最大的區(qū)別在于隨著數(shù)據(jù)規(guī)模的增加,算法計(jì)算準(zhǔn)確率也不斷增長(zhǎng)。當(dāng)數(shù)據(jù)很少時(shí),深度學(xué)習(xí)算法的性能并不突出,隨著數(shù)據(jù)量的增加,其優(yōu)越性得以體現(xiàn)。傳統(tǒng)機(jī)器學(xué)習(xí)算法,在擬合度達(dá)到某一特定值后,再增加數(shù)據(jù)量,其擬合度不再提升;深度學(xué)習(xí)算法擬合準(zhǔn)確度隨著數(shù)據(jù)量及神經(jīng)網(wǎng)絡(luò)層數(shù)的增加而提升。例如,在引入深度學(xué)習(xí)之前,語(yǔ)音識(shí)別的準(zhǔn)確率連續(xù)三年穩(wěn)定在76.4%,引入該算法后,其準(zhǔn)確率逐年遞增,2017年已達(dá)94.5%。如判斷某幅圖片是否為猴子,深度學(xué)習(xí)算法的執(zhí)行過(guò)程如下:人為將海量帶有標(biāo)簽的圖像數(shù)據(jù)到計(jì)算機(jī)中,無(wú)需進(jìn)行任何特征提取或規(guī)則設(shè)定,算法自動(dòng)根據(jù)輸入圖像的特征歸納出判定規(guī)則,并泛化至后續(xù)判斷過(guò)程中。實(shí)現(xiàn)要素:海量數(shù)據(jù)及高效算力是深度學(xué)習(xí)實(shí)現(xiàn)基礎(chǔ)海量數(shù)據(jù)及高效算力是深度學(xué)習(xí)實(shí)現(xiàn)基礎(chǔ)。深度學(xué)習(xí)全稱(chēng)深度神經(jīng)網(wǎng)絡(luò),本質(zhì)上是多層次的人工神經(jīng)網(wǎng)絡(luò)算法,即從結(jié)構(gòu)上模擬人腦的運(yùn)行機(jī)制,從最基本的單元上模擬了人類(lèi)大腦的運(yùn)行機(jī)制。算法的實(shí)現(xiàn)過(guò)程分為訓(xùn)練和推斷兩個(gè)階段。訓(xùn)練階段需要海量數(shù)據(jù)輸入,訓(xùn)練出一個(gè)復(fù)雜的深度神經(jīng)網(wǎng)絡(luò)模型。推斷指利用訓(xùn)練好的模型,使用待判斷的數(shù)據(jù)去“推斷”得出各種結(jié)論。大數(shù)據(jù)時(shí)代的到來(lái),圖形處理器(GraphicsProcessingUnit,GPU)等各種更加強(qiáng)大的計(jì)算設(shè)備的發(fā)展,使得深度學(xué)習(xí)可以充分利用海量數(shù)據(jù)(標(biāo)注數(shù)據(jù)、弱標(biāo)注數(shù)據(jù)或無(wú)標(biāo)注數(shù)據(jù)),自動(dòng)地學(xué)習(xí)到抽象的知識(shí)表達(dá),即把原始數(shù)據(jù)濃縮成某種知識(shí)。簡(jiǎn)單來(lái)說(shuō),在深度學(xué)習(xí)算法的基礎(chǔ)上,海量數(shù)據(jù)解決了計(jì)算精準(zhǔn)度的問(wèn)題,算力的提升解決了計(jì)算速度的問(wèn)題。所處時(shí)代:基于統(tǒng)計(jì)規(guī)律的弱人工智能時(shí)代,但商業(yè)化價(jià)值已經(jīng)展現(xiàn)人工智能的分類(lèi)標(biāo)準(zhǔn)及定義李開(kāi)復(fù)及王詠剛在《人工智能》一書(shū)中,將人工智能按照智能程度的強(qiáng)弱,劃分為:弱人工智能(ArtificialNarrowIntelligence,簡(jiǎn)稱(chēng)ANI)、強(qiáng)人工智能(ArtificialGeneralIntelligence,簡(jiǎn)稱(chēng)AGI)和超人工智能(ArtificialSuperintelligence,簡(jiǎn)稱(chēng)ASI)三個(gè)層次。弱人工智能(ANI)也稱(chēng)為限制領(lǐng)域人工智能或應(yīng)用型人工智能,本質(zhì)上是某個(gè)特定領(lǐng)域內(nèi)基于統(tǒng)計(jì)規(guī)律的大數(shù)據(jù)處理者。通俗來(lái)講,弱人工智能只專(zhuān)注于完成某個(gè)特定的任務(wù),例如語(yǔ)音識(shí)別、圖像識(shí)別和翻譯,是擅長(zhǎng)單個(gè)方面的人工智能,類(lèi)似高級(jí)仿生學(xué)。該階段的AI技術(shù)是為了解決特定具體類(lèi)的任務(wù)問(wèn)題而存在,底層原理是從海量數(shù)據(jù)中從中歸納出模型,再泛化至新的數(shù)據(jù)中進(jìn)行正向運(yùn)算。例如,谷歌的AlphaGo和AlphaGoZero就是典型“弱人工智能”,盡管它們能夠戰(zhàn)勝象棋領(lǐng)域的世界級(jí)冠軍,但也僅限于擅長(zhǎng)于單個(gè)游戲領(lǐng)域的人工智能。強(qiáng)人工智能(AGI)是人類(lèi)級(jí)別的人工智能,擁有獨(dú)立思想和意識(shí),在各方面均能與人類(lèi)媲美。擁有AGI的機(jī)器不僅是一種工具,其本身可擁有“思維”,能夠進(jìn)行獨(dú)立的思考、計(jì)劃、解決問(wèn)題、抽象思維、理解復(fù)雜理念、快速學(xué)習(xí)等,可實(shí)現(xiàn)“全面仿人性”,在智力水平和行動(dòng)能力方面與人類(lèi)基本沒(méi)有差別,目前只存在于電影及人類(lèi)想象中。超人工智能:假設(shè)計(jì)算機(jī)程序通過(guò)不斷發(fā)展,智力水平可以超越人類(lèi),則由此產(chǎn)生的人工智能系統(tǒng)就可以被稱(chēng)為超人工智能。在人工智能的三個(gè)層級(jí)中,超人工智能的定義最為模糊,目前還沒(méi)有精準(zhǔn)預(yù)測(cè)能夠說(shuō)明超越人類(lèi)最高水平的智慧到底會(huì)表現(xiàn)為何種能力。對(duì)于超人工智能,目前只能從哲學(xué)或科幻的角度加以想象。當(dāng)前人工智能現(xiàn)狀:基于統(tǒng)計(jì)規(guī)律的弱AI時(shí)代當(dāng)前人工智能尚屬于“弱人工智能”階段。按照人工智能的執(zhí)行深度,我們將人工智能的判定層次分為計(jì)算智能、感知智能和認(rèn)知智能三個(gè)層次:1)計(jì)算智能:神經(jīng)網(wǎng)絡(luò)和遺傳算法的出現(xiàn),使機(jī)器能夠高效、快速地處理海量數(shù)據(jù),目前該技術(shù)的應(yīng)用已相當(dāng)成熟;2)感知智能:技術(shù)已相對(duì)成熟,典型應(yīng)用語(yǔ)音識(shí)別及人臉識(shí)別,準(zhǔn)確率分別超過(guò)98%和99%;3)認(rèn)知智能:還有較大提升空間,典型應(yīng)用包括機(jī)器翻譯和計(jì)算機(jī)視覺(jué)認(rèn)知,這兩項(xiàng)技術(shù)與人力還有較大差距。通過(guò)以上對(duì)三個(gè)層級(jí)的分析,我們判斷:人工智能技術(shù)尚不具備完全“認(rèn)知”能力,處于垂直領(lǐng)域的應(yīng)用投入商用、自主認(rèn)知尚待攻克的“弱人工智能”階段?!叭跞斯ぶ悄堋彼鶐?lái)的收效依然十分可觀(guān)弱人工智能在特定領(lǐng)域的表現(xiàn)均超過(guò)人類(lèi),多種勞動(dòng)密集型工作均具有較強(qiáng)自動(dòng)化潛力。2017年10月,AlphaGo的升級(jí)版本實(shí)現(xiàn)了不通過(guò)向人類(lèi)學(xué)習(xí),只通過(guò)概率計(jì)算和自學(xué)自練就達(dá)成自我超越、戰(zhàn)勝李世石的初代AlphaGo。由IBM開(kāi)發(fā)人工智能Waston,使用機(jī)器學(xué)習(xí)來(lái)分析和解讀海量醫(yī)療數(shù)據(jù)和文獻(xiàn),檢查患者數(shù)據(jù)做出治療決定,印度班加羅爾研究表明,Waston與醫(yī)生在提供肺癌、結(jié)腸癌和直腸癌治療建議方面一致性比例分別高達(dá)96%、81%和93%。微軟公司的人工智能虛擬機(jī)器人小冰,學(xué)習(xí)了20世紀(jì)20年代以來(lái)519位詩(shī)人的現(xiàn)代詩(shī),自2017年2月起,“小冰”在天涯、豆瓣、貼吧、簡(jiǎn)書(shū)四個(gè)平臺(tái)上使用了27個(gè)化名發(fā)表的詩(shī)歌作品,幾乎沒(méi)有被發(fā)現(xiàn)是機(jī)器所作。不僅如此,人工智能在交通、教育、金融領(lǐng)域也展示出了巨大的應(yīng)用前景。與人類(lèi)相比,人工智能在數(shù)據(jù)存儲(chǔ)、調(diào)用、分析處理方面的強(qiáng)大能力,以及在特定危險(xiǎn)情境下的生存能力,都有望為人類(lèi)生活帶來(lái)巨大顛覆。麥肯錫報(bào)告表明,多種人力勞動(dòng)密集、機(jī)械類(lèi)工作都具有較強(qiáng)的自動(dòng)化潛力,住宿和餐飲服務(wù)、制造、交通和倉(cāng)儲(chǔ)等職業(yè)自動(dòng)化潛力巨大。2020年,弱人工智能為全球GDP帶來(lái)14%的提升。人工智能將提升社區(qū)勞動(dòng)生產(chǎn)率,特別是在有效降低勞動(dòng)成本、優(yōu)化產(chǎn)品和服務(wù)、創(chuàng)造新市場(chǎng)和就業(yè)等方面,將為人類(lèi)的生產(chǎn)和生活帶來(lái)革命性的轉(zhuǎn)變。據(jù)Sage預(yù)測(cè),2020年,人工智能的出現(xiàn)將為全球GDP帶來(lái)14%的提升,相當(dāng)于15.7萬(wàn)億美元的增長(zhǎng)。根據(jù)世界銀行及產(chǎn)新智庫(kù)的分析,人工智能作為當(dāng)下最先進(jìn)生產(chǎn)力,如果能為制造業(yè)提高1%的效率,全球制造業(yè)便會(huì)節(jié)約3000億美元。再細(xì)分到各個(gè)產(chǎn)業(yè),為航空提高1%的效率相當(dāng)于300億美元,為電力提高1%的效率相當(dāng)于660億美元,為醫(yī)療系統(tǒng)效率提高1%相當(dāng)于630億美元,為鐵路系統(tǒng)效率提高1%相當(dāng)于270億美元,為石油天然氣資本支出降低1%相當(dāng)于900億美元。綜上,截至2025年,人工智能可能影響32萬(wàn)億美元的全球制造業(yè)領(lǐng)域,相當(dāng)于將影響全球50%的經(jīng)濟(jì)。萬(wàn)事俱備,人工智能場(chǎng)景應(yīng)用有望全面爆發(fā)相比于前兩輪的AI浪潮,我們認(rèn)為本輪人工智能應(yīng)用將全面爆發(fā)的原因如下:1)深度學(xué)習(xí)算法的革命性顛覆,使“數(shù)據(jù)量”成為決定擬合結(jié)果的核心要素:在本輪深度學(xué)習(xí)算法出現(xiàn)前,AI的主要算法是BP、SVM等淺層算法,由于其處理邏輯停留在淺層,即使在擁有海量數(shù)據(jù)的情況下,擬合結(jié)果的準(zhǔn)確率在提升至某一瓶頸后便無(wú)法提升,人工智能難以處理復(fù)雜的問(wèn)題。深度學(xué)習(xí)算法得益于多層神經(jīng)網(wǎng)絡(luò),可直接用海量數(shù)據(jù)“暴力破解”出計(jì)算算法,數(shù)據(jù)量越高,擬合精準(zhǔn)度越高。這說(shuō)明只要具備充足的數(shù)據(jù)和算力,便能快速訓(xùn)練出精準(zhǔn)的算法,這使得決定人工智能準(zhǔn)確度的核心由“算法”轉(zhuǎn)變?yōu)椤皵?shù)據(jù)和算力”;2)海量多維數(shù)據(jù)及GPU算力已準(zhǔn)備就緒,為算法運(yùn)行提供充足“燃料”和“引擎”:互聯(lián)網(wǎng)使海量數(shù)據(jù)積累成為可能,而GPU的出現(xiàn),滿(mǎn)足了機(jī)器學(xué)習(xí)大規(guī)模并行計(jì)算要求。至此,人工智能的三駕馬車(chē)“算法、算力、數(shù)據(jù)”皆已準(zhǔn)備就緒;3)開(kāi)源框架大幅降低了AI的使用門(mén)檻;4)政策及資本的助力:AI被廣泛認(rèn)為人類(lèi)歷史上第四次工業(yè)革命,美國(guó)、中國(guó)等科技大國(guó)均將其提升至頂層戰(zhàn)略高度,加之資本注入及催化,“弱人工智能”的商用已廣泛落地。資源層:數(shù)據(jù)及算力的大幅提升將AI推向浪潮之巔互聯(lián)網(wǎng)及數(shù)字經(jīng)濟(jì)的快速發(fā)展,為AI算法訓(xùn)練提供充裕的數(shù)據(jù)來(lái)源。人工智能領(lǐng)域頂級(jí)專(zhuān)家吳恩達(dá)曾提到:發(fā)展人工智能就像用火箭發(fā)射衛(wèi)星,需要強(qiáng)大的引擎和足夠的燃料,算法模型就是其引擎,高性能的算力是打造引擎的工具,海量的數(shù)據(jù)就是引擎的燃料。基于深度學(xué)習(xí)的算法特點(diǎn),其計(jì)算準(zhǔn)確度與數(shù)據(jù)量基本成正比。例如,在輸入30萬(wàn)張人類(lèi)對(duì)弈棋譜并經(jīng)過(guò)3000萬(wàn)次自我對(duì)弈后,人工智能AlphaGo具備了媲美頂尖棋手的棋力。當(dāng)前,機(jī)器學(xué)習(xí)所能應(yīng)用的數(shù)據(jù)已經(jīng)不局限于文本、數(shù)字等結(jié)構(gòu)化數(shù)據(jù),還包括視頻、音頻、圖片等非結(jié)構(gòu)化數(shù)據(jù)。而根據(jù)IDC的統(tǒng)計(jì)數(shù)據(jù),2021年全球數(shù)據(jù)量已經(jīng)達(dá)到82ZB,預(yù)計(jì)到2026年將達(dá)到214ZB。GPU的發(fā)展解決了深度學(xué)習(xí)的訓(xùn)練速度和相應(yīng)的成本問(wèn)題。1)英偉達(dá)于2016年推出P100,2017年推出V100,2020年推出A100,4年間從P100至A100英偉達(dá)GPU芯片高性能計(jì)算能力提升11倍。2022年英偉達(dá)持續(xù)迭代推出H100,其最新的H100芯片在A100的基礎(chǔ)上將訓(xùn)練表現(xiàn)提升9倍;2)算力芯片的快速迭代使得提升AI模型訓(xùn)練速度和下游用戶(hù)體驗(yàn),同時(shí)基于摩爾定律的算力提升也使得單位算力開(kāi)銷(xiāo)持續(xù)下降,從技術(shù)成熟度和商業(yè)化成本兩端加速AI技術(shù)走向普及。技術(shù)環(huán)境:開(kāi)源框架大幅降低開(kāi)發(fā)門(mén)檻各巨頭在2016年紛紛創(chuàng)立AI開(kāi)源的開(kāi)發(fā)框架,人工智能的開(kāi)發(fā)框架是底層硬件與上層軟件之間的紐帶,可以視作人工智能進(jìn)行開(kāi)發(fā)和應(yīng)用的“操作系統(tǒng)”。以往的專(zhuān)家系統(tǒng)是基于本地化專(zhuān)業(yè)知識(shí)進(jìn)行運(yùn)算,以知識(shí)庫(kù)和推理機(jī)為中心進(jìn)行展開(kāi),推理機(jī)設(shè)計(jì)內(nèi)容由不同的專(zhuān)家系統(tǒng)應(yīng)用環(huán)境決定,不具備通用性。同時(shí),知識(shí)庫(kù)是開(kāi)發(fā)者收集錄入的專(zhuān)家分析模型與案例的資源集合,只能在單機(jī)系統(tǒng)環(huán)境下使用且無(wú)法連接網(wǎng)絡(luò),升級(jí)更新不便。企業(yè)的軟件框架實(shí)現(xiàn)有閉源和開(kāi)源兩種形式,少數(shù)企業(yè)選擇閉源方式開(kāi)發(fā)軟件框架,目的是打造技術(shù)壁壘;目前,業(yè)內(nèi)主流軟件框架基本都是基于開(kāi)源化運(yùn)營(yíng),如谷歌的TensorFlow、臉書(shū)的Torchnet、微軟的DMTK、IBM的SystemML、三星的VELES等,均具有分布式深度學(xué)習(xí)數(shù)據(jù)庫(kù)和商業(yè)級(jí)即插即用功能。外部環(huán)境:政策助力,人工智能迎來(lái)發(fā)展良機(jī)中國(guó)密集出臺(tái)人工智能相關(guān)政策,并將AI上升至國(guó)家戰(zhàn)略,力求在下一輪工業(yè)革命中搶占先機(jī)。自2015年以來(lái),國(guó)內(nèi)不斷出臺(tái)推動(dòng)人工智能發(fā)展的鼓勵(lì)政策,包括:1)建立人工智能促進(jìn)機(jī)制;2)為人工智能提供近支持,包括稅收優(yōu)惠、財(cái)政扶持及制定金融政策等;3)推動(dòng)創(chuàng)新,包括促進(jìn)產(chǎn)業(yè)集群,布局創(chuàng)新基地,鼓勵(lì)人才培養(yǎng);4)政府制定規(guī)制與保障措施等?!缎乱淮斯ぶ悄馨l(fā)展規(guī)劃》提出了“三步走”戰(zhàn)略目標(biāo),加速AI再各行業(yè)滲透落地。第一步,到2020年,人工智能總體技術(shù)和應(yīng)用與世界先進(jìn)水平同步,人工智能產(chǎn)業(yè)成為新的重要經(jīng)濟(jì)增長(zhǎng)點(diǎn),核心產(chǎn)業(yè)規(guī)模超過(guò)1500億元,帶動(dòng)相關(guān)產(chǎn)業(yè)規(guī)模超過(guò)1萬(wàn)億元;第二步,到2025年,新一代人工智能在智能制造、智能醫(yī)療、智慧城市、智能農(nóng)業(yè)、國(guó)防建設(shè)等領(lǐng)域得到廣泛應(yīng)用,核心產(chǎn)業(yè)規(guī)模超過(guò)4000億元,相關(guān)產(chǎn)業(yè)規(guī)模超過(guò)5萬(wàn)億元;第三步,到2030年,人工智能理論、技術(shù)與應(yīng)用總體達(dá)到世界領(lǐng)先水平,形成涵蓋核心技術(shù)、關(guān)鍵系統(tǒng)、支撐平臺(tái)和智能應(yīng)用的完備產(chǎn)業(yè)鏈和高端產(chǎn)業(yè)群,人工智能核心產(chǎn)業(yè)規(guī)模超過(guò)1萬(wàn)億元,帶動(dòng)相關(guān)產(chǎn)業(yè)規(guī)模超過(guò)10萬(wàn)億元。從算法推薦到內(nèi)容生成:AI有望引發(fā)新一輪內(nèi)容與平臺(tái)投資周期基于對(duì)AI產(chǎn)業(yè)鏈及成長(zhǎng)歷程的分析,我們認(rèn)為,AI底層算法和理論體系的突破相對(duì)緩慢,AI對(duì)于各個(gè)行業(yè)的滲透和改造進(jìn)度各不相同。但是當(dāng)前基于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法已經(jīng)在感知層(圖像、聲音等)及部分認(rèn)知處理環(huán)節(jié)逐步步入技術(shù)成熟期,在特定技術(shù)環(huán)節(jié)和應(yīng)用場(chǎng)景中已經(jīng)具備良好的商用價(jià)值。我們認(rèn)為,短期內(nèi)AI能夠創(chuàng)造價(jià)值的行業(yè)必須具備以下三點(diǎn)要素:1)適合的場(chǎng)景應(yīng)用:一方面行業(yè)內(nèi)存在需求,AI的應(yīng)用能夠解決實(shí)際問(wèn)題,真正為行業(yè)帶來(lái)降本提效;另一方面,深度學(xué)習(xí)的特點(diǎn)決定了AI的算法體系必須擁有特定領(lǐng)域的樣本數(shù)據(jù)持續(xù)訓(xùn)練;2)充足的數(shù)據(jù)來(lái)源:在技術(shù)應(yīng)用背后擁有足夠的數(shù)據(jù)來(lái)驅(qū)動(dòng)AI能力的提升;3)所需技術(shù)具備商業(yè)可行性(技術(shù)成熟度以及成本、效率等)。結(jié)合以上三方面要素,從落地的角度來(lái)看,AI在自動(dòng)駕駛、安防、語(yǔ)音識(shí)別等領(lǐng)域已經(jīng)得到大規(guī)模應(yīng)用;從傳媒互聯(lián)網(wǎng)領(lǐng)域落地來(lái)看,基于AI的算法推薦已經(jīng)在信息分發(fā)領(lǐng)域獲得充分應(yīng)用,并誕生出以字節(jié)跳動(dòng)(今日頭條、抖音等典型APP)、小紅書(shū)為代表的移動(dòng)互聯(lián)網(wǎng)時(shí)代信息分發(fā)平臺(tái)新范式;從信息分發(fā)到內(nèi)容生成(AIGC),AI有望重塑內(nèi)容及互聯(lián)網(wǎng)產(chǎn)業(yè)生態(tài)。AI賦能,字節(jié)跳動(dòng)充分展現(xiàn)內(nèi)容分發(fā)時(shí)代AI商業(yè)化價(jià)值互聯(lián)網(wǎng)時(shí)代信息爆炸,信息過(guò)載加速AI在內(nèi)容分發(fā)領(lǐng)域落地。在互聯(lián)網(wǎng)、特別是移動(dòng)互聯(lián)網(wǎng)的快速滲透推動(dòng)之下,內(nèi)容創(chuàng)作從傳統(tǒng)的PGC向UGC、PUGC模式轉(zhuǎn)變,與之相應(yīng)的是信息產(chǎn)生的數(shù)量呈現(xiàn)指數(shù)級(jí)上升;傳統(tǒng)的用戶(hù)主動(dòng)獲取信息的模式不堪重負(fù)、信息過(guò)載成為制約互聯(lián)網(wǎng)產(chǎn)業(yè)發(fā)展的重要障礙;基于AI的“千人千面”算法推薦模式在此背景下快速導(dǎo)入,推動(dòng)了互聯(lián)網(wǎng)從“人找信息”到“信息找人”的內(nèi)容分發(fā)模式轉(zhuǎn)變。技術(shù)解讀:“千人千面”的推薦系統(tǒng)本質(zhì)上是一個(gè)由AI技術(shù)驅(qū)動(dòng)的擬合函數(shù),輸入變量包括用戶(hù)特征、環(huán)境特征和內(nèi)容特征,輸出變量為推薦結(jié)果。參與運(yùn)算的參數(shù)包括:1)用戶(hù)特征:包括興趣、職業(yè)、年齡、性別、機(jī)型、用戶(hù)反饋行為等;2)環(huán)境特征:地理位置、時(shí)間、網(wǎng)絡(luò)、天氣、當(dāng)前場(chǎng)景(工作、地鐵等);3)內(nèi)容特征:主題詞、興趣標(biāo)簽、熱度、質(zhì)量等。結(jié)合三方面的信息,模型會(huì)運(yùn)算出一個(gè)預(yù)估,即推測(cè)推薦內(nèi)容在這一場(chǎng)景下對(duì)這一用戶(hù)是否合適。然后對(duì)小批量相同標(biāo)簽的用戶(hù)進(jìn)行實(shí)時(shí)推薦。如果用戶(hù)反饋(轉(zhuǎn)化率、熱度)達(dá)到設(shè)定標(biāo)準(zhǔn),則將此內(nèi)容進(jìn)行大規(guī)模的推薦;如果用戶(hù)反饋低于設(shè)定標(biāo)準(zhǔn),則停止推薦。依靠該推薦系統(tǒng),使平臺(tái)長(zhǎng)尾內(nèi)容實(shí)現(xiàn)了有效的分發(fā)和觸達(dá)。從技術(shù)理念到產(chǎn)品落地,算法推薦引領(lǐng)內(nèi)容分發(fā)進(jìn)入新時(shí)代。從產(chǎn)品來(lái)看,以抖音、今日頭條、小紅書(shū)等C端娛樂(lè)內(nèi)容為代表的內(nèi)容平臺(tái),基于海量用戶(hù)數(shù)據(jù),并通過(guò)視頻識(shí)別技術(shù),挖掘出各視頻內(nèi)容的特點(diǎn)及標(biāo)簽,通過(guò)推薦系統(tǒng),將合適的內(nèi)容、在合適的地點(diǎn)、推送給合適的人,改變內(nèi)容分發(fā)行業(yè)聚焦于頭部?jī)?nèi)容的生態(tài)特征,挖掘出長(zhǎng)尾內(nèi)容的使用價(jià)值;而從當(dāng)前移動(dòng)互聯(lián)網(wǎng)產(chǎn)品來(lái)看,從內(nèi)容分發(fā)到電商平臺(tái)產(chǎn)品推送,基于AI的信息分發(fā)已成標(biāo)配。從產(chǎn)品到商業(yè)化,字節(jié)跳動(dòng)的異軍突起驗(yàn)證AI強(qiáng)大的生產(chǎn)力價(jià)值和商業(yè)化潛力。作為作為AI技術(shù)驅(qū)動(dòng)型公司,字節(jié)跳動(dòng)于2012年8月推出首款新聞資訊分發(fā)產(chǎn)品“今日頭條”,產(chǎn)品基于機(jī)器學(xué)習(xí)技術(shù),實(shí)現(xiàn)“千人千面”的新聞信息推送。在上線(xiàn)不到兩年的時(shí)間內(nèi),用戶(hù)數(shù)已超過(guò)1.2億,MAU超過(guò)4000萬(wàn)。后續(xù),公司基于今日頭條所打磨出的智能推薦系統(tǒng),低成本、大規(guī)模生產(chǎn)“流產(chǎn)品”,推出了“抖音”等現(xiàn)象級(jí)產(chǎn)品,并將國(guó)內(nèi)成熟產(chǎn)品通過(guò)“技術(shù)出海+本土化運(yùn)營(yíng)”順利推廣到全球。Questmoblie數(shù)據(jù)顯示,截至2022年底,字節(jié)跳動(dòng)旗下產(chǎn)品合計(jì)用戶(hù)時(shí)長(zhǎng)占比達(dá)到24.5%(2017年底為10.1%),成為僅次于騰訊系的互聯(lián)網(wǎng)巨頭。生成式AI(AIGC):從信息分發(fā)到內(nèi)容生成,更為宏大的時(shí)代機(jī)遇利用人工智能方式生成內(nèi)容的想法發(fā)源甚早。艾倫·圖靈(AlanTuring)1950在論文《計(jì)算機(jī)器與智能(ComputingMachineryandIntelligence)》中提出了判定機(jī)器是否具有“智能”的試驗(yàn)方法,即“圖靈測(cè)試”,判斷標(biāo)準(zhǔn)為,機(jī)器是否能模仿人類(lèi)的思維方式并生成內(nèi)容進(jìn)一步與人交互。半個(gè)世紀(jì)的科技發(fā)展中,隨著數(shù)據(jù)量快速積累、算力性能不斷提升、算法效力增強(qiáng),當(dāng)前的AI在與人交互的過(guò)程中還可產(chǎn)出寫(xiě)作、編曲、繪畫(huà)、視頻制作等內(nèi)容。2018年,世界上首個(gè)出售的AIGC畫(huà)作在佳士得拍賣(mài)行以43.25萬(wàn)美元成交,引發(fā)各界關(guān)注。隨著AI的內(nèi)容生成能力不斷增強(qiáng),場(chǎng)景落地開(kāi)花,AIGC產(chǎn)業(yè)浪潮興起。結(jié)合人工智能的演進(jìn)歷程,AIGC的發(fā)展大致可以分為4個(gè)階段,即:早期萌芽階段(20世紀(jì)50年代至90年代中期)、沉淀積累階段(20世紀(jì)90年代中期至21世紀(jì)10年代中期),快速發(fā)展階段(21世紀(jì)10年代中期至今)以及當(dāng)前的破圈爆發(fā)階段(2022年至今)。早期萌芽階段(1950s-1990s):技術(shù)所限,AIGC局限于小范圍實(shí)驗(yàn)。1957年,萊杰倫·希勒(LeiarenHiller)和倫納德·艾薩克森(LeonardIsaacson)通過(guò)將計(jì)算機(jī)程序中的控制變量換成音符得到了歷史上第一支由計(jì)算機(jī)創(chuàng)作的音樂(lè)作品——弦樂(lè)四重奏《依利亞克組曲(IlliacSuite)》。1966年,世界第一款可人機(jī)對(duì)話(huà)的機(jī)器人“伊莉莎(Eliza)”問(wèn)世,其可在關(guān)鍵字掃描和重組的基礎(chǔ)上進(jìn)行人機(jī)交互。80年代中期,IBM基于隱形馬爾科夫鏈模型(HiddenMarkovModel,HMM)創(chuàng)造了語(yǔ)音控制打字機(jī)“坦戈拉(Tangora)”,能夠處理約20000個(gè)單詞。然而在20世紀(jì)末期,高昂的研發(fā)與系統(tǒng)成本與難以落地商業(yè)變現(xiàn)模式,各國(guó)政府減少了對(duì)人工智能領(lǐng)域的投入,AIGC發(fā)展暫時(shí)停滯。沉淀積累階段(1990s-2010s):AIGC實(shí)用性增強(qiáng),開(kāi)啟商業(yè)化探索。2006年,深度學(xué)習(xí)算法取得重大突破,且同期圖形處理器(GraphicsProcessingUnit,GPU)、張量處理器(TensorProcessingUnitTPU)等算力設(shè)備性能不斷提升。數(shù)據(jù)層面互聯(lián)網(wǎng)的發(fā)展引發(fā)數(shù)據(jù)規(guī)??焖倥蛎洠蔀锳IGC發(fā)展的算法訓(xùn)練基礎(chǔ),AIGC發(fā)展取得顯著進(jìn)步。但算法仍然面臨瓶頸,創(chuàng)作任務(wù)的完成質(zhì)量限制了AIGC的應(yīng)用,內(nèi)容產(chǎn)出效果仍待提升。2007年,紐約大學(xué)人工智能研究員羅斯·古德溫裝配的人工智能系統(tǒng)通過(guò)對(duì)公路旅行中見(jiàn)聞的記錄和感知,撰寫(xiě)出世界第一部完全由人工智能創(chuàng)作的小說(shuō)《1TheRoad》。但其仍整體可讀性不強(qiáng)的劣勢(shì),存在拼寫(xiě)錯(cuò)誤、辭藻空洞、缺乏邏輯等問(wèn)題。微軟2012年公開(kāi)展示的全自動(dòng)同聲傳譯系統(tǒng),基于深層神經(jīng)網(wǎng)絡(luò)(DeepNeuralNetwork,DNN)可自動(dòng)將英文演講者的內(nèi)容通過(guò)語(yǔ)音識(shí)別、語(yǔ)言翻譯、語(yǔ)音合成等技術(shù)生成中文語(yǔ)音??焖侔l(fā)展階段(2010s-2021):深度學(xué)習(xí)算法的不斷迭代促進(jìn)內(nèi)容生態(tài)百花齊放。2014年以來(lái),以生成式對(duì)抗網(wǎng)絡(luò)(GenerativeAdversarialNetwork,GAN)為代表的深度學(xué)習(xí)算法被提出和迭代更新,AIGC進(jìn)入生成內(nèi)容多樣化的時(shí)代,且產(chǎn)出的內(nèi)容效果逼真到難以分辨。2017年,世界首部全部由AI創(chuàng)作的詩(shī)集《陽(yáng)光失了玻璃窗》由微軟的人工智能少女“小冰”創(chuàng)造。2018年,英偉達(dá)了可以自動(dòng)生成圖片的StyleGAN模型,截止2022年末,其已升級(jí)到第四代StyleGAN-XL,可生成人眼難以分辨真假的高分辨率圖片。2019年,DeepMind發(fā)布了可生成連續(xù)視頻的DVD-GAN模型。2021年,OpenAI推出了DALL-E,并于2022年將其升級(jí)為DALL-E-2。該產(chǎn)品主要生成文本與圖像的交互內(nèi)容,可根據(jù)用戶(hù)輸入的簡(jiǎn)短描述性文字,得到極高質(zhì)量的卡通、寫(xiě)實(shí)、抽象等風(fēng)格的圖像繪畫(huà)作品。爆發(fā)與破圈階段(2022-至今):2022年以來(lái),AIGC產(chǎn)品密集發(fā)布,ChatGPT爆火出圈。Google于2022年五月推出了文本圖像生成模型lmagen,同年8月,開(kāi)源AI繪畫(huà)工具StableDiffusion發(fā)布;2022年9月,Meta推出可利用文字生成視頻的產(chǎn)品Make-A-Video以推動(dòng)其視頻生態(tài)的發(fā)展。2022年11月30日,OpenAl推出AI聊天機(jī)器人ChatGPT,AIGC的內(nèi)容產(chǎn)出能力迅速吸引大批用戶(hù),至2022年12月5日,根據(jù)OpenAI創(chuàng)始人表示,ChatGPT用戶(hù)數(shù)已突破100萬(wàn)。2023年2月,微軟宣布推出由ChatGPT支持的新版本Bing搜索引擎和Edge瀏覽器,AIGC與傳統(tǒng)工具進(jìn)入深度融合歷程。算力與數(shù)據(jù)皆備、大模型加速AIGC技術(shù)導(dǎo)入,應(yīng)用創(chuàng)新、場(chǎng)景落地漸行漸近深度模型的進(jìn)步與創(chuàng)新奠定AIGC走向成熟的基礎(chǔ)。就底層技術(shù)而言,不斷創(chuàng)新的生成算法、預(yù)訓(xùn)練模型、多模態(tài)等技術(shù)是AIGC行業(yè)發(fā)展的前提,以此為基礎(chǔ)AIGC在自動(dòng)化內(nèi)容生成上具備了通用性、基礎(chǔ)性多模態(tài)、參數(shù)多、訓(xùn)練數(shù)據(jù)量大、生成內(nèi)容高質(zhì)穩(wěn)定等特征優(yōu)勢(shì)。預(yù)訓(xùn)練模型進(jìn)一步打開(kāi)了AIGC的技術(shù)和商業(yè)化可能。以往的生成模型存在使用門(mén)檻高、訓(xùn)練成本高、內(nèi)容生成簡(jiǎn)單和質(zhì)量偏低等劣勢(shì),而真實(shí)內(nèi)容消費(fèi)場(chǎng)景具備靈活多變、高精度、高質(zhì)量等痛點(diǎn)要求。預(yù)訓(xùn)練模型的出現(xiàn)通過(guò)提高AIGC技術(shù)能力解決了上述問(wèn)題。AI預(yù)訓(xùn)練模型。即大模型、基礎(chǔ)模型(FoundationModel),其基于大量數(shù)據(jù)與巨量參數(shù)的模型,可適應(yīng)下游廣泛任務(wù)并顯著提高各種下游任務(wù)的性能。AIGC進(jìn)入預(yù)訓(xùn)練模型時(shí)代以2018年谷歌發(fā)布基于Transformer機(jī)器學(xué)習(xí)方法的自然語(yǔ)言處理預(yù)訓(xùn)練模型BERT為標(biāo)志。當(dāng)前按照基本類(lèi)型分類(lèi),預(yù)訓(xùn)練模型包括:(1)自然語(yǔ)言處理(NLP)預(yù)訓(xùn)練模型,如谷歌的LaMDA和PaLM、OpenAl的GPT系列;(2)計(jì)算機(jī)視覺(jué)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論