![生成式人工智能(AIGC的邏輯與應(yīng)用)_第1頁(yè)](http://file4.renrendoc.com/view2/M01/3C/06/wKhkFmaa0YCAGQ49AABYSb0uxkQ207.jpg)
![生成式人工智能(AIGC的邏輯與應(yīng)用)_第2頁(yè)](http://file4.renrendoc.com/view2/M01/3C/06/wKhkFmaa0YCAGQ49AABYSb0uxkQ2072.jpg)
![生成式人工智能(AIGC的邏輯與應(yīng)用)_第3頁(yè)](http://file4.renrendoc.com/view2/M01/3C/06/wKhkFmaa0YCAGQ49AABYSb0uxkQ2073.jpg)
![生成式人工智能(AIGC的邏輯與應(yīng)用)_第4頁(yè)](http://file4.renrendoc.com/view2/M01/3C/06/wKhkFmaa0YCAGQ49AABYSb0uxkQ2074.jpg)
![生成式人工智能(AIGC的邏輯與應(yīng)用)_第5頁(yè)](http://file4.renrendoc.com/view2/M01/3C/06/wKhkFmaa0YCAGQ49AABYSb0uxkQ2075.jpg)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
生成式人工智能AIGC的邏輯與應(yīng)用目錄TOC\h\h第一章初識(shí)生成式人工智能\h縱觀AI產(chǎn)業(yè)版圖\h決策式AI和生成式AI\h從大數(shù)據(jù)到大模型\h生成式AI市場(chǎng)格局\h聚焦AIGC:內(nèi)容皆可生成\h文本生成\h圖片生成\h視頻生成\h生成式AI的核心價(jià)值\h生成式AI聚焦于認(rèn)知的邏輯層面\h生成式AI的優(yōu)勢(shì)\h生成式AI的價(jià)值\h里程碑式的存在——ChatGPT\hChatGPT發(fā)展歷程\h各大公司紛紛入場(chǎng)\hChatGPT的應(yīng)用\h第二章AIGC的底層邏輯\h生成式模型基礎(chǔ)\h深度學(xué)習(xí)的前世今生\h深度學(xué)習(xí)的經(jīng)典模型\hGAN\hTransformer和ChatGPT模型\h序列到序列(seq2seq)\h注意力機(jī)制\hTransformer\hGPT系列模型\hDiffusion模型\h什么是Diffusion\h文本到圖像\hStableDiffusion\h第三章功能分析:AIGC能生成什么內(nèi)容?\h生成文字:新聞、報(bào)告、代碼都可一鍵生成\h新聞生成\h報(bào)告生成\h代碼生成\h描繪圖像:分辨率、清晰度、真實(shí)性與藝術(shù)性\h圖像生成的突破\h生成藝術(shù)風(fēng)格圖像\h其他頂尖平臺(tái)\h音頻制作:精準(zhǔn)還原、實(shí)時(shí)合成\h音樂(lè)生成\h語(yǔ)音克隆\h跨模態(tài)生成\h影視創(chuàng)作:海量場(chǎng)景任你選\h劇本創(chuàng)作\h角色和場(chǎng)景創(chuàng)作\h后期制作\h互動(dòng)娛樂(lè):游戲中的生成式AI革命\h游戲內(nèi)容生成\hNPC\h創(chuàng)新型AI游戲\h第四章商業(yè)落地:AIGC的產(chǎn)業(yè)應(yīng)用與前景\h研發(fā)設(shè)計(jì):設(shè)計(jì)能力樣樣俱全\h外觀設(shè)計(jì)\h結(jié)構(gòu)設(shè)計(jì)\h藥物研發(fā)\h生產(chǎn)制造:“L4級(jí)別”的智能控制\h機(jī)器人控制\h多機(jī)器人協(xié)同\h工業(yè)質(zhì)檢\h供應(yīng)鏈管理:庫(kù)存計(jì)劃可自動(dòng)編程\h供應(yīng)鏈領(lǐng)域的AI應(yīng)用\h需求預(yù)測(cè)\h庫(kù)存管理\h市場(chǎng)營(yíng)銷:營(yíng)銷文案不再發(fā)愁\h營(yíng)銷方案\h營(yíng)銷文案和圖片\h營(yíng)銷溝通\h客戶服務(wù):貼心服務(wù)打動(dòng)客戶\h更有效的溝通\h知識(shí)庫(kù)管理\h客服質(zhì)檢\h第五章主動(dòng)還是被動(dòng)?決勝AIGC\h展望未來(lái):AIGC是否是新一輪的技術(shù)革命?\hAGI\h從AIGC走向AGI\h新一輪內(nèi)容革命的起點(diǎn)\h智能并非萬(wàn)能:AIGC的優(yōu)勢(shì)與瓶頸\hAIGC的優(yōu)勢(shì)\hAIGC變革業(yè)務(wù)流程\hAIGC的瓶頸\h我們的工作機(jī)會(huì)還在嗎?\hAIGC能否取代內(nèi)容創(chuàng)作者?\h人工智能會(huì)取代誰(shuí)?\h我們?cè)撛趺崔k?第一章初識(shí)生成式人工智能現(xiàn)象級(jí)產(chǎn)品ChatGPT的橫空出世帶火了AIGC和它背后的生成式AI,讓不少人對(duì)使用AI工具躍躍欲試。在本章,我們會(huì)一起進(jìn)入AI的產(chǎn)業(yè)國(guó)度,從決策式AI躍遷至生成式AI,對(duì)比這兩種人工智能模型的異同,深度挖掘它們的應(yīng)用場(chǎng)景和商業(yè)潛力,同時(shí)還會(huì)探討“內(nèi)容皆可生成”的生成式AI及其核心價(jià)值。在概覽生成式AI后,我們會(huì)把視角轉(zhuǎn)向具體工具,深入解析大眾已經(jīng)熟知的ChatGPT,了解這項(xiàng)“奇妙工具”背后的原理和發(fā)展歷程。若你對(duì)生成式AI一知半解,可以在本章的內(nèi)容中初步認(rèn)識(shí)它,也能了解到近期最值得關(guān)注的生成式AI工具??v觀AI產(chǎn)業(yè)版圖如果要選出2023年最熱的幾個(gè)話題,ChatGPT一定榜上有名。2023年初,ChatGPT席卷全球并成為流量熱點(diǎn),人們都在前赴后繼地挖掘ChatGPT的各種潛能,探討其未來(lái)發(fā)展趨勢(shì),甚至是與人類的關(guān)系。作為“人工智能家族”的大熱應(yīng)用,以ChatGPT為首的各大人工智能應(yīng)用開(kāi)始被越來(lái)越多的人關(guān)注,也引發(fā)了人們的更多思考。人工智能技術(shù)被稱為當(dāng)代三大尖端技術(shù)之一,近年來(lái)在人們生活中的“存在感”也越來(lái)越強(qiáng),這都是產(chǎn)業(yè)飛速發(fā)展的結(jié)果。想要清晰地了解以ChatGPT為代表的新興智能技術(shù),完整地認(rèn)識(shí)人工智能,我們可以先從其產(chǎn)業(yè)版圖的發(fā)展和現(xiàn)狀入手。其實(shí),人工智能的發(fā)展、傳播和被接受是經(jīng)過(guò)了一段漫長(zhǎng)的寒冬的。十多年前,它還只是一個(gè)不被人看好的小眾領(lǐng)域,但是現(xiàn)在,它卻已經(jīng)成了街頭巷尾的熱點(diǎn)談資,幾乎任何事情都可以和人工智能聯(lián)系在一起。短短十多年間,世界發(fā)生了天翻地覆的變化,新數(shù)據(jù)不斷涌現(xiàn),各種問(wèn)題層出不窮,直到現(xiàn)在,人工智能的春天才算是真的到來(lái)了,各個(gè)領(lǐng)域都急需人工智能的幫助。這也是為什么人工智能的行業(yè)應(yīng)用范圍如此廣闊,人工智能市場(chǎng)更是如一塊一望無(wú)際的遼闊土地,有待進(jìn)一步開(kāi)發(fā)。如圖1-1,這是一份人工智能的行業(yè)應(yīng)用版圖,不同的行業(yè)領(lǐng)域(零售、金融、醫(yī)療和教育等)與不同的職能方向(營(yíng)銷、風(fēng)控和安全等)共同構(gòu)成了一個(gè)人工智能應(yīng)用矩陣,對(duì)于每個(gè)行業(yè)中的相關(guān)職能,人工智能都可以找到應(yīng)用場(chǎng)景,例如在零售行業(yè)的供應(yīng)鏈、營(yíng)銷、客服等方面以及金融行業(yè)的研發(fā)、營(yíng)銷、客服、風(fēng)控等方面都已經(jīng)有人工智能落地實(shí)踐(圖中藍(lán)色表示)。但是,現(xiàn)在的人工智能只填充了廣闊的行業(yè)領(lǐng)域中的一部分,還有更多沒(méi)嘗試和拓展的行業(yè)以及職能中的應(yīng)用場(chǎng)景。圖1-1人工智能的行業(yè)應(yīng)用版圖從產(chǎn)業(yè)的視角來(lái)看,人工智能包括基礎(chǔ)層、技術(shù)層和應(yīng)用層。其中,基礎(chǔ)層是人工智能產(chǎn)業(yè)的基礎(chǔ),為人工智能提供數(shù)據(jù)及算力支撐;技術(shù)層是人工智能產(chǎn)業(yè)的核心,主要包括各類模型和算法的研發(fā)和升級(jí);應(yīng)用層則是人工智能面向特定場(chǎng)景需求而形成的軟硬件產(chǎn)品或解決方案。那么,人工智能的產(chǎn)業(yè)規(guī)模發(fā)展至何種程度了呢?英國(guó)德勤(Deloitte)的報(bào)告中預(yù)測(cè),世界的人工智能產(chǎn)業(yè)規(guī)模會(huì)從2017年的6900億美元增長(zhǎng)至2025年的64000億美元,2017—2025年的復(fù)合增長(zhǎng)率將達(dá)到32.10%,整體呈現(xiàn)出飛速攀升的趨勢(shì)。另外,人工智能近幾年成了各個(gè)行業(yè)在進(jìn)行投資的熱門選擇。人工智能完全稱得上是風(fēng)頭正勁,受萬(wàn)人追捧,為經(jīng)濟(jì)帶來(lái)了十分顯著的增量。在產(chǎn)業(yè)應(yīng)用上,人工智能發(fā)展到今天,我們能看到其在各個(gè)行業(yè)都有用武之地:制造業(yè)、零售業(yè)、金融業(yè)、醫(yī)療衛(wèi)生行業(yè)……它在一定程度上改變了組織的運(yùn)轉(zhuǎn)方式,使其可以更快更好地解決遇到的問(wèn)題,并壓低各類成本。站在消費(fèi)者的角度,人工智能的出現(xiàn)也為廣大的用戶群體帶來(lái)了更多的選擇??偟膩?lái)說(shuō),人工智能可以看作一塊已開(kāi)始被打磨的原石,露出了它璀璨的一角,它在推動(dòng)世界經(jīng)濟(jì)發(fā)展的同時(shí),也將深層次地改變?nèi)祟惖纳?。為了進(jìn)一步了解AI產(chǎn)業(yè)版圖,下面我們從兩種不同的AI——決策式AI和生成式AI談起。決策式AI和生成式AI人工智能可從不同的維度進(jìn)行劃分。如果按其模型來(lái)劃分(人工智能是由模型支撐的)可以分為決策式AI和生成式AI。決策式AI(也被稱作判別式AI)學(xué)習(xí)數(shù)據(jù)中的條件概率分布,即一個(gè)樣本歸屬于特定類別的概率,再對(duì)新的場(chǎng)景進(jìn)行判斷、分析和預(yù)測(cè)。決策式AI有幾個(gè)主要的應(yīng)用領(lǐng)域:人臉識(shí)別、推薦系統(tǒng)、風(fēng)控系統(tǒng)、其他智能決策系統(tǒng)、機(jī)器人、自動(dòng)駕駛。例如在人臉識(shí)別領(lǐng)域,決策式AI對(duì)實(shí)時(shí)獲取的人臉圖像進(jìn)行特征信息提取,再與人臉庫(kù)中的特征數(shù)據(jù)匹配,從而實(shí)現(xiàn)人臉識(shí)別。再例如,決策式AI可以通過(guò)學(xué)習(xí)電商平臺(tái)上海量用戶的消費(fèi)行為數(shù)據(jù),制訂最合適的推薦方案,盡可能提升平臺(tái)交易量。生成式AI則學(xué)習(xí)數(shù)據(jù)中的聯(lián)合概率分布,即數(shù)據(jù)中多個(gè)變量組成的向量的概率分布,對(duì)已有的數(shù)據(jù)進(jìn)行總結(jié)歸納,并在此基礎(chǔ)上使用深度學(xué)習(xí)技術(shù)等,創(chuàng)作模仿式、縫合式的內(nèi)容,相當(dāng)于自動(dòng)生成全新的內(nèi)容。生成式AI可生成的內(nèi)容形式十分多樣,包括文本、圖片、音頻和視頻等。例如,我們輸入一段小說(shuō)情節(jié)的簡(jiǎn)單描述,生成式AI便可以幫我們生成一篇完整的小說(shuō)內(nèi)容;再例如,生成式AI可以生成人物照片,而照片中的人物在現(xiàn)實(shí)世界中是完全不存在的。如圖1-2,它展示的是國(guó)外一個(gè)網(wǎng)站生成的“不存在的人”的照片??偟膩?lái)說(shuō),不管是哪種類型的模型,它的基礎(chǔ)邏輯是一致的:AI模型從本質(zhì)上來(lái)說(shuō)是一個(gè)函數(shù),要想找到函數(shù)準(zhǔn)確的表達(dá)式,只靠邏輯是難以推導(dǎo)的,這個(gè)函數(shù)其實(shí)是被訓(xùn)練出來(lái)的。我們通過(guò)喂給機(jī)器已有的數(shù)據(jù),讓機(jī)器從數(shù)據(jù)中尋找最符合數(shù)據(jù)規(guī)律的函數(shù)。所以當(dāng)有新的數(shù)據(jù)需要進(jìn)行預(yù)測(cè)或生成時(shí),機(jī)器就能夠通過(guò)這個(gè)函數(shù),預(yù)測(cè)或生成新數(shù)據(jù)所對(duì)應(yīng)的結(jié)果。圖1-2“不存在”的人圖片來(lái)源:https://generated.photos/faces決策式AI和生成式AI作為AI模型的兩個(gè)主要分支,顧名思義,在諸多方面都有相異之處。從宏觀角度來(lái)看,決策式AI是一種用于決策的技術(shù),它利用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和計(jì)算機(jī)視覺(jué)等技術(shù)來(lái)處理專業(yè)領(lǐng)域的問(wèn)題,并幫助企業(yè)和組織優(yōu)化決策。而生成式AI則是一種用于自動(dòng)生成新內(nèi)容的AI技術(shù),它可以使用語(yǔ)言模型、圖像模型和深度學(xué)習(xí)等技術(shù),自動(dòng)生成新的文本、圖片、音頻和視頻內(nèi)容。因此,決策式AI可以說(shuō)是在對(duì)人類的決策過(guò)程進(jìn)行模仿,但生成式AI就聚焦在創(chuàng)作新內(nèi)容上。而從微觀上看,這兩類技術(shù)的區(qū)別就更加明晰了,我們就從技術(shù)路徑、成熟程度、應(yīng)用方向這三個(gè)角度來(lái)挖掘其深層次的不同(表1-1)。表1-1決策式AI和生成式AI的對(duì)比從技術(shù)路徑來(lái)看,決策式AI的主要工作是對(duì)已有數(shù)據(jù)“打標(biāo)簽”,對(duì)不同類別的數(shù)據(jù)做區(qū)別,最簡(jiǎn)單的例子如區(qū)分貓和狗、草莓和蘋果等,干的主要是“判斷是不是”和“區(qū)分是這個(gè)還是那個(gè)”的活兒。生成式AI就不一樣了,它會(huì)在歸納分析已有的數(shù)據(jù)后,再“創(chuàng)作”出新的內(nèi)容,如在看了很多狗的圖片后,生成式AI再創(chuàng)作出一只新的狗的圖片,實(shí)現(xiàn)“舉一反三”。從成熟程度看,決策式AI的應(yīng)用更為成熟,已然在互聯(lián)網(wǎng)、零售、金融、制造等行業(yè)展開(kāi)應(yīng)用,極大地提升了企業(yè)的工作效率。而生成式AI的“年歲更小”,2014年至今發(fā)展迅猛,堪稱指數(shù)級(jí)的爆發(fā),已在文本和圖片生成等應(yīng)用內(nèi)落地。從應(yīng)用方向來(lái)看,決策式AI在人臉識(shí)別、推薦系統(tǒng)、風(fēng)控系統(tǒng)、機(jī)器人、自動(dòng)駕駛中都已經(jīng)有成熟的應(yīng)用,非常貼合日常生活。生成式AI則在內(nèi)容創(chuàng)作、人機(jī)交互、產(chǎn)品設(shè)計(jì)等領(lǐng)域展現(xiàn)出巨大潛力。我們來(lái)舉一些生活中的例子,以更深入地了解兩者在日常生活中的應(yīng)用。喜歡購(gòu)物的讀者都知道,你在購(gòu)買某一類產(chǎn)品后,購(gòu)物平臺(tái)會(huì)自動(dòng)給你呈現(xiàn)諸多同類或相關(guān)商品。這件事的背后就是,電商平臺(tái)會(huì)根據(jù)用戶常看的商品,剖析用戶和商品的關(guān)聯(lián),從而有針對(duì)性地為用戶推薦內(nèi)容,而這項(xiàng)功能就應(yīng)用了決策式AI技術(shù)。從2003年開(kāi)始,亞馬遜就將此技術(shù)應(yīng)用到了電商領(lǐng)域,推薦的商品精準(zhǔn)地匹配用戶需求,可以極大地降低用戶的搜索次數(shù),并因此增加產(chǎn)品的銷售額。由此你可能會(huì)發(fā)現(xiàn),平臺(tái)似乎比你更清楚你需要什么,自然而然,自己的消費(fèi)額也跟著上去了。平臺(tái)也憑借這個(gè)功能,讓更多用戶心甘情愿地掏了腰包,來(lái)獲取更廣闊的商業(yè)價(jià)值。根據(jù)行業(yè)數(shù)據(jù)統(tǒng)計(jì),在亞馬遜的收入中約有40%來(lái)自個(gè)性化推薦系統(tǒng),而推薦系統(tǒng)每年能給網(wǎng)飛(Netflix)帶來(lái)10億美元以上的產(chǎn)值。除了電商平臺(tái),新聞、音樂(lè)、視頻等平臺(tái),也會(huì)利用個(gè)性化推薦系統(tǒng)為用戶推薦內(nèi)容,在剖析用戶的長(zhǎng)期興趣和短期興趣后,將精細(xì)化內(nèi)容推送給用戶,并可以通過(guò)對(duì)用戶的停留、觀看時(shí)間、點(diǎn)贊、收藏等行為特征的實(shí)時(shí)分析,精準(zhǔn)刻畫出用戶畫像,減少人工運(yùn)營(yíng)的介入,顯著提升用戶黏性,這已將人工智能的價(jià)值凸顯無(wú)遺。在自動(dòng)駕駛領(lǐng)域,AI可進(jìn)行智能分析、識(shí)別路況,滲透率穩(wěn)步提升。自動(dòng)駕駛汽車可以借助決策式AI技術(shù),分析判別各種路況,對(duì)多種物體進(jìn)行識(shí)別與跟蹤,提升行車安全。無(wú)須人工干預(yù)的自動(dòng)駕駛汽車雖然現(xiàn)在并不成熟,但隨著技術(shù)的迭代升級(jí),有望獲得更大的市場(chǎng)潛力。對(duì)于生成式AI,ChatGPT的出現(xiàn)讓我們對(duì)其有了沖擊式的關(guān)注和理解。因生成式AI功能強(qiáng)大、應(yīng)用范圍廣泛,文字、圖片、音視頻內(nèi)容相關(guān)的從業(yè)者在面對(duì)“強(qiáng)大助手”上線時(shí),也會(huì)感覺(jué)到焦慮,恐被其取代。從可能性來(lái)講,它可以進(jìn)行文字生成語(yǔ)音、圖像智能編輯、視頻智能剪輯、文字續(xù)寫或糾錯(cuò)等十分多樣的工作,讓大家擺脫機(jī)械勞動(dòng),把時(shí)間花在創(chuàng)意性工作上,給文字作者、翻譯人員、插畫師、視頻剪輯師等帶來(lái)極大的支持。不僅如此,生成式AI還能勝任部分由設(shè)計(jì)師、程序員甚至專業(yè)工程師從事的設(shè)計(jì)與編程類工作,在提升工作效率的同時(shí)讓這些專業(yè)人士更能發(fā)揮所長(zhǎng),減少在初級(jí)工作上的時(shí)間投入。與此同時(shí),生成式AI對(duì)于從業(yè)人員的素質(zhì)和技能,也提出了新的要求??偟膩?lái)說(shuō),決策式AI和生成式AI均可以幫助用戶推進(jìn)部分工作,如事件決策、創(chuàng)作內(nèi)容等??梢哉f(shuō),人工智能的合理利用有助于提升客戶體驗(yàn),幫助企業(yè)降本增效,并抓住新的商業(yè)機(jī)會(huì)。如前文所述,數(shù)據(jù)和模型分屬人工智能產(chǎn)業(yè)的基礎(chǔ)層和技術(shù)層,無(wú)論是決策式AI還是生成式AI的應(yīng)用都離不開(kāi)數(shù)據(jù)和模型,下面我們進(jìn)一步了解“大數(shù)據(jù)”和“大模型”是如何重塑人工智能版圖的。從大數(shù)據(jù)到大模型無(wú)論是決策式AI還是生成式AI,以其現(xiàn)在的功能和潛力,都能為人類做很多工作,未來(lái)甚至有點(diǎn)萬(wàn)能,那么這么萬(wàn)能的技術(shù),是怎么被“訓(xùn)練”出來(lái)的呢?這就要說(shuō)到大數(shù)據(jù)了,決策式AI和生成式AI,其實(shí)都離不開(kāi)用大量數(shù)據(jù)來(lái)訓(xùn)練模型。對(duì)于大數(shù)據(jù),大眾已經(jīng)比較熟悉。顧名思義,大數(shù)據(jù)指的是海量的數(shù)據(jù),但大數(shù)據(jù)并沒(méi)有看上去這么簡(jiǎn)單,它還有多樣性和高速增長(zhǎng)的特性。圖1-3展示了從2017年到2025年全球數(shù)據(jù)總量的增長(zhǎng)趨勢(shì)及預(yù)測(cè)情況。收集、存儲(chǔ)、處理和分析各種形式和來(lái)源的大數(shù)據(jù),可以幫助企業(yè)和組織迅速獲得有價(jià)值的信息,并做出正確的決策,它還可以用于商業(yè)活動(dòng)的改善,如此能提升工作效率,降低工作成本,并推動(dòng)企業(yè)實(shí)現(xiàn)更大的增長(zhǎng)。就如人類通過(guò)經(jīng)歷各類事件來(lái)積累經(jīng)驗(yàn)一般,在人工智能領(lǐng)域,我們通過(guò)大量的數(shù)據(jù)來(lái)訓(xùn)練模型。圖1-32017—2025年全球數(shù)據(jù)總量增長(zhǎng)趨勢(shì)及預(yù)測(cè)情況數(shù)據(jù)來(lái)源:國(guó)際數(shù)據(jù)公司發(fā)布的白皮書《數(shù)據(jù)時(shí)代2025》而隨著深度學(xué)習(xí)的落地和發(fā)展,模型本身所需的存儲(chǔ)空間在近年有了顯著增長(zhǎng),最初的GPT就有1.17億個(gè)參數(shù),ChatGPT有1750億個(gè)參數(shù),最新的GPT-4參數(shù)數(shù)量更多,有報(bào)道稱可能達(dá)到1T(即10000億),但OpenAI公司其實(shí)并沒(méi)有公布具體的參數(shù)數(shù)量,這些擁有海量參數(shù)的模型都被稱為“大模型”。如圖1-4,它展示了大模型參數(shù)數(shù)量變化趨勢(shì)。這里我們提到了深度學(xué)習(xí),這是一種受人腦的生物神經(jīng)網(wǎng)絡(luò)機(jī)制啟發(fā),并模仿人腦來(lái)解釋、處理數(shù)據(jù)的機(jī)器學(xué)習(xí)技術(shù),它能自動(dòng)對(duì)數(shù)據(jù)進(jìn)行特征提取、識(shí)別、決策和生成。你可能覺(jué)得這個(gè)詞有點(diǎn)耳熟,其實(shí)它大規(guī)模地應(yīng)用于自然語(yǔ)言處理(NLP)、計(jì)算機(jī)視覺(jué)、機(jī)器翻譯等領(lǐng)域。深度學(xué)習(xí)的出現(xiàn),為很多領(lǐng)域的工作帶來(lái)了前所未有的精度和效率。人工智能行業(yè)也因深度學(xué)習(xí)收獲了前所未有的發(fā)展速度,整個(gè)人工智能領(lǐng)域的發(fā)展都曾被它帶動(dòng)。圖1-4大模型參數(shù)數(shù)量變化趨勢(shì)大模型能分析處理海量的數(shù)據(jù),在解決問(wèn)題上取得更好的效果。本書的“主角”生成式AI就是大模型的產(chǎn)物。近年來(lái),大模型在越來(lái)越多的行業(yè)和消費(fèi)類應(yīng)用中嶄露頭角,原因主要是它能夠迅速有效地處理海量的數(shù)據(jù),幫助個(gè)人和企業(yè)提升效率。大模型與人工智能技術(shù)相輔相成,隨著人工智能技術(shù)的發(fā)展,大模型也會(huì)持續(xù)發(fā)展進(jìn)步。另外,生活中日益普及的5G網(wǎng)絡(luò)和彈性計(jì)算等基礎(chǔ)設(shè)施,也會(huì)給大模型的發(fā)展創(chuàng)造更多可能性,使其成為不可或缺的內(nèi)容生成工具。生成式AI市場(chǎng)格局2021年,高德納咨詢公司(Gartner)就曾預(yù)測(cè),至2023年將有20%的內(nèi)容被生成式AI創(chuàng)建,至2025年生成式AI產(chǎn)生的數(shù)據(jù)將占所有數(shù)據(jù)的10%(2021年不到1%)。2022年9月,紅杉資本官網(wǎng)發(fā)布的文章《生成式AI:充滿創(chuàng)造力的新世界》預(yù)測(cè),生成式AI將產(chǎn)生數(shù)萬(wàn)億美元的經(jīng)濟(jì)價(jià)值。據(jù)預(yù)測(cè),2025年,國(guó)內(nèi)生成式AI應(yīng)用規(guī)模有望突破2000億元,國(guó)內(nèi)傳媒領(lǐng)域應(yīng)用空間超1000億元。而且,生成式AI“八面玲瓏”,它的應(yīng)用場(chǎng)景十分廣泛,目前不僅應(yīng)用于文本、圖片、音視頻、游戲等數(shù)字媒體,還可以應(yīng)用于制造業(yè)、建筑業(yè)等實(shí)體行業(yè)。在文本生成方面,生成式AI可以通過(guò)語(yǔ)言模型、神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)技術(shù),快速創(chuàng)建大量有助于改善客戶體驗(yàn)的內(nèi)容,如新聞資訊、劇本、營(yíng)銷文本、智能客服等。其中作為經(jīng)典應(yīng)用的AI生成營(yíng)銷文本、智能客服等都已在許多行業(yè)廣泛地應(yīng)用;AI生成新聞資訊和劇本等功能大家也可以期待一下,或許以后結(jié)合了ChatGPT等突破性的模型,文字性工作真的能依靠它變得輕松不少。在圖片生成方面,生成式AI可以通過(guò)計(jì)算機(jī)視覺(jué)來(lái)分析圖片,生成營(yíng)銷素材、設(shè)計(jì)方案和藝術(shù)作品等,幫助節(jié)省人力成本和時(shí)間。另外,生成式AI還能在音頻生成、視頻生成和跨模態(tài)生成領(lǐng)域大展拳腳。在音頻生成方面,生成式AI可以幫助使用者更好地分析、編輯和生成音頻文件,從而幫助創(chuàng)作出優(yōu)秀的音頻作品。例如,克隆真人的語(yǔ)音、文本生成特定語(yǔ)音、作曲編曲等,生成式AI都能代替人類去做,并均已經(jīng)廣泛應(yīng)用于市場(chǎng)。視頻生成也是生成式AI的重要應(yīng)用,它可以幫助使用者生成高質(zhì)量的視頻,如檢測(cè)和刪除特定片段、跟蹤剪輯、生成特效、合成視頻等。另外,大火的AI數(shù)字人也是它的“拿手絕活”。在李安執(zhí)導(dǎo)的《雙子殺手》中,工作人員就用AI創(chuàng)造了一個(gè)數(shù)字人物小克。威爾·史密斯在數(shù)字技術(shù)的幫助下同時(shí)出演了50歲特工亨利和23歲特工小克,該片實(shí)現(xiàn)了真實(shí)明星“年輕版”的數(shù)字化制作。在跨模態(tài)生成中,生成式AI能夠根據(jù)文字生成創(chuàng)意圖片、根據(jù)圖片生成視頻、根據(jù)文字生成視頻,或根據(jù)圖片或視頻生成文字。對(duì)想象力豐富的朋友,或者影視行業(yè)從業(yè)者來(lái)說(shuō),這稱得上是“工作神器”。圖1-5就是一個(gè)根據(jù)文字“pandainaspacesuit”(穿著宇航服的熊貓)生成圖片的例子。在游戲方面,生成式AI可以用于游戲開(kāi)發(fā),實(shí)現(xiàn)自動(dòng)化的游戲設(shè)計(jì),同時(shí)能夠?qū)崿F(xiàn)更好的游戲體驗(yàn),如人工智能NPC(非玩家控制角色)等,說(shuō)不定以后你玩的游戲就有人工智能的深度參與。圖1-5根據(jù)“pandainaspacesuit”生成的圖片生成式AI不光在這些數(shù)字經(jīng)濟(jì)領(lǐng)域廣泛應(yīng)用,在實(shí)體領(lǐng)域的潛力也非常大,如在建筑業(yè)等巨型垂直實(shí)體領(lǐng)域中,生成式AI所生成內(nèi)容就不再僅局限于圖片和文字,而是進(jìn)入了信息形式更為豐富的3D(三維)設(shè)計(jì)領(lǐng)域。例如構(gòu)建數(shù)字建筑模型時(shí),生成式AI能幫助建筑師們產(chǎn)出3D建筑模型,讓他們更好地理解項(xiàng)目。建筑師們能夠使用AI圖像生成應(yīng)用來(lái)豐富建筑設(shè)計(jì)方案的細(xì)節(jié),假如建筑師們向應(yīng)用中輸入較為初級(jí)的建筑設(shè)計(jì)方案,AI就能夠在初級(jí)設(shè)計(jì)的基礎(chǔ)上,繼續(xù)產(chǎn)出較為細(xì)化的設(shè)計(jì)方案,以此來(lái)深化設(shè)計(jì)。建筑師們還可以隨手繪制一個(gè)潦草的建筑場(chǎng)景線圖,讓人工智能來(lái)生成對(duì)應(yīng)的建筑實(shí)景圖。我們可以想象,隨著手繪信息的增加,生成式AI輸出的實(shí)景圖也越來(lái)越穩(wěn)定。圖1-6所示的就是利用AI圖像生成工具生成的建筑設(shè)計(jì)圖。圖1-6由AI圖像生成工具生成的建筑設(shè)計(jì)圖圖片來(lái)源:https://stability.ai/blog/stablediffusion2-1-release7-dec-2022技術(shù)的浪潮層疊翻涌,人工智能已成為人類社會(huì)沖向未來(lái)世界的戰(zhàn)艦,產(chǎn)業(yè)前景十分廣闊。生成式AI更是一個(gè)突破性的產(chǎn)業(yè)發(fā)展方向,它不僅能給數(shù)字媒體和虛擬空間帶來(lái)價(jià)值,還能促進(jìn)實(shí)體行業(yè)的發(fā)展,在提升行業(yè)效率的同時(shí)優(yōu)化原有的流程,創(chuàng)造出新的價(jià)值增長(zhǎng)點(diǎn),可以說(shuō)是實(shí)體行業(yè)升級(jí)不可多得的機(jī)遇。聚焦AIGC:內(nèi)容皆可生成當(dāng)下,世人的目光被ChatGPT、GPT-4這些AIGC深深吸引。而在清楚地認(rèn)識(shí)這些新事物之前,我們需要梳理一下它們的歷史脈絡(luò),其實(shí)在數(shù)年硝煙彌漫的“內(nèi)容大戰(zhàn)”中,我們已經(jīng)悄然經(jīng)歷了多種內(nèi)容形式的迭代:PGC(professionalgeneratedcontent)、UGC(usergeneratedcontent)和AIUGC(artificiallyintelligentUGC)。PGC即“專業(yè)生產(chǎn)內(nèi)容”,主要指具備專業(yè)背景的內(nèi)容生產(chǎn)者所創(chuàng)造的內(nèi)容;UGC則為“用戶生產(chǎn)內(nèi)容”,其內(nèi)容的源頭更偏大眾化,人人都可作為用戶進(jìn)行內(nèi)容生產(chǎn);AIUGC則為人工智能與UGC的結(jié)合,人工智能參與到了用戶創(chuàng)作內(nèi)容的過(guò)程中。如今,在三度更迭之后,AIGC正式來(lái)襲。與PGC、UGC和AIUGC不同的是,在AIGC的概念中,“無(wú)生命的”人工智能成了完全的內(nèi)容源頭,“無(wú)生命主體”成了為人類創(chuàng)作內(nèi)容的生產(chǎn)者。人工智能在人類社會(huì)的應(yīng)用又取得了顛覆性的突破,透出了不同于以往的炫目光彩,吸引著人們不斷探索。如圖1-7,從PGC、UGC、AIUGC到AIGC,所對(duì)應(yīng)的內(nèi)容數(shù)量呈逐漸增加的趨勢(shì)。圖1-7內(nèi)容創(chuàng)作的四個(gè)發(fā)展階段從字面上看,AIGC就是利用人工智能自動(dòng)生成內(nèi)容的生產(chǎn)方式,它可以在生成式AI模型、訓(xùn)練數(shù)據(jù)等的基礎(chǔ)上,生成文本、圖片、音頻、視頻、代碼等多樣化內(nèi)容,這種快速的內(nèi)容生產(chǎn)方式給市場(chǎng)注入了令人興奮的新鮮血液。AIGC的出現(xiàn),使得各行各業(yè)都受益,使得人們的生活更加便捷。但在發(fā)展得如火如荼的同時(shí),AIGC又引發(fā)了我們對(duì)其更深層次的思考。AIGC開(kāi)啟了新一輪的內(nèi)容生產(chǎn)革命,它在多樣性、質(zhì)量、效率三個(gè)方面推動(dòng)了內(nèi)容生產(chǎn)大踏步前進(jìn)。AIGC的出現(xiàn),既可以滿足消費(fèi)型內(nèi)容亟待擴(kuò)充的需求,也可以快速產(chǎn)出多樣化的內(nèi)容形態(tài),迎合多種細(xì)分場(chǎng)景,以AI作者的身份助力商業(yè)化浪潮的翻涌?;蛟S我們現(xiàn)在正在看的某張圖片、某段視頻就是AI作者的“作品”,而我們卻不自知。下面我們就圍繞AIGC,對(duì)文本、圖片、視頻等不同的內(nèi)容形式展開(kāi)論述,看看AIGC究竟是如何“長(zhǎng)袖善舞”,在各個(gè)內(nèi)容形式中發(fā)揮作用的。文本生成AIGC生成文本目前主要被應(yīng)用于新聞的撰寫、給定格式的撰寫、風(fēng)格改寫以及聊天對(duì)話,GPT是主流的文本生成模型之一。GPT的“學(xué)名”是生成式預(yù)訓(xùn)練模型(generativepre-trainingtransformer),這是一種用來(lái)分析和預(yù)測(cè)語(yǔ)言的人工智能模型,它可以幫助我們進(jìn)行自然語(yǔ)言處理,例如機(jī)器翻譯、自動(dòng)文摘和快速問(wèn)答。GPT的厲害之處是,它可以在文本中自動(dòng)學(xué)習(xí)概念性內(nèi)容,并自動(dòng)預(yù)測(cè)下一段內(nèi)容。也就是說(shuō),它可以根據(jù)上下文記住概念,并能夠在短時(shí)間內(nèi)直接輸出相關(guān)內(nèi)容。GPT背后的基礎(chǔ)模型是一種新型的機(jī)器學(xué)習(xí)技術(shù),它可以幫助我們分析大量的自然語(yǔ)言數(shù)據(jù)。它背靠一個(gè)大型神經(jīng)網(wǎng)絡(luò),通過(guò)在已有文本庫(kù)中找到有關(guān)自然語(yǔ)言的規(guī)律來(lái)學(xué)習(xí)。GPT無(wú)須人工設(shè)計(jì)特定的自然語(yǔ)言處理系統(tǒng),可以根據(jù)已有文本,自動(dòng)生成語(yǔ)法正確、內(nèi)容相關(guān)的文本。有這樣一個(gè)“神器”,很多內(nèi)容就可以借助它的力量來(lái)完成了!GPT的發(fā)展目前經(jīng)歷了GPT-1、GPT-2、GPT-3、GPT-3.5和GPT-4幾個(gè)階段。對(duì)于GPT-1模型,我們可以這么理解:先使用海量沒(méi)有進(jìn)行標(biāo)注的語(yǔ)料,預(yù)訓(xùn)練出一個(gè)語(yǔ)言模型,而后對(duì)語(yǔ)言模型進(jìn)行微調(diào),使之應(yīng)用于特定的語(yǔ)言任務(wù)中。GPT-2則在GPT-1的基礎(chǔ)上進(jìn)行了多任務(wù)的訓(xùn)練,使用了更大的數(shù)據(jù)集,提升了語(yǔ)言處理能力。GPT-3則在訓(xùn)練的參數(shù)量、訓(xùn)練數(shù)據(jù)和訓(xùn)練費(fèi)用上都高于前兩者,能完成更加復(fù)雜的任務(wù)。OpenAI推出的ChatGPT是GPT-3.5的延伸,這是一款聊天機(jī)器人程序,能通過(guò)學(xué)習(xí)和理解人類的語(yǔ)言與人類對(duì)話,還能實(shí)現(xiàn)視頻腳本撰寫、營(yíng)銷文案寫作、文本翻譯、代碼編寫等功能。例如它在代碼理解和編寫方面的能力,就在程序員圈引起了廣泛的關(guān)注:它可以看懂你輸入的代碼片段,幫你解讀其中的含義,甚至可以根據(jù)你的要求幫你編寫一段完整的代碼。如此強(qiáng)大的能力,幾乎顛覆了人們的認(rèn)知,并引發(fā)了諸多關(guān)于“AI替代人類”的相關(guān)討論。而當(dāng)人們還沉浸在ChatGPT帶來(lái)的無(wú)限遐想中時(shí),就在2023年3月,OpenAI推出了史上最強(qiáng)大的模型——GPT-4。它在文學(xué)、醫(yī)學(xué)、法律、數(shù)學(xué)、物理和程序設(shè)計(jì)等不同領(lǐng)域表現(xiàn)出很高的熟練程度,各方面能力已全面超越ChatGPT。不僅如此,它還能夠?qū)⒍鄠€(gè)領(lǐng)域的概念和技能統(tǒng)一起來(lái),并能夠理解一些復(fù)雜概念。OpenAI在官網(wǎng)上演示了這樣一個(gè)示例:向GPT-4展示一張圖片(圖1-8),并詢問(wèn)圖中有什么有趣的地方。而GPT-4的回答相當(dāng)精妙:這幅圖的有趣之處在于,把一個(gè)大而過(guò)時(shí)的VGA(視頻圖形陣列)接口插入一個(gè)小而現(xiàn)代化的智能手機(jī)充電端口,這是十分荒謬的。GPT-4儼然擁有一個(gè)普通人的正常思維。要想深刻了解AI技術(shù)的發(fā)展,我們就需要到推動(dòng)主體——企業(yè)中去。主打AI文本生成的Jasper公司位于美國(guó)加利福尼亞州,通過(guò)其產(chǎn)品的文本生成功能,用戶可以輕松完成生成Instagram(照片墻)標(biāo)題,編寫TikTok(抖音國(guó)際版)視頻腳本、廣告營(yíng)銷文本、電子郵件內(nèi)容等略顯燒腦的重復(fù)性工作。AI文本生成功能一經(jīng)推出,便給社交媒體、跨境電商、視頻制作等多個(gè)新興行業(yè)帶來(lái)了巨大的顛覆力量。圖1-8一張“有趣”的圖片圖片來(lái)源:/research/gpt-4除了Jasper以外,OpenAI更是近期談?wù)揂I時(shí)不可繞過(guò)的熱門企業(yè)。OpenAI是一家AI研究公司,成立于2015年,它旨在促進(jìn)人工智能的安全可控發(fā)展。我們前文中提到的GPT這類卓越的自然語(yǔ)言處理模型,就是OpenAI首創(chuàng)推出的,這也使得OpenAI一躍成為AI行業(yè)的佼佼者。在自己進(jìn)行技術(shù)創(chuàng)新之外,OpenAI也通過(guò)與微軟等行業(yè)巨頭的合作,將AI的應(yīng)用推向更高的層次,這也將為人類的日常生活帶來(lái)豐富的可能性。由于GPT有基于英文語(yǔ)料庫(kù)且不開(kāi)源的局限,國(guó)內(nèi)的技術(shù)人員也在探索我們自有的自然語(yǔ)言處理模型。2020年11月中旬,北京智源人工智能研究院和清華大學(xué)研究團(tuán)隊(duì)就合作推出了中文預(yù)訓(xùn)練模型——清源CPM(ChinesePretrainedModels),我們也有了自主研發(fā)的類似于GPT的模型。圖片生成你是否嘗試過(guò)用AI生成圖片呢?談到AI生成圖片,你第一時(shí)間又會(huì)想到哪個(gè)程序呢?你所使用的程序,很可能背后是由Diffusion(擴(kuò)散)模型來(lái)進(jìn)行技術(shù)支撐的。Diffusion模型是一種新興的AI技術(shù),它的靈感來(lái)源于物理學(xué)中的擴(kuò)散現(xiàn)象:通過(guò)對(duì)圖片不斷加入噪聲來(lái)生成一張模糊的圖片,這個(gè)過(guò)程類似于墨水滴入水池的擴(kuò)散過(guò)程;再通過(guò)深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)模糊的圖片并還原成原始圖片的逆擴(kuò)散過(guò)程,實(shí)現(xiàn)生成圖片的功能。目前,Diffusion模型在視覺(jué)藝術(shù)和設(shè)計(jì)相關(guān)領(lǐng)域非常受歡迎。StabilityAI是一家全球領(lǐng)先的AI研究型企業(yè),致力于開(kāi)發(fā)前沿的人工智能模型。2022年,由該公司與另外兩家初創(chuàng)公司共同研發(fā)的StableDiffusion模型發(fā)布,可以真正實(shí)現(xiàn)“一秒出圖”,這個(gè)“一秒”不是夸張的代指,而是真正的事實(shí)。這就意味著你可以借助AI,實(shí)現(xiàn)自己瑰麗的夢(mèng)境,復(fù)原宏大的想象,也可以為自己的小說(shuō)配上極富幻想感的插圖,不論它們有多超現(xiàn)實(shí),你都可以通過(guò)AI把它們呈現(xiàn)在大家的眼前,讓想象不再孤獨(dú)。2022年,AI繪圖突然大熱,隨著DALL·E2、StableDiffusion、Midjourney等圖像生成領(lǐng)域現(xiàn)象級(jí)應(yīng)用的紛紛興起,AI繪畫就像一陣旋風(fēng),首先在國(guó)外引起了不小的風(fēng)浪,社交平臺(tái)上出現(xiàn)了大量的AI繪畫相關(guān)嘗試和討論。很快這場(chǎng)旋風(fēng)就從國(guó)外刮到國(guó)內(nèi),引起了國(guó)內(nèi)用戶的廣泛關(guān)注。這些應(yīng)用到底有著怎樣驚奇的功能,而它們背后又有哪些企業(yè)在推動(dòng)這場(chǎng)AI繪畫“旋風(fēng)”呢?首先我們把目光放到Midjourney身上(圖1-9),這是由同名研究實(shí)驗(yàn)室開(kāi)發(fā)的AI繪畫工具。在AI繪畫領(lǐng)域,Midjourney降低了藝術(shù)繪畫創(chuàng)作的門檻,用戶只需要輸入文字描述,計(jì)算機(jī)就會(huì)自動(dòng)生成一張作品。Midjourney采用了深度學(xué)習(xí)模型,能夠自動(dòng)為用戶生成高質(zhì)量的繪畫作品,包括素描、油畫等,讓用戶的使用更加方便。毫不夸張地說(shuō),StableDiffusion模型是掀起AI繪畫熱潮的源頭之一,StableDiffusion本身及基于它開(kāi)發(fā)的繪畫工具,讓AI繪畫引爆了輿論熱潮。而其背后的公司StabilityAI在AI繪畫模型爆火前的估值為1億美元,爆火后的估值則為10億美元,狂漲10倍,足見(jiàn)AI技術(shù)產(chǎn)出的大眾化程序有多么強(qiáng)大的市場(chǎng)潛力。圖1-9Midjourney官網(wǎng)與此同時(shí),也有其他公司在AI繪畫賽道“另辟蹊徑”。如一家成立時(shí)間不到兩年的公司PromptBase,主營(yíng)業(yè)務(wù)為銷售AI繪畫工具的提示詞,將提示詞復(fù)制到Midjourney、StableDiffusion等AI繪畫平臺(tái),可以實(shí)現(xiàn)精準(zhǔn)快速的圖像生成,讓用戶在探索提示詞上少走彎路。若把目光轉(zhuǎn)向國(guó)內(nèi),百度集團(tuán)旗下的人工智能產(chǎn)品文心一格也在2022年8月宣布,用戶只需要輸入一段文字,并選擇作畫風(fēng)格,文心一格就可以快速生成一幅畫作。它以百度飛槳深度學(xué)習(xí)平臺(tái)、文心大模型等技術(shù)為支撐,通過(guò)對(duì)海量?jī)?yōu)質(zhì)圖文的學(xué)習(xí),經(jīng)過(guò)多次迭代升級(jí),如今已具備了更強(qiáng)的中文內(nèi)容語(yǔ)義理解能力以及高質(zhì)量圖像生成能力,進(jìn)一步滿足國(guó)內(nèi)用戶對(duì)AI繪畫的需求。視頻生成AIGC視頻生成,是一種基于人工智能的視頻制作技術(shù),它能夠根據(jù)用戶提供的文字提示,自動(dòng)生成視頻內(nèi)容,而且還能夠根據(jù)不同的需求調(diào)整視頻的參數(shù),以達(dá)到最佳效果。這在某種程度上是AIGC圖片生成的延伸,視頻生成的目標(biāo)是生成連續(xù)圖片(每張圖片即一幀)的序列,它可以使用深度神經(jīng)網(wǎng)絡(luò)技術(shù)來(lái)生成高質(zhì)量視頻和動(dòng)態(tài)內(nèi)容,從而極大地提高視頻的制作速度,也能夠讓視頻內(nèi)容更加逼真生動(dòng)。AIGC視頻生成已經(jīng)在很多行業(yè)得到了應(yīng)用,并取得了不錯(cuò)的效果。學(xué)??梢允褂肁I視頻生成技術(shù)來(lái)制作動(dòng)畫片或教學(xué)視頻,醫(yī)院也可以使用AI視頻生成技術(shù)來(lái)模擬手術(shù)過(guò)程,幫助外科醫(yī)生更好地理解手術(shù)流程。我們體驗(yàn)過(guò)的視頻游戲、虛擬現(xiàn)實(shí)(VR)、視頻會(huì)議等,都可能與AIGC視頻生成的技術(shù)有關(guān)。在AIGC視頻生成技術(shù)逐漸成熟后,不少新興科技公司也開(kāi)始使用人工智能技術(shù)來(lái)進(jìn)行影視制作,傳統(tǒng)的影視制作方法與人工智能技術(shù)強(qiáng)強(qiáng)聯(lián)合,能實(shí)現(xiàn)大規(guī)模的動(dòng)態(tài)圖像處理、自動(dòng)剪輯、自動(dòng)字幕添加、智能特效設(shè)計(jì)等,在影視制作中也能極大地解放人力和物力,壓低制作成本。AI影視制作的案例頗多,如電腦藝術(shù)家格倫·馬歇爾(GlennMarshall)的人工智能電影《烏鴉》(TheCrow)就獲得了2022年戛納短片電影節(jié)評(píng)審團(tuán)獎(jiǎng)?!稙貘f》的基礎(chǔ)是視頻網(wǎng)站上的短片Painted,馬歇爾將其輸入OpenAI創(chuàng)建的神經(jīng)網(wǎng)絡(luò)中,然后指導(dǎo)另一個(gè)模型生成圖像,這樣就生成了一段關(guān)于“荒涼風(fēng)景中的烏鴉”的視頻。在電影《速度與激情7》中,劇組將虛擬演員“放置”到視頻中,實(shí)現(xiàn)虛擬與現(xiàn)實(shí)的完美融合,減輕人物和場(chǎng)景的限制,實(shí)現(xiàn)更多可能。這種效果是怎樣實(shí)現(xiàn)的呢?這涉及多重技術(shù)支持:首先從之前的鏡頭中選擇拍攝所需的動(dòng)作和表情,建立數(shù)字成像模型,再渲染出虛擬的人物;在替身演員拍攝完肢體動(dòng)作后,還會(huì)對(duì)臉部進(jìn)行替代。通過(guò)這種方式,逝去的保羅·沃克在電影《速度與激情7》中“重生”,為影迷帶來(lái)了慰藉。在AIGC視頻制作賽道同樣有很多“明星企業(yè)”。2023年2月6日,人工智能初創(chuàng)公司Runway官網(wǎng)宣布推出AI視頻生成模型Gen-1,給競(jìng)爭(zhēng)已十分激烈的AIGC賽道又添了一把熊熊烈火。Gen-1究竟有什么令人驚嘆之處呢?它采用了最新的深度學(xué)習(xí)編碼技術(shù),可以將數(shù)據(jù)轉(zhuǎn)化為精美的3D圖像和視頻,還能根據(jù)文字腳本、圖片、視頻剪輯等進(jìn)行自動(dòng)內(nèi)容生成,創(chuàng)造出真實(shí)感十足的3D場(chǎng)景,幫助使用者體驗(yàn)真實(shí)世界中所不能觸及的情景,比如現(xiàn)在無(wú)法實(shí)現(xiàn)的太空旅行、歷史重現(xiàn)等,小說(shuō)中的“穿越”情節(jié)可以在現(xiàn)實(shí)中上演,給生活帶來(lái)了無(wú)盡想象和無(wú)限可能。此外,Runway還提到會(huì)不斷改進(jìn)Gen-1,讓其以更低的成本和更快的速度,生成更精彩的內(nèi)容,為人類提供無(wú)盡的創(chuàng)意。除行業(yè)新秀外,谷歌也推出了ImagenVideo與Phenaki兩款視頻制作工具。其中,ImagenVideo能夠生成高清以及具有藝術(shù)風(fēng)格的視頻和文本動(dòng)畫,還具有高度的可控性、對(duì)世界知識(shí)和3D對(duì)象的理解能力,而Phenaki能夠根據(jù)一個(gè)故事的時(shí)間線來(lái)生成視頻。另一家硅谷巨頭Meta(臉書部分品牌更名而來(lái))推出的則是MakeA-Video,借助這款工具,可以生成非常富有想象力的奇趣視頻(圖1-10)。圖1-10Make-A-Video生成視頻示例圖片來(lái)源:https://makeavideo.studio除了AIGC在內(nèi)容生成中的多角度應(yīng)用,根據(jù)這項(xiàng)技術(shù)所延展的內(nèi)容工具還能“互通有無(wú)”。不同內(nèi)容形式的模型之間并沒(méi)有壁壘,而是可以聯(lián)合使用,實(shí)現(xiàn)跨模態(tài)的內(nèi)容生成。例如將GPT-3、StableDiffusion一起使用,可以實(shí)現(xiàn)流暢的修圖功能,讓修圖不再費(fèi)時(shí)費(fèi)力,美工不再被甲方的需求折磨。這個(gè)功能為什么可以實(shí)現(xiàn)呢?如圖1-11,我們給定一個(gè)輸入圖像和一個(gè)編輯圖像的文本指令,這樣它就能遵循我們給出的描述性指令來(lái)進(jìn)行圖片的加工編輯了。這聽(tīng)起來(lái)很智能,但實(shí)現(xiàn)此類功能的前提是要精細(xì)化地了解AI的話術(shù)并正確使用有效的提示詞。如果沒(méi)有正確使用提示詞,很容易雞同鴨講。圖1-11通過(guò)給AI發(fā)出指令,給雕像穿上衣服(使用instructPix2Pix生成)總之,從文本、圖片、視頻這幾個(gè)主流的內(nèi)容形式來(lái)看,AIGC已然在其中瘋狂“攻城略地”,取得了難以想象的巨大進(jìn)步,它可以輔助人類創(chuàng)作甚至自動(dòng)生成內(nèi)容。是否會(huì)有那么一天,人類陷入AI構(gòu)造的信息繭房,逃不出數(shù)據(jù)庫(kù)的桎梏,這仍需時(shí)間的考驗(yàn)。但從產(chǎn)業(yè)發(fā)展上看,AI的技術(shù)革新已經(jīng)滲透到人類的日常生活,下沉為人人皆可使用的技術(shù)工具,這是非??上驳淖兓;贏I疾速發(fā)展帶來(lái)的倫理和道德問(wèn)題,或許會(huì)有一段時(shí)間的過(guò)渡期,我們須等待相關(guān)制度和規(guī)則的完善。但AIGC勢(shì)如破竹地闖入了人類的領(lǐng)地,從此與人類相伴相生。生成式AI的核心價(jià)值從前文的敘述中,我們對(duì)人工智能模型的兩個(gè)主要類型——生成式AI和決策式AI有了一定的了解,也明晰了它們各自的“特長(zhǎng)”是什么。簡(jiǎn)單來(lái)說(shuō)就是,決策式AI擅長(zhǎng)的是對(duì)新的場(chǎng)景進(jìn)行分析、判斷和預(yù)測(cè),主要應(yīng)用在人臉識(shí)別、推薦系統(tǒng)、風(fēng)控系統(tǒng)、精準(zhǔn)營(yíng)銷、機(jī)器人、自動(dòng)駕駛等;生成式AI主要擅長(zhǎng)自動(dòng)生成全新內(nèi)容,主流的內(nèi)容形式它基本都能生成,包含文本、圖片、音頻和視頻等。二者在技術(shù)路徑、成熟程度、應(yīng)用方向上都有諸多不同。而在下文中,我們將聚焦生成式AI,圍繞其核心價(jià)值來(lái)展開(kāi)論述。生成式AI聚焦于認(rèn)知的邏輯層面你或許想不到,決策式AI和生成式AI不但名稱不同,從認(rèn)識(shí)論的角度看,二者聚焦的認(rèn)知層面也不相同。何為認(rèn)識(shí)論呢?認(rèn)識(shí)論即為與知識(shí)來(lái)源和知識(shí)判斷相關(guān)的理論。如圖1-12,在認(rèn)識(shí)論中,人們的認(rèn)識(shí)過(guò)程被描摹為金字塔形的結(jié)構(gòu),人類的認(rèn)知會(huì)逐漸進(jìn)階,從數(shù)據(jù)、信息、知識(shí)、邏輯向形而上的哲學(xué)、信仰邁進(jìn),所認(rèn)識(shí)內(nèi)容的顆粒度和結(jié)構(gòu)深度也會(huì)隨之不斷改變。圖1-12生成式AI和決策式AI聚焦于不同的認(rèn)知層面決策式AI聚焦“知識(shí)”層面,而生成式AI則聚焦高一級(jí)的“邏輯”層面,二者在內(nèi)容認(rèn)知程度上大不相同,但還未上升至認(rèn)識(shí)論中的信仰和哲學(xué)層面。因此總體來(lái)說(shuō),決策式AI更多體現(xiàn)的是基于大量數(shù)據(jù)、信息形成的知識(shí)總結(jié)和判斷,生成式AI體現(xiàn)的則是基于知識(shí)、信息和數(shù)據(jù)在邏輯層面產(chǎn)生的創(chuàng)新成果。后者是更接近人類智慧的AI技術(shù),其內(nèi)容的創(chuàng)新強(qiáng)度也更勝一籌。在實(shí)際應(yīng)用中,決策式AI根據(jù)已有數(shù)據(jù)進(jìn)行分析、判斷和預(yù)測(cè),已經(jīng)在推薦系統(tǒng)、風(fēng)控系統(tǒng)和精準(zhǔn)營(yíng)銷等諸多領(lǐng)域?yàn)槿祟惙?wù),而生成式AI作為在認(rèn)識(shí)論模型中更高階的一種,并非只分析已有數(shù)據(jù),而是歸納已有數(shù)據(jù)進(jìn)行演繹創(chuàng)新,也正在內(nèi)容創(chuàng)作、人機(jī)交互、產(chǎn)品設(shè)計(jì)等諸多方面為人類貢獻(xiàn)力量。生成式AI的優(yōu)勢(shì)如果在與決策式AI相對(duì)照后,你還不太理解生成式AI的優(yōu)勢(shì),我們就用一個(gè)簡(jiǎn)單的比喻來(lái)描述一下這兩者:決策式AI更像在做選擇題,分類是它的強(qiáng)項(xiàng);生成式AI則擅長(zhǎng)做簡(jiǎn)答題,以創(chuàng)作為長(zhǎng)處。從更深層次來(lái)說(shuō),決策式AI其實(shí)是有隱患的。我們現(xiàn)在來(lái)考慮這樣一個(gè)場(chǎng)景:假設(shè)我們擁有一種分類效果很好的神經(jīng)網(wǎng)絡(luò)模型,這種網(wǎng)絡(luò)有非常高的準(zhǔn)確率,能游刃有余地處理常規(guī)的圖像分類任務(wù)。但是,我們把一個(gè)加了少許噪聲的圖像輸入模型后,這個(gè)模型居然發(fā)生了十分離譜的錯(cuò)誤,而那張圖像的改變?cè)谌祟愌壑惺治⒉蛔愕?。如圖1-13,在一個(gè)測(cè)試中,技術(shù)人員給一張貓的圖片(模型認(rèn)為圖像是貓的概率為90%,是馬的概率為5%)添加了一些噪聲,模型就離奇地將其分類成了馬(模型認(rèn)為圖像是馬的概率為90%,是貓的概率為5%)。這個(gè)案例說(shuō)明,基于條件分布的神經(jīng)網(wǎng)絡(luò)模型貌似缺乏對(duì)圖片的語(yǔ)義性理解,我們也可以以此來(lái)推測(cè),與之相似的只對(duì)條件分布進(jìn)行建模的決策式AI模型很難理解語(yǔ)義上的信息,也不易做出正確穩(wěn)定的決策。圖1-13噪聲干擾決策式AI的識(shí)別能力對(duì)此我們可以設(shè)想一下,僅需少許簡(jiǎn)單的改變,決策式系統(tǒng)就很有可能放棄它所做出的判斷和選擇,它們又怎么能取得我們的信任呢?若我們所使用的系統(tǒng)建立在如此不穩(wěn)定的模型之上,其日常的運(yùn)行就會(huì)充滿隱患,如嬰兒般的模型很容易走入歧途,給我們帶來(lái)意想不到的麻煩。比如,決策式模型遇到一個(gè)新樣本時(shí)的輸出不穩(wěn)定,原本高價(jià)值的客戶被誤識(shí)別為低價(jià)值客戶,或者原本風(fēng)險(xiǎn)較高的客戶被誤識(shí)別為低風(fēng)險(xiǎn)客戶,這些問(wèn)題在現(xiàn)實(shí)場(chǎng)景中發(fā)生是阻礙決策式AI在更多行業(yè)落地的重要因素。我們從模型背后的原理出發(fā),會(huì)更好理解一些。決策式模型的原理是這樣的:模型會(huì)從海量的貓和狗的圖片數(shù)據(jù)中,了解到貓的外觀和狗的外觀差別非常大,當(dāng)面對(duì)新的樣本時(shí),模型判斷樣本的外觀和誰(shuí)更相似,就認(rèn)為樣本是誰(shuí)。而生成式模型則是這樣:它從訓(xùn)練集中了解到了貓的特質(zhì)(如大小、毛色、身形等個(gè)性化特征),而后從關(guān)于狗的數(shù)據(jù)中也了解到了這些特征,當(dāng)面對(duì)新樣本時(shí),它就會(huì)先提煉其數(shù)據(jù)的特質(zhì),將之和貓、狗分別進(jìn)行比較,兩方都得到一個(gè)概率,哪組數(shù)據(jù)的概率較大,它就認(rèn)為樣本是誰(shuí)。與決策式AI相比,生成式AI顯然成熟得多,它可以學(xué)習(xí)人的思維邏輯,產(chǎn)出具備常理和特定規(guī)則的內(nèi)容。其依托的生成式模型會(huì)關(guān)注結(jié)果是如何產(chǎn)生的,但生成式模型需要的是十分充足的數(shù)據(jù)量,這樣才能保證模型能采樣到數(shù)據(jù)本來(lái)的面目,所以生成式模型的速度相對(duì)來(lái)說(shuō)會(huì)慢一些。與之相反,決策式模型對(duì)數(shù)據(jù)量的要求沒(méi)有那么高,速度會(huì)更快,在小數(shù)據(jù)量下的準(zhǔn)確率也可能更高?;谏墒紸I背后的原理,它的功能如此強(qiáng)大也就不足為奇了。如最新的生成式模型GPT等,就可以生成一系列的內(nèi)容,給予人類更多的方便和選擇,讓人類能享受從冗余工作中被解放的快感。從這個(gè)角度來(lái)說(shuō),生成式AI真是某些打工人的“福星”呢!生成式AI的價(jià)值生成式AI究竟有多么“萬(wàn)能”,以至于令人咋舌呢?我們就在這里做一個(gè)全面的介紹,展示生成式AI的核心價(jià)值,看看它是如何用強(qiáng)大的專業(yè)功能覆蓋眾多工作領(lǐng)域的。如果以粗放的標(biāo)準(zhǔn)來(lái)劃分人類的內(nèi)容生產(chǎn)工作,大略可以分為藝術(shù)創(chuàng)造性工作、設(shè)計(jì)性工作和邏輯思維性工作,而生成式AI在這三類均有涉獵,可以憑借強(qiáng)大的內(nèi)容生產(chǎn)水平讓人類產(chǎn)生“危機(jī)感”。如在藝術(shù)創(chuàng)作領(lǐng)域,繪畫已然不再能難倒生成式AI了。2023年3月,我國(guó)誕生了首部AIGC生成的完整情節(jié)漫畫。藝術(shù)家王睿利用AIGC,以小說(shuō)《元宇宙2086》為藍(lán)本,通過(guò)加噪點(diǎn)、去噪點(diǎn)、復(fù)原圖片、作畫這幾個(gè)步驟,將文字轉(zhuǎn)化成了可視化的內(nèi)容,畫面線條流暢、色彩絢爛,給人以強(qiáng)烈的視覺(jué)沖擊,也在中國(guó)的科技藝術(shù)發(fā)展史上留下了濃墨重彩的一筆。AIGC創(chuàng)作的繪畫作品甚至都進(jìn)入了拍賣領(lǐng)域。2022年12月,AI山水畫的首次拍賣落下帷幕,成交價(jià)為110萬(wàn)元。該畫作是百度文心一格和畫家樂(lè)震文續(xù)畫的陸小曼未完成的畫稿《未完·待續(xù)》。大家都知道,中國(guó)的山水畫注重寫意,很難模仿到神韻,而文心一格將陸小曼存世的畫稿、書法作品等作為AI的訓(xùn)練數(shù)據(jù),大量的數(shù)據(jù)“投喂”使得AI的創(chuàng)作頗具陸小曼畫作的靈性,到了以假亂真的地步。除繪畫外,歌曲創(chuàng)作領(lǐng)域也已經(jīng)被AIGC“入侵”了,百度數(shù)字人度曉曉與龔俊數(shù)字人共同獻(xiàn)聲的《每分每秒每天》這首歌就是AI出品,從作詞到編曲均由AI把控。演唱者度曉曉也大有來(lái)頭,她是國(guó)內(nèi)首個(gè)可交互的虛擬偶像,除了唱歌跳舞,主持也不在話下。喜歡看視頻的朋友也離不開(kāi)AI的幫助。谷歌研究院最近就發(fā)表了一篇論文,致力于將文本條件的視頻擴(kuò)散模型(videodiffusionmodel,VDM)應(yīng)用于視頻編輯,這個(gè)視頻編輯框架可以創(chuàng)建動(dòng)態(tài)相機(jī)運(yùn)動(dòng)、為圖像中的事物設(shè)置動(dòng)畫等,未來(lái)大家也有機(jī)會(huì)利用這項(xiàng)技術(shù)制作自己的個(gè)性化電影。網(wǎng)飛發(fā)布的動(dòng)畫短片《犬與少年》也與AIGC有關(guān)。這個(gè)短片由AIGC制作,而且創(chuàng)造了一個(gè)“第一”——全球首個(gè)AIGC動(dòng)畫短片,人工智能小冰在這部動(dòng)畫里就利用自己的技術(shù)繪制了完整的畫面和場(chǎng)景,讓人類創(chuàng)作者有時(shí)間回歸到更根本的創(chuàng)意性工作中去。在設(shè)計(jì)性工作領(lǐng)域,AIGC更是大展拳腳,平面設(shè)計(jì)、3D設(shè)計(jì)、服裝設(shè)計(jì)、環(huán)境藝術(shù)設(shè)計(jì)等統(tǒng)統(tǒng)不在話下。有了AIGC在繪畫創(chuàng)作中的先例,我們就不難看出它在平面設(shè)計(jì)中也必然很出色。在Midjourney等AIGC繪圖軟件中,只需要標(biāo)明是T恤設(shè)計(jì)、絲巾設(shè)計(jì)還是插畫設(shè)計(jì)、角色設(shè)計(jì),就可以得到可投入使用的設(shè)計(jì)稿,獨(dú)幅圖案抑或是連續(xù)紋樣,它都能輕松搞定。生成式AI還滲透到了3D領(lǐng)域,Magic3D就是GPU(圖形處理器)制造商英偉達(dá)推出的一款應(yīng)用,它會(huì)先用低分辨率粗略地對(duì)事物進(jìn)行3D建模,然后進(jìn)階優(yōu)化為更高分辨率。OpenAI的DreamFields更是不需要照片就能生成3D模型,把“無(wú)中生有”玩得透徹,現(xiàn)在,生成船、花瓶、公共汽車、食物、家具等的模型都不在話下。利用AIGC生成3D模型的技術(shù),未來(lái),游戲、電影、虛擬現(xiàn)實(shí)等領(lǐng)域都不再需要工作人員手動(dòng)進(jìn)行3D建模了,方便、高效了許多。你是不是也好奇AIGC是怎么在服裝領(lǐng)域應(yīng)用的?3D衣物建模是其背后的一項(xiàng)核心技術(shù),隨著技術(shù)的發(fā)展,甚至還能做到3D衣物重建和可控衣物編輯。國(guó)外的ProjectMuze是谷歌與Zalando電商合作,利用谷歌深度學(xué)習(xí)框架打造的AI服裝設(shè)計(jì)師。其所構(gòu)建的神經(jīng)網(wǎng)絡(luò)融合了超過(guò)600名時(shí)裝設(shè)計(jì)師的風(fēng)格和多種設(shè)計(jì)元素,只需用戶輸入性別、喜好、情緒等信息,它就能設(shè)計(jì)出一套獨(dú)特的時(shí)裝。雖然在AI與服裝結(jié)合的道路上,我們還需要摸索進(jìn)行高水準(zhǔn)的設(shè)計(jì),但在服裝設(shè)計(jì)的產(chǎn)業(yè)布局中,AIGC將是不可缺少的一環(huán)。在你生活的城市中,AI說(shuō)不定已經(jīng)在進(jìn)行市區(qū)的環(huán)境藝術(shù)設(shè)計(jì)工作了。谷歌發(fā)布過(guò)一款能幫助城市進(jìn)行綠化工作的AI工具,人類能借助AI和航拍,繪制一張城市的“綠化地圖”,并據(jù)此來(lái)生成綠化建議,用以解決全球變暖造成的極端高溫天氣問(wèn)題。這款A(yù)I工具既高效又科學(xué),取代了傳統(tǒng)上昂貴的逐塊研究綠化的方式。試想一下,在未來(lái)所有的城市中,公園、道路……只要能見(jiàn)到植被的地方,可能都是由AI規(guī)劃并推動(dòng)實(shí)施的,你會(huì)生活在一個(gè)由AI進(jìn)行科學(xué)規(guī)劃后建設(shè)的綠色城市。生活在這里,你應(yīng)該也會(huì)被隨處可見(jiàn)的植物治愈吧。在家裝方面,“AI+家裝”產(chǎn)業(yè)也發(fā)展得如火如荼。AIGC工具可以幫助家裝設(shè)計(jì)師、從業(yè)者快速創(chuàng)作出設(shè)計(jì)圖及方案,促進(jìn)家裝管理及服務(wù)智能化和精準(zhǔn)化,推動(dòng)“AI+家裝”產(chǎn)業(yè)數(shù)字化應(yīng)用升級(jí);另外,引入、應(yīng)用先進(jìn)的智能對(duì)話技術(shù),搭建人工智能客服服務(wù)體系,協(xié)助家裝商家和用戶更為及時(shí)和全面地追蹤服務(wù)進(jìn)度,能進(jìn)一步幫助平臺(tái)打造更加開(kāi)放的家裝內(nèi)容和服務(wù)生態(tài),提升家裝體驗(yàn)。國(guó)內(nèi)的一家科技企業(yè)群核科技成立了AIGC實(shí)驗(yàn)室,旨在拓展全空間領(lǐng)域AIGC,進(jìn)行家居家裝、商業(yè)空間、地產(chǎn)建筑等空間領(lǐng)域的AI設(shè)計(jì)生成和迭代創(chuàng)作。說(shuō)不定以后為我們進(jìn)行家居裝修的都是AI設(shè)計(jì)師。說(shuō)了這么多,你可能會(huì)認(rèn)為,AIGC無(wú)非就是被“喂”了足夠多的人類創(chuàng)作的內(nèi)容,模仿大于創(chuàng)造。其實(shí)AIGC并不是“copy怪”,它還能從事非常需要邏輯思維的工作,像寫代碼這種專業(yè)工作它也能做。ChatGPT可以幫人寫代碼想必大家都已經(jīng)知道了,但可以做到什么程度,大家可能并不太了解。現(xiàn)實(shí)中可能已經(jīng)有讀者用它解決過(guò)不少代碼難題。除了知名度頗高的ChatGPT,aiXcoder公司推出的aiXcoderXL也是AIGC的代表,在2023年2月首次開(kāi)放了代碼生成模型的API(應(yīng)用程序編程接口),讓更多使用者能夠利用人工智能提升軟件開(kāi)發(fā)的質(zhì)量和代碼撰寫的效率,極大地提升應(yīng)用程序的推進(jìn)速度。從寫代碼這點(diǎn)來(lái)說(shuō),AIGC通過(guò)分析大量開(kāi)源項(xiàng)目的代碼,學(xué)習(xí)語(yǔ)言特征,動(dòng)態(tài)生成新的代碼,能夠?qū)Σ煌愋偷娜蝿?wù)更加靈活、快速地進(jìn)行開(kāi)發(fā)。除了上文提到的眾多領(lǐng)域,人工智能還進(jìn)軍醫(yī)藥領(lǐng)域。對(duì)此,“生物版ChatGPT”有話說(shuō)。“生物版ChatGPT”的任務(wù)是生成蛋白質(zhì)。在產(chǎn)業(yè)落地應(yīng)用的場(chǎng)景中,許多從業(yè)者最關(guān)心的問(wèn)題之一就是大分子藥物,尤其是抗體等蛋白質(zhì)類藥物能不能使用AI“一鍵生成”。藥企晶泰科技是AI藥物研發(fā)的先行者,其自主研發(fā)了大分子藥物設(shè)計(jì)平臺(tái)XuperNovo,這個(gè)平臺(tái)包括許多大分子藥物從頭設(shè)計(jì)的策略,其中有一款策略被稱作“ProteinGPT”。如此命名的原因是ProteinGPT的技術(shù)路線與ChatGPT相似,ProteinGPT可以一鍵生成符合要求的蛋白質(zhì)類藥物設(shè)計(jì)。目前,ProteinGPT已經(jīng)被正式應(yīng)用于晶泰科技的各類大分子藥物項(xiàng)目中,表現(xiàn)得非常好。繪畫、影視、環(huán)境藝術(shù)、家裝、代碼、醫(yī)藥……似乎只有我們想不到,沒(méi)有AIGC做不到的,相信未來(lái)AIGC將會(huì)在更多領(lǐng)域得以應(yīng)用,給我們帶來(lái)意想不到的應(yīng)用效果。說(shuō)了這么多,我們對(duì)生成式AI獨(dú)特的價(jià)值和優(yōu)勢(shì)應(yīng)該都有了不少認(rèn)知。其實(shí),生成式AI和決策式AI還能兩相結(jié)合、強(qiáng)強(qiáng)聯(lián)手,多層次、多維度地解決人類更多的煩惱,將我們從機(jī)械式的生硬工作中解放出來(lái),提升內(nèi)容生產(chǎn)的效率,當(dāng)然前提是內(nèi)容質(zhì)量要過(guò)硬。為此,也需要技術(shù)人員對(duì)人工智能進(jìn)行更多的研究、開(kāi)發(fā)和測(cè)試,文明社會(huì)未來(lái)主要的突破口和增長(zhǎng)點(diǎn)或許就系于AIGC之手。里程碑式的存在——ChatGPT近幾年,人工智能技術(shù)領(lǐng)域高潮迭出,給我們引爆了一輪又一輪技術(shù)熱潮,而剛進(jìn)入2023年,人工智能界就出現(xiàn)了“新頂流”——ChatGPT。它最近肯定在大家面前瘋狂刷屏,大家即使不了解它,也早就對(duì)這個(gè)名字耳熟能詳了。那么它到底是什么呢?其實(shí)ChatGPT是一個(gè)由OpenAI公司推出的大型語(yǔ)言模型(largelanguagemodel,LLM),它能幫助開(kāi)發(fā)人員使用自然語(yǔ)言理解來(lái)增強(qiáng)聊天機(jī)器人和智能應(yīng)用程序的功能,可以處理各種任務(wù),如撰寫文章、提供建議、回答問(wèn)題等。自2022年11月推出后,ChatGPT因其強(qiáng)大的功能爆紅,用戶數(shù)量暴增,僅2個(gè)月就達(dá)成了用戶破億的目標(biāo),成為史上用戶最快破億的應(yīng)用。而達(dá)成這一目標(biāo),TikTok用了9個(gè)月,這足以說(shuō)明ChatGPT的受歡迎程度了。ChatGPT的火爆其實(shí)不僅在于它聊天能力強(qiáng),用戶更多的是看重了它“十八般武藝,樣樣都會(huì)”。有人讓它回答腦筋急轉(zhuǎn)彎,它并沒(méi)有被繞進(jìn)去,很快就得出了答案;有人讓它寫一篇關(guān)于“秦始皇摸電門,贏麻了”的文章,它寫得有模有樣,并沒(méi)有對(duì)這個(gè)離譜的主題提出質(zhì)疑;有人讓它寫社交平臺(tái)上的宣發(fā)文案,它連圖形符號(hào)都用得難辨真假;甚至有網(wǎng)友訓(xùn)練它說(shuō)北京話,在一來(lái)一回的對(duì)話訓(xùn)練中,它很快就學(xué)會(huì)了北京話的口語(yǔ)性表達(dá),強(qiáng)大的學(xué)習(xí)能力不禁讓人懷疑對(duì)面是不是有真人在操控。還有人讓它寫策劃、寫文案、編代碼、寫詩(shī)……這么一個(gè)具備強(qiáng)大功能的程序,當(dāng)然會(huì)受到各界人士的歡迎。許多人讓它幫助自己工作,成為代替自己的“二代打工人”。打工人愛(ài)它,學(xué)生黨也愛(ài)它。美國(guó)在線教育供應(yīng)商S的一項(xiàng)針對(duì)1000名美國(guó)學(xué)生的調(diào)查顯示,超過(guò)89%的學(xué)生使用ChatGPT完成家庭作業(yè),48%的學(xué)生用ChatGPT完成小測(cè)驗(yàn),53%的學(xué)生用ChatGPT寫論文?!癈hatGPT風(fēng)”簡(jiǎn)直席卷了大、中、小學(xué),讓學(xué)生黨狂喜。但美國(guó)已經(jīng)出臺(tái)了相關(guān)政策,制止學(xué)生用人工智能完成作業(yè),未來(lái)我們也需要正確引導(dǎo)孩子,讓孩子以科學(xué)的方式接觸這些先進(jìn)的技術(shù)。據(jù)美國(guó)雜志PCMag報(bào)道,谷歌曾經(jīng)給ChatGPT提供了面試程序員的問(wèn)題,結(jié)果它不僅沒(méi)被難倒,甚至還被判定為具備三級(jí)軟件工程師的水準(zhǔn),簡(jiǎn)直讓人瞠目。目前,ChatGPT已經(jīng)開(kāi)始入侵職場(chǎng),根據(jù)職業(yè)咨詢平臺(tái)ResumeB的最新報(bào)告,在1000家企業(yè)調(diào)查樣本中,49%的企業(yè)目前正在使用ChatGPT,主要應(yīng)用在協(xié)助招聘、編寫編碼等工作中。報(bào)告還稱,從2022年11月ChatGPT上線后,不少企業(yè)已經(jīng)將ChatGPT投入了應(yīng)用,在這之中,有48%的企業(yè)開(kāi)始利用ChatGPT代替員工工作,25%的企業(yè)已經(jīng)通過(guò)ChatGPT節(jié)約了75000美元以上的成本,這簡(jiǎn)直給部分崗位的工作者帶來(lái)了失業(yè)的隱患!ChatGPT發(fā)展歷程如前所述,生成式AI通過(guò)學(xué)習(xí)數(shù)據(jù)中的聯(lián)合概率分布,對(duì)已有的數(shù)據(jù)進(jìn)行總結(jié)歸納,再創(chuàng)作出新的內(nèi)容。ChatGPT作為一款自然語(yǔ)言處理模型,通過(guò)學(xué)習(xí)語(yǔ)料中詞匯之間的組合規(guī)律和邏輯,生成合理的接續(xù),實(shí)現(xiàn)內(nèi)容的創(chuàng)作。這類似一個(gè)“接龍”的過(guò)程,ChatGPT根據(jù)上文計(jì)算并生成下一個(gè)詞,然后繼續(xù)生成下面的詞,從而完成一句話或者長(zhǎng)文,也就是“自回歸生成”。因此,雖然訓(xùn)練ChatGPT使用的語(yǔ)料都是現(xiàn)有的已經(jīng)被創(chuàng)作出來(lái)的,但是其創(chuàng)作內(nèi)容不是“抄襲”,不是簡(jiǎn)單的復(fù)制和粘貼,而是在現(xiàn)有語(yǔ)料的基礎(chǔ)上學(xué)習(xí)詞與詞之間的邏輯,創(chuàng)作出新的內(nèi)容。ChatGPT的能力并不是一蹴而就的,提到“神器”ChatGPT的前世今生,那可有太多故事了。其實(shí)ChatGPT的“前世”與Transformer(變換器)模型關(guān)系緊密,由于Transformer模型誕生于2017年,因此我們的故事得從2017年說(shuō)起。2017年,谷歌大腦團(tuán)隊(duì)在神經(jīng)信息處理系統(tǒng)大會(huì)發(fā)表了一篇名為《注意力是你所需要的全部》(AttentionIsAllYouNeed)的論文。這篇論文的作者在文章中第一次提出了一個(gè)基于注意力機(jī)制的Transformer模型,并且把這個(gè)模型首次用在理解人類的語(yǔ)言上,這就是自然語(yǔ)言處理。谷歌大腦團(tuán)隊(duì)利用非常多已經(jīng)公開(kāi)的語(yǔ)言數(shù)據(jù)集來(lái)訓(xùn)練這個(gè)最初的Transformer模型,而這個(gè)Transformer模型包括6500萬(wàn)個(gè)可調(diào)參數(shù)。經(jīng)過(guò)大量的訓(xùn)練后,這個(gè)Transformer模型在英語(yǔ)成分句法分析、翻譯準(zhǔn)確度等多項(xiàng)評(píng)分上都在業(yè)內(nèi)達(dá)到了第一的水準(zhǔn),世界領(lǐng)先,成為當(dāng)時(shí)最為先進(jìn)的大型語(yǔ)言模型。而Transformer模型從誕生之時(shí),也極為深刻地影響了后續(xù)人工智能技術(shù)的發(fā)展道路。僅幾年內(nèi),這個(gè)模型的影響力就已經(jīng)滲透到人工智能的各個(gè)領(lǐng)域,包括多種形式的自然語(yǔ)言模型,以及預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)的AlphaFold2模型等。也就是說(shuō),它就是后續(xù)許多功能強(qiáng)大的AI模型的源頭。在Transformer模型爆火后,有許多團(tuán)隊(duì)都在跟進(jìn)研究這一模型,推出ChatGPT的OpenAI公司也是專注于研究Transformer模型的其中一家公司。在Transformer模型被推出還不足一年的2018年,OpenAI公司有了自己的技術(shù)突破,他們發(fā)表了論文《用生成式預(yù)訓(xùn)練提高模型的語(yǔ)言理解力》(ImprovingLanguageUnderstandingbyGenerativePretraining),還推出了具備1.17億個(gè)參數(shù)的GPT-1模型。GPT-1模型是一個(gè)基于Transformer結(jié)構(gòu)的模型,但訓(xùn)練它的數(shù)據(jù)集更為龐大。OpenAI公司利用一款經(jīng)典的大型書籍文本數(shù)據(jù)集(BookCorpus)對(duì)GPT-1模型進(jìn)行了模型預(yù)訓(xùn)練,這個(gè)數(shù)據(jù)集包括7000多本未出版的圖書,并涵蓋多種類型,如言情、冒險(xiǎn)、恐怖、奇幻等。在對(duì)模型進(jìn)行預(yù)訓(xùn)練后,OpenAI還在四種不同的語(yǔ)言場(chǎng)景下,利用多種相異的特定數(shù)據(jù)集對(duì)模型做了進(jìn)一步的訓(xùn)練。而最終訓(xùn)練出的模型GPT-1,在文本分類、問(wèn)答、文本相似性評(píng)估、蘊(yùn)含語(yǔ)義判定這四個(gè)評(píng)價(jià)維度上,都取得了比基礎(chǔ)Transformer模型更好的結(jié)果,因此也取代Transformer模型,搖身一變成為新的業(yè)內(nèi)龍頭。在發(fā)布GPT-1后的一年,OpenAI公司又公布了一個(gè)“升級(jí)版”的模型——GPT-2。這個(gè)模型的架構(gòu)與GPT-1的原理是相同的,只是規(guī)模比GPT-1大了10倍多,具有15億個(gè)參數(shù),刷新了這種大型語(yǔ)言模型在多項(xiàng)語(yǔ)言場(chǎng)景中評(píng)分的紀(jì)錄。在2020年,OpenAI公司再接再厲,推出了取代GPT-2的GPT-3模型——這個(gè)模型包含1750億個(gè)參數(shù)。GPT-3模型的架構(gòu)也與它的“前任”GPT-2沒(méi)有本質(zhì)區(qū)別,只是規(guī)模更大了。當(dāng)然,GPT-3的訓(xùn)練集比前兩個(gè)GPT模型要大得多:它包含兩個(gè)相異的書籍?dāng)?shù)據(jù)集(一共670億詞符)、已經(jīng)過(guò)基礎(chǔ)過(guò)濾的全網(wǎng)頁(yè)爬蟲(chóng)數(shù)據(jù)集(4290億詞符)、維基百科文章(30億詞符)。由于GPT-3包含太過(guò)龐大的參數(shù)數(shù)目,訓(xùn)練所需數(shù)據(jù)集的規(guī)模也非常巨大,因此成本也很高——保守估計(jì),訓(xùn)練一個(gè)GPT-3模型需要500萬(wàn)美元至2000萬(wàn)美元。用于訓(xùn)練的GPU越多,成本越高,時(shí)間越短;反之也是如此。在使用中,用戶通過(guò)提供提示詞,甚至完全沒(méi)有提示,直接詢問(wèn),就可收獲高質(zhì)量的答案。由于GPT-3并沒(méi)有給用戶提供合適的交互界面,而且還有一定的使用門檻,所以使用過(guò)GPT-3模型的用戶并不是很多。在2022年神經(jīng)信息處理系統(tǒng)大會(huì)中,OpenAI公司再次向大家宣布了它的新突破,它又推出了全新的大型語(yǔ)言預(yù)訓(xùn)練模型:ChatGPT。GPT-3.5是ChatGPT的前身,也是OpenAI對(duì)GPT-3模型進(jìn)行微調(diào)后開(kāi)發(fā)出來(lái)的模型,在GPT-3.5誕生后,ChatGPT才橫空出世。至此,我們所講述的主角誕生,ChatGPT也是目前使用最為廣泛的一款自然語(yǔ)言處理程序,簡(jiǎn)直稱得上是“AI界的頂流”了!各大公司紛紛入場(chǎng)面對(duì)熱烈的市場(chǎng)反響,國(guó)內(nèi)的各大科技企業(yè)也紛紛入局,將“產(chǎn)業(yè)觸手”深入人工智能這片藍(lán)海,例如百度、阿里巴巴、360等國(guó)內(nèi)科技巨頭都先后發(fā)布類ChatGPT產(chǎn)品,以期搶占“中國(guó)版ChatGPT”的市場(chǎng)先機(jī)。而另一頭,海外的科技巨頭如大家熟知的微軟、谷歌等企業(yè),也都加速了在AIGC方面的相關(guān)布局。我們首先來(lái)看看國(guó)內(nèi)一些科技巨頭在相關(guān)產(chǎn)業(yè)的發(fā)展情況。近日有消息稱,阿里達(dá)摩院正在研發(fā)類似ChatGPT的對(duì)話機(jī)器人,尚處于內(nèi)測(cè)階段,而且阿里巴巴還可能結(jié)合AI大模型技術(shù)與釘釘生產(chǎn)力工具,將二者的深度應(yīng)用方式挖掘出來(lái)。關(guān)于ChatGPT在中國(guó)的布局,百度的被關(guān)注度也很高。百度作為國(guó)內(nèi)領(lǐng)先的AI技術(shù)公司,發(fā)布了中國(guó)的類ChatGPT應(yīng)用“文心一言”,其多答案回復(fù)、智能生成等相關(guān)功能,會(huì)漸漸在百度的搜索引擎內(nèi)上線或內(nèi)測(cè),由此可以看出,百度對(duì)AIGC、ChatGPT等技術(shù)已經(jīng)開(kāi)始積極布局了。無(wú)論是阿里還是百度,目前國(guó)內(nèi)科技巨頭的技術(shù)發(fā)展方向都是將ChatGPT相關(guān)技術(shù)融入自己已有的主要產(chǎn)業(yè)模塊,以此謀求深度的商業(yè)增長(zhǎng)。互聯(lián)網(wǎng)企業(yè)360也在ChatGPT相關(guān)技術(shù)上有自己的產(chǎn)業(yè)布局,目前在文本生成圖像、類ChatGPT等AIGC技術(shù)中都有持續(xù)性的成本投入。2023年3月,在360主辦的論壇上,公司創(chuàng)始人周鴻祎演示了一款由360自主研發(fā)的類ChatGPT大型語(yǔ)言模型。該模型在一定程度上已具備對(duì)中文較好的語(yǔ)義理解能力,展示了360在這一方面的階段性成果。阿里巴巴目前也發(fā)布了其大型語(yǔ)言模型“通義千問(wèn)”。據(jù)悉,阿里巴巴今后的所有產(chǎn)品都將接入“通義千問(wèn)”。而“通義千問(wèn)”也展現(xiàn)出了更大的市場(chǎng)野心,相關(guān)負(fù)責(zé)人表示,阿里云將提供完備的算力和大模型基礎(chǔ)設(shè)施,并幫助包括創(chuàng)業(yè)公司在內(nèi)的所有企業(yè)和機(jī)構(gòu)打造自己的專屬大模型,讓它們更好地實(shí)現(xiàn)創(chuàng)新,也讓中國(guó)整體的AI能力有全方位的提升。從國(guó)內(nèi)科技巨頭在AIGC技術(shù)上你追我趕的態(tài)勢(shì)來(lái)看,人工智能相關(guān)的產(chǎn)業(yè)發(fā)展呈現(xiàn)出相當(dāng)光明的發(fā)展前景。說(shuō)完了國(guó)內(nèi)科技巨頭的發(fā)展態(tài)勢(shì),我們?cè)賮?lái)看看國(guó)外的科技巨頭在ChatGPT領(lǐng)域的發(fā)展情況。讓我們把目光投向美國(guó),美國(guó)的微軟是與ChatGPT及其母公司OpenAI關(guān)系最密切的科技巨頭之一。在2023年2月,微軟就推出了最新版本的搜索引擎Bing(必應(yīng))和Edge瀏覽器,二者均由ChatGPT進(jìn)行支持。更新的Bing搜索將會(huì)以類似ChatGPT的方法,來(lái)對(duì)已有大量上下文的問(wèn)題進(jìn)行回答。而正是在同一個(gè)月,微軟還宣布了企業(yè)中的所有產(chǎn)品會(huì)全面與ChatGPT進(jìn)行整合,這些產(chǎn)品包括Azure云服務(wù)、Teams聊天程序、Bing搜索引擎,以及囊括Word、PPT、Excel的“Office全家桶”等。目前,GPT-4已被內(nèi)置于新版Bing搜索引擎中,這也代表著微軟開(kāi)始與谷歌這個(gè)全球搜索引擎的巨頭進(jìn)行對(duì)抗。其實(shí)在這之前,微軟就和ChatGPT的母公司OpenAI深度擴(kuò)展了合作關(guān)系,計(jì)劃擴(kuò)大投資只是一個(gè)基礎(chǔ),OpenAI還會(huì)使用微軟的Azure云計(jì)算服務(wù)來(lái)更快地推動(dòng)人工智能的突破。面對(duì)微軟強(qiáng)勢(shì)的競(jìng)爭(zhēng),谷歌也不甘示弱,推出了AI對(duì)話系統(tǒng)Bard。與微軟采取的方式類似,谷歌也會(huì)把Bard對(duì)話系統(tǒng)與谷歌的搜索引擎相結(jié)合。谷歌的云計(jì)算部門GoogleCloud開(kāi)始與OpenAI打擂臺(tái),宣布與OpenAI的競(jìng)爭(zhēng)對(duì)手Anthropic推進(jìn)全新的合作關(guān)系,而Anthropic也已經(jīng)把谷歌云當(dāng)作自己的首選云提供商。在2023年1月,Anthropic也推出了一款全新的AI聊天機(jī)器人產(chǎn)品Claude,這款產(chǎn)品基于其自研架構(gòu),被認(rèn)為是ChatGPT一個(gè)強(qiáng)有力的競(jìng)爭(zhēng)對(duì)手。老牌巨頭英偉達(dá)與ChatGPT的關(guān)系也不淺,ChatGPT在進(jìn)行模型訓(xùn)練時(shí),至少導(dǎo)入了10000顆英偉達(dá)高端GPU。亞馬遜、Meta等科技巨頭的高管,也都表示想對(duì)AIGC、ChatGPT相關(guān)技術(shù)或產(chǎn)業(yè)進(jìn)行積極布局。在AIGC領(lǐng)域,各個(gè)企業(yè)的市場(chǎng)競(jìng)爭(zhēng)才剛剛開(kāi)始。ChatGPT的應(yīng)用從宏觀角度看完了與ChatGPT有關(guān)的產(chǎn)業(yè)發(fā)展,下面我們來(lái)談?wù)勁c日常生活切實(shí)相關(guān)的話題,那就是ChatGPT究竟有什么用,或者說(shuō)它能給我們帶來(lái)什么。從全網(wǎng)的報(bào)道中我們都能了解到,ChatGPT能在一定程度上幫人們承擔(dān)部分工作,減輕人們的負(fù)擔(dān),具備十分廣泛的應(yīng)用場(chǎng)景,下面我們舉例說(shuō)明。快速閱讀和總結(jié):會(huì)議馬上要開(kāi)始了,你有一份文件還沒(méi)看,閱讀完所有內(nèi)容需要很久,但是你的時(shí)間非常緊張,這時(shí)候你可以將文件復(fù)制并粘貼到ChatGPT的聊天框中,并要求它為你總結(jié)文件中最重要的內(nèi)容(圖1-14)。這項(xiàng)工作ChatGPT已經(jīng)駕輕就熟了,你有機(jī)會(huì)就可以嘗試一下??蛻舴?wù)和支持:ChatGPT能夠以即時(shí)聊天或電子郵件的方式與客戶進(jìn)行交互,來(lái)解決客戶的問(wèn)題和疑慮,并同時(shí)提供支持和指導(dǎo)(圖1-15)。面對(duì)ChatGPT時(shí),你只需給它一個(gè)非常簡(jiǎn)單的提示,比如“寫一封給客戶的問(wèn)候郵件”,ChatGPT就會(huì)給出它生成的例子。你對(duì)輸出的結(jié)果不滿意也不要緊,只需要略微改動(dòng)一下提示再來(lái)一遍,就可以得到完全不一樣的內(nèi)容,ChatGPT幾乎不會(huì)給你兩遍相同的內(nèi)容。交互問(wèn)答:ChatGPT能夠作為一種在線學(xué)習(xí)平臺(tái),在交互中回答問(wèn)題,并提供相應(yīng)的幫助。比如你花費(fèi)一個(gè)周末的時(shí)間學(xué)習(xí)了古羅馬歷史,現(xiàn)在你想對(duì)自己的知識(shí)儲(chǔ)備進(jìn)行測(cè)試。ChatGPT可以輕而易舉地給你提供5個(gè)關(guān)于歷史的問(wèn)題(圖1-16),還能對(duì)你已經(jīng)寫下的試題答案進(jìn)行糾正。圖1-14ChatGPT在快速閱讀和總結(jié)方面的應(yīng)用示例圖1-15ChatGPT在客戶服務(wù)和支持方面的應(yīng)用示例圖1-16ChatGPT在交互問(wèn)答方面的應(yīng)用示例醫(yī)療保?。篊hatGPT能夠?qū)颊哧P(guān)于疾病和治療的問(wèn)題進(jìn)行回答,還能以此為基礎(chǔ)提供一些康復(fù)和營(yíng)養(yǎng)建議。比如你家的小朋友突然胃口不好,你也不知道為什么,這時(shí)候就可以問(wèn)問(wèn)ChatGPT,它有強(qiáng)大的整合能力,會(huì)把孩子胃口不好的原因條分縷析地全部列出來(lái)(圖1-17),你還可以問(wèn)它該怎么辦,讓它充當(dāng)你的“私人健康調(diào)理師”。圖1-17ChatGPT在醫(yī)療保健方面的應(yīng)用示例進(jìn)行代碼審查:你是否曾經(jīng)有過(guò)這樣的體驗(yàn),花費(fèi)了整整一天的時(shí)間寫代碼,但現(xiàn)在實(shí)在是太累了,沒(méi)有精力去復(fù)查自己敲下來(lái)的代碼?這時(shí)候ChatGPT也能派上用場(chǎng),你可以要求它去檢查代碼中的錯(cuò)誤并修改,為自己省下大把精力(圖1-18)。進(jìn)行代碼評(píng)論:不少程序員表示這個(gè)功能太讓他們心動(dòng)了!如果你給ChatGPT一段代碼,并且讓它做注釋去解釋每段代碼的作用,它就會(huì)反饋給你一段注釋的代碼(圖1-19)。這同樣能夠幫程序員們省不少事,讓工作變得順暢很多。Excel助手:在日常辦公中讓ChatGPT幫我們編寫幾個(gè)Excel公式也是沒(méi)問(wèn)題的。我們把表格處理的需求通過(guò)文字描述的方式輸入給ChatGPT,ChatGPT便能生成一段Excel公式,經(jīng)驗(yàn)證,這段公式是實(shí)際可用的(圖1-20)。圖1-18ChatGPT在代碼審查方面的應(yīng)用示例圖1-19ChatGPT在代碼評(píng)論方面的應(yīng)用示例前面我們提到了一些ChatGPT的基礎(chǔ)應(yīng)用場(chǎng)景,其實(shí)它的技能遠(yuǎn)不止于此,甚至還能在營(yíng)銷、客服、風(fēng)控等業(yè)務(wù)里發(fā)揮自己的功用。它能直接幫助跨境電商的賣家生成營(yíng)銷內(nèi)容,在開(kāi)展智能廣告投放、提供即時(shí)客戶服務(wù)、改善客戶體驗(yàn)等方面降本增效。如果你是一個(gè)電商平臺(tái)的店主,需要馬上上架一款商品,但是寫文案的員工請(qǐng)假了,這個(gè)時(shí)候你就可以利用ChatGPT來(lái)迅速生成一段營(yíng)銷文案。當(dāng)然,前提是你需要告訴它你想要的風(fēng)格和主題。已經(jīng)有不少人嘗試過(guò)拿它生成小紅書文案了。類似ChatGPT的大型語(yǔ)言模型還可以提升金融業(yè)務(wù)流程的自動(dòng)化水平,使得用戶信用數(shù)據(jù)、歷史借款記錄、還款記錄等數(shù)據(jù)分析以及關(guān)鍵信息要素提取、用戶風(fēng)險(xiǎn)等級(jí)評(píng)估等工作環(huán)節(jié)都趨向于自動(dòng)化,全面提升行業(yè)的風(fēng)險(xiǎn)識(shí)別能力。隨著模型的升級(jí)更新,相信以后它的“業(yè)務(wù)范圍”也會(huì)越來(lái)越廣。圖1-20ChatGPT在Excel助手方面的應(yīng)用示例2023年3月,OpenAI宣布正式上線了ChatGPT插件系統(tǒng)。OpenAI表示,現(xiàn)在的語(yǔ)言模型雖然在各類任務(wù)中都能有所表現(xiàn),但有的時(shí)候結(jié)果還不盡如人意。而通過(guò)加入更多數(shù)據(jù)進(jìn)行訓(xùn)練,則可以不斷提升模型效果。OpenAI將插件形象地比喻成“眼睛和耳朵”,新上線的插件系統(tǒng)能與開(kāi)發(fā)人員定義的API進(jìn)行交互,從而將ChatGPT與第三方應(yīng)用程序?qū)樱@樣模型可以獲取更多、更新或其他未被包含在訓(xùn)練數(shù)據(jù)內(nèi)的信息。插件執(zhí)行安全、受控的操作,提高了整個(gè)系統(tǒng)的實(shí)用性,ChatGPT所能適用執(zhí)行的范圍也變得更為廣泛??偟膩?lái)說(shuō),從相關(guān)應(yīng)用場(chǎng)景來(lái)看,ChatGPT能夠進(jìn)行快速閱讀和總結(jié)、客戶服務(wù)和支持、代碼審查、代碼評(píng)論、醫(yī)療保健、營(yíng)銷內(nèi)容生成等工作,但也不僅限于此。隨著模型技術(shù)和算力技術(shù)的不斷進(jìn)步,ChatGPT也會(huì)進(jìn)一步走向更高階的迭代版本,為人類在更多的行業(yè)和領(lǐng)域內(nèi)進(jìn)行應(yīng)用,并生成更豐富和美好的對(duì)話和內(nèi)容。但是,ChatGPT在應(yīng)用中也不可避免地表現(xiàn)出一些局限和弊端:ChatGPT的回答不夠準(zhǔn)確,存在胡謅或混淆等情況,用戶需要自行判斷;ChatGPT缺乏人類的判斷力,不能辨明真假,無(wú)法理解和解決復(fù)雜問(wèn)題,甚至存在倫理風(fēng)險(xiǎn);ChatGPT模型需要不斷進(jìn)行訓(xùn)練和調(diào)整,需要提供大量的學(xué)習(xí)語(yǔ)料和算力支持,導(dǎo)致成本巨大;ChatGPT模型本身也存在不穩(wěn)定、不透明、無(wú)法解釋等情況;ChatGPT給社會(huì)帶來(lái)了失業(yè)焦慮和恐慌,有人預(yù)測(cè)類似大模型的發(fā)展會(huì)造成大量失業(yè)。任何工具都有弊有利,ChatGPT也不例外。面對(duì)ChatGPT呈現(xiàn)出的雙面性反饋,我們更要對(duì)這種工具進(jìn)行合理化應(yīng)用。推進(jìn)人工智能的發(fā)展,仍然任重而道遠(yuǎn)。第二章AIGC的底層邏輯現(xiàn)在你應(yīng)該了解我們廣泛使用的生成式AI是何方神圣了。在本章,我們將更加深入,從底層技術(shù)邏輯,也就是“用什么去生成”的角度,繼續(xù)剖析生成式AI,讓它的“骨骼”和“脈絡(luò)”展現(xiàn)出來(lái)。本章的內(nèi)容包含生成式AI的基礎(chǔ)模型,包括Transformer模型、GPT模型和Diffusion模型。你可能會(huì)覺(jué)得這些看起來(lái)有點(diǎn)難度,但讀完了這一章,你就能理解這些模型的運(yùn)行邏輯,如此才能更好地應(yīng)用生成式AI為自己服務(wù)。生成式模型基礎(chǔ)人工智能領(lǐng)域經(jīng)過(guò)最近十多年的發(fā)展達(dá)到目前的高度,技術(shù)上最大的功臣無(wú)疑是深度學(xué)習(xí)。而深度學(xué)習(xí)的爆發(fā)式增長(zhǎng)狀態(tài)得益于海量的數(shù)據(jù)、圖形處理器帶來(lái)的強(qiáng)大算力以及模型的持續(xù)改進(jìn)。2006年,計(jì)算機(jī)科學(xué)家、認(rèn)知心理學(xué)家杰弗里·辛頓(GeoffreyHinton)首次提出了“深度信念網(wǎng)絡(luò)”。與傳統(tǒng)的訓(xùn)練方式不同,深度信念網(wǎng)絡(luò)有一個(gè)“預(yù)訓(xùn)練”(pre-training)的過(guò)程,可以方便地讓神經(jīng)網(wǎng)絡(luò)中的權(quán)值找到一個(gè)接近最優(yōu)解的值,之后再使用“微調(diào)”(fine-tuning)來(lái)對(duì)整個(gè)網(wǎng)絡(luò)進(jìn)行優(yōu)化訓(xùn)練。這種分階段的訓(xùn)練方法大幅度減少了訓(xùn)練深度學(xué)習(xí)模型的時(shí)間。毫無(wú)疑問(wèn),前文中我們提到的GPT、ChatGPT、Diffusion等生成式AI模型都屬于深度學(xué)習(xí)模型。那么,什么是深度學(xué)習(xí),它和機(jī)器學(xué)習(xí)又有什么關(guān)系?有哪些經(jīng)典的深度學(xué)習(xí)模型對(duì)我們理解最新的生成式AI有幫助?本節(jié)將為你回答這些問(wèn)題。深度學(xué)習(xí)的前世今生機(jī)器學(xué)習(xí)是人工智能的分支,它專門研究計(jì)算機(jī)如何模擬和實(shí)現(xiàn)人類的學(xué)習(xí)行為。在人工智能發(fā)展過(guò)程中,機(jī)器學(xué)習(xí)占據(jù)核心地位。通過(guò)各種模型,機(jī)器學(xué)習(xí)可以從海量的數(shù)據(jù)中習(xí)得規(guī)律,從而對(duì)新的數(shù)據(jù)做出智能識(shí)別或者預(yù)測(cè),并且為決策提供支持。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種。如圖2-1所示,人工智能是一個(gè)范圍很大的概念,其中包括了機(jī)器學(xué)習(xí)。機(jī)器學(xué)習(xí)是人工智能提升性能的重要途徑,而深度學(xué)習(xí)又是機(jī)器學(xué)習(xí)的重要組成部分。深度學(xué)習(xí)解決了許多復(fù)雜的識(shí)別、預(yù)測(cè)和生成難題,使機(jī)器學(xué)習(xí)向前邁進(jìn)了一大步,推動(dòng)了人工智能的蓬勃發(fā)展。那么深度學(xué)習(xí)又是如何發(fā)展起來(lái)的呢?圖2-1人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)關(guān)系示意圖深度學(xué)習(xí)的概念最初起源于人工神經(jīng)網(wǎng)絡(luò)(artificialneuralnetworks)??茖W(xué)家發(fā)現(xiàn)人的大腦中含有大約1000億個(gè)神經(jīng)元,大腦平時(shí)所進(jìn)行的思考、記憶等工作,其實(shí)都是依靠神經(jīng)元彼此連接而形成的神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行的。人工神經(jīng)網(wǎng)絡(luò)是一種模仿人類神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行信息處理的模型,它具有自主學(xué)習(xí)和自適應(yīng)的能力。1943年,數(shù)學(xué)家皮茨(Pitts)和麥卡洛克(McCulloch)建立了第一個(gè)神經(jīng)網(wǎng)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 釀酒廠天然氣供氣服務(wù)合同
- 物聯(lián)網(wǎng)工程居間合同
- 農(nóng)業(yè)政策支持方案
- 補(bǔ)充借款合同格式
- 新媒體運(yùn)營(yíng)合作協(xié)議
- 林木種植與林業(yè)管理作業(yè)指導(dǎo)書
- 大型鉆機(jī)租賃合同
- 大廈物業(yè)租賃合同
- 小學(xué)二年級(jí)數(shù)學(xué)上冊(cè)口算題卡
- 2025年漢中貨運(yùn)上崗證模擬考試試題
- 鎖骨遠(yuǎn)端骨折伴肩鎖關(guān)節(jié)脫位的治療
- 2015年新版《中華人民共和國(guó)職業(yè)分類大典》
- 企業(yè)生產(chǎn)制造部門預(yù)算編制模板
- 新概念英語(yǔ)第二冊(cè)單詞默寫表
- 教育心理學(xué)智慧樹(shù)知到答案章節(jié)測(cè)試2023年浙江師范大學(xué)
- 食品檢驗(yàn)檢測(cè)機(jī)構(gòu)能力建設(shè)計(jì)劃方案
- 共板法蘭風(fēng)管制作安裝
- 2020年血液凈化感染控制操作規(guī)程課件
- 計(jì)算機(jī)輔助工藝設(shè)計(jì)課件
- 汽車銷售流程與技巧培訓(xùn)課件
- 管理學(xué)專業(yè):管理基礎(chǔ)知識(shí)試題庫(kù)(附含答案)
評(píng)論
0/150
提交評(píng)論