AIGC(人工智能生成內(nèi)容)白皮書_第1頁
AIGC(人工智能生成內(nèi)容)白皮書_第2頁
AIGC(人工智能生成內(nèi)容)白皮書_第3頁
AIGC(人工智能生成內(nèi)容)白皮書_第4頁
AIGC(人工智能生成內(nèi)容)白皮書_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

AIGC(人工智能生成內(nèi)容)白皮書在當前數(shù)字世界和物理世界加速融合的大背景下,人工智能生成內(nèi)容(ArtificialIntelligenceGeneratedContent,簡稱AIGC)正在悄然引導著一場深刻的變革,重塑甚至顛覆數(shù)字內(nèi)容的生產(chǎn)方式和消費模式,將極大地豐富人們的數(shù)字生活,是未來全面邁向數(shù)字文明新時代不可或缺的支撐力量。

人工智能生成內(nèi)容的發(fā)展歷程與概念

1950年,艾倫·圖靈(AlanTuring)在其論文《計算機器與智能(ComputingMachineryandIntelligence)》中提出了著名的“圖靈測試”,給出了判定機器是否具有“智能”的試驗方法,即機器是否能夠模仿人類的思維方式來“生成”內(nèi)容繼而與人交互。某種程度上來說,人工智能從那時起就被寄予了用于內(nèi)容創(chuàng)造的期許。經(jīng)過半個多世紀的發(fā)展,隨著數(shù)據(jù)快速積累、算力性能提升和算法效力增強,今天的人工智能不僅能夠與人類進行互動,還可以進行寫作、編曲、繪畫、視頻制作等創(chuàng)意工作。2018年,人工智能生成的畫作在佳士得拍賣行以43.25萬美元成交,成為世界上首個出售的人工智能藝術品,引發(fā)各界關注。隨著人工智能越來越多地被應用于內(nèi)容創(chuàng)作,人工智能生成內(nèi)容(ArtificialIntelligenceGeneratedContent,簡稱AIGC)的概念悄然興起。

AICG歷史沿革結合人工智能的演進歷程,AIGC的發(fā)展大致可以分為三個階段:

即:早期萌芽階段(20世紀50年代至90年代中期)、沉淀積累階段(20世紀90年代中期至21世紀10年代中期),以及快速發(fā)展階段(21世紀10年代中期至今)。自2014年起,隨著以生成式對抗網(wǎng)絡(GenerativeAdversarialNetwork,GAN)為代表的深度學習算法的提出和迭代更新,AIGC迎來了新時代,生成內(nèi)容百花齊放,效果逐漸逼真直至人類難以分辨。2017年,微軟人工智能少女“小冰”推出了世界首部100%由人工智能創(chuàng)作的詩集《陽光失了玻璃窗》。2018年,英偉達發(fā)布的StyleGAN模型可以自動生成圖片,目前已升級到第四代模型StyleGAN-XL,其生成的高分辨率圖片人眼難以分辨真假。2019年,DeepMind發(fā)布了DVD-GAN模型用以生成連續(xù)視頻,在草地、廣場等明確場景下表現(xiàn)突出。2021年,OpenAI推出了DALL-E并于一年后推出了升級版本DALL-E-2,主要應用于文本與圖像的交互生成內(nèi)容,用戶只需輸入簡短的描述性文字,DALL-E-2即可創(chuàng)作出相應極高質量的卡通、寫實、抽象等風格的繪畫作品。AIGC的概念與內(nèi)涵

目前,對AIGC這一概念的界定,尚無統(tǒng)一規(guī)范的定義。

國內(nèi)產(chǎn)學研各界對于AIGC的理解是“繼專業(yè)生成內(nèi)容(ProfessionalGeneratedContent,PGC)和用戶生成內(nèi)容(UserGeneratedContent,UGC)之后,利用人工智能技術自動生成內(nèi)容的新型生產(chǎn)方式”。在國際上對應的術語是“人工智能合成媒體(AI-generatedMedia或SyntheticMedia)”,其定義是“通過人工智能算法對數(shù)據(jù)或媒體進行生產(chǎn)、操控和修改的統(tǒng)稱”。綜上所述,我們認為AIGC既是從內(nèi)容生產(chǎn)者視角進行分類的一類內(nèi)容,又是一種內(nèi)容生產(chǎn)方式,還是用于內(nèi)容自動化生成的一類技術集合。從發(fā)展背景方面來看,AIGC的興起源于深度學習技術的快速突破和日益增長的數(shù)字內(nèi)容供給需求。一方面,技術進步驅動AIGC可用性不斷增強。另一方面,海量需求牽引AIGC應用落地。隨著數(shù)字經(jīng)濟與實體經(jīng)濟融合程度不斷加深,以及Meta、微軟、字節(jié)跳動等平臺型巨頭的數(shù)字化場景向元宇宙轉型,人類對數(shù)字內(nèi)容總量和豐富程度的整體需求不斷提高。

技術能力從技術能力方面來看,AIGC根據(jù)面向對象、實現(xiàn)功能的不同可分為三個層次。一是智能數(shù)字內(nèi)容孿生其主要目標是建立現(xiàn)實世界到數(shù)字世界的映射,將現(xiàn)實世界中的物理屬性(如物體的大小、紋理、顏色等)和社會屬性(如主體行為、主體關系等)高效、可感知地進二是智能數(shù)字內(nèi)容編輯其主要目的是建立數(shù)字世界與現(xiàn)實世界的雙向交互。在數(shù)字內(nèi)容孿生的基礎上,從現(xiàn)實世界實現(xiàn)對虛擬數(shù)字世界中內(nèi)容的控制和修改,同時利用數(shù)字世界高效率仿真和低成本試錯的優(yōu)勢,為現(xiàn)實世界的應用提供快速迭代能力。三是智能數(shù)字內(nèi)容創(chuàng)作其主要目標是讓人工智能算法具備內(nèi)容創(chuàng)作和自我演化的能力,形成的AIGC產(chǎn)品具備類似甚至超越人的創(chuàng)作能力。以上三個層面的能力共同構成AIGC的能力閉環(huán)。

應用價值從應用價值方面來看,AIGC將有望成為數(shù)字內(nèi)容創(chuàng)新發(fā)展的新引擎,為數(shù)字經(jīng)濟發(fā)展注入全新動能。一方面,AIGC能夠以優(yōu)于人類的制造能力和知識水平承擔信息挖掘、素材調(diào)用、復刻編輯等基礎性機械勞動,從技術層面實現(xiàn)以低邊際成本、高效率的方式滿足海量個性化需求;同時能夠創(chuàng)新內(nèi)容生產(chǎn)的流程和范式,為更具想象力的內(nèi)容、更加多樣化的傳播方式提供可能性,推動內(nèi)容生產(chǎn)向更有創(chuàng)造力的方向發(fā)展。另一方面,AIGC能夠通過支持數(shù)字內(nèi)容與其他產(chǎn)業(yè)的多維互動、融合滲透從而孕育新業(yè)態(tài)新模式,打造經(jīng)濟發(fā)展新增長點,為千行百業(yè)發(fā)展提供新動能。2021年以來,“元宇宙”呈現(xiàn)出超出想象的發(fā)展爆發(fā)力;作為數(shù)實融合的“終極”數(shù)字載體,元宇宙將具備持續(xù)性、實時性、可創(chuàng)造性等特征,也將通過AIGC加速復刻物理世界、進行無限內(nèi)容創(chuàng)作,從而實現(xiàn)自發(fā)有機生長。人工智能生成內(nèi)容的技術體系及其演進方向

AIGC技術升級步入深化階段人工智能算法的不斷迭代是AIGC發(fā)展進步的源動力,從技術演進的角度出發(fā),可將AIGC技術可大致劃分為傳統(tǒng)基于模板或規(guī)則的前深度學習階段和深度神經(jīng)網(wǎng)絡快速發(fā)展的深度學習階段。AIGC大模型架構潛力凸顯超級深度學習近年來的快速發(fā)展帶來了深度神經(jīng)網(wǎng)絡技術在大模型和多模態(tài)兩個方向上的不斷突破,并為AIGC技術能力的升級提供了強力的支撐和全新的可能性。AIGC技術演化出三大前沿能力AIGC技術被廣泛應用于音頻、文本、視覺等不同模態(tài)數(shù)據(jù),并構成了豐富多樣的技術應用。分別是智能數(shù)字內(nèi)容孿生能力,智能數(shù)字內(nèi)容編輯能力和智能數(shù)字內(nèi)容創(chuàng)作能力。除了對各種模態(tài)數(shù)據(jù)內(nèi)容的修復和增強,近年間,數(shù)字內(nèi)容孿生中智能增強技術在三維視覺領域取得了快速地發(fā)展。在數(shù)字內(nèi)容孿生技術的基礎上,智能數(shù)字內(nèi)容編輯的相關技術構建了虛擬數(shù)字世界與現(xiàn)實物理世界間的交互通道。從技術角度看,智能數(shù)字內(nèi)容編輯主要通過數(shù)字內(nèi)容的語義理解和屬性控制兩類技術來實現(xiàn)對內(nèi)容的修改和控制。資料來源:京東探索研究院人工智能生成內(nèi)容的應用場景1.AIGC+傳媒:人機協(xié)同生產(chǎn),推動媒體融合。在采編環(huán)節(jié),一是實現(xiàn)采訪錄音語音轉寫,提升傳媒工作者的工作體驗。2022年冬奧會期間,科大訊飛的智能錄音筆通過跨語種的語音轉寫助力記者2分鐘快速出稿。二是實現(xiàn)智能新聞寫作,提升新聞資訊的時效。三是實現(xiàn)智能視頻剪輯,提升視頻內(nèi)容的價值。2022年冬奧會期間,央視視頻通過使用AI智能內(nèi)容生產(chǎn)剪輯系統(tǒng),高效生產(chǎn)與發(fā)布冬奧冰雪項目的視頻集錦內(nèi)容,為深度開發(fā)體育媒體版權內(nèi)容價值,創(chuàng)造了更多的可能性。在傳播環(huán)節(jié),AIGC應用主要集中于以AI合成主播為核心的新聞播報等領域。AI合成主播開創(chuàng)了新聞領域實時語音及人物動畫合成的先河,只需要輸入所需要播發(fā)的文本內(nèi)容,計算機就會生成相應的AI合成主播播報的新聞視頻,并確保視頻中人物音頻和表情、唇動保持自然一致,展現(xiàn)與真人主播無異的信息傳達效果。2.AIGC+電商:推進虛實交融,營造沉浸體驗。隨著數(shù)字技術的發(fā)展和應用、消費的升級和加快,購物體驗沉浸化成為電商領域發(fā)展的方向。AIGC正加速商品3D模型、虛擬主播乃至虛擬貨場的構建,通過和AR、VR等新技術的結合,實現(xiàn)視聽等多感官交互的沉浸式購物體驗。3.AIGC+影視:拓展創(chuàng)作空間,提升作品質量。隨著影視行業(yè)的快速發(fā)展,從前期創(chuàng)作、中期拍攝到后期制作的過程性問題也隨之顯露,存在高質量劇本相對缺乏、制作成本高昂以及部分作品質量有待提升等發(fā)展痛點,亟待進行結構升級。

運用AIGC技術能激發(fā)影視劇本創(chuàng)作思路,擴展影視角色和場景創(chuàng)作空間,極大地提升影視產(chǎn)品的后期制作質量,幫助實現(xiàn)影視作品的文化價值與經(jīng)濟價值最大化。4.AIGC+娛樂:擴展輻射邊界,獲得發(fā)展動能在數(shù)字經(jīng)濟時代,娛樂不僅拉近了產(chǎn)品服務與消費者之間的距離,而且間接滿足了現(xiàn)代人對歸屬感的渴望,重要性與日俱增。

借助于AIGC技術,通過趣味性圖像或音視頻生成、打造虛擬偶像、開發(fā)C端用戶數(shù)字化身等方式,娛樂行業(yè)可以迅速擴展自身的輻射邊界,以更加容易被消費者所接納的方式,獲得新的發(fā)展動能。5.AIGC+其他:推進數(shù)實融合,加快產(chǎn)業(yè)升級除以上行業(yè)之外,教育、金融、醫(yī)療、工業(yè)等各行各業(yè)的AIGC應用也都在快速發(fā)展。教育領域,AIGC賦予教育材料新活力。金融領域,AIGC助力實現(xiàn)降本增效。醫(yī)療領域,AIGC賦能診療全過程。工業(yè)領域,AIGC提升產(chǎn)業(yè)效率和價值??傮w來看,AIGC正在發(fā)展成與其他各類產(chǎn)業(yè)深度融合的橫向結合體,其相關應用正加速滲透到經(jīng)濟社會的方方面面。人工智能生成內(nèi)容發(fā)展面臨的問題

隨著人工智能技術發(fā)展步入快車道,AIGC因為其快速的反應能力、生動的知識輸出、豐富的應用場景,在社會生產(chǎn)和生活的方方面面發(fā)揮著重要的作用。

但與此同時,AIGC的關鍵技術、企業(yè)核心能力和相關法律法規(guī)尚未完善,圍繞公平、責任、安全的爭議日益增多。關鍵技術不夠完全成熟,大規(guī)模推廣落地尚存痛點、難點。

目前,AIGC技術不斷升級,進一步釋放內(nèi)容生產(chǎn)力,但其在人工智能關鍵技術方面尚存在局限,掣肘產(chǎn)業(yè)發(fā)展進程。一是人工智能算法存在固有缺陷;二是AIGC內(nèi)容編輯與創(chuàng)作技術不夠完善;三是企業(yè)風險治理能力尚未完善。2022年5月,最新出臺的《關于推進實施國家文化數(shù)字化戰(zhàn)略的意見》,要求研究制定扶持文化數(shù)字化建設的產(chǎn)業(yè)政策,強調(diào)各地要因地制宜制定具體實施方案,相關部門要細化政策措施。未來,各地、各部門政策的支持力度、推進落實和動態(tài)調(diào)整情況將決定著技術與社會的相互建構程度,將對AIGC技術在社會情境中的發(fā)展起到重要作用。未來展望

從真實可控向多樣組合發(fā)展從技術層面上看,目前AIGC的相關算法已經(jīng)具備了真實復刻和創(chuàng)造某類既定內(nèi)容的能力,同時相關模型對簡單場景的內(nèi)容生成也取得了較好成果,但面對多樣性變化和復雜場景內(nèi)容生成的挑戰(zhàn),現(xiàn)有AIGC的算法能力仍需進一步提升。從本地化集中式向大規(guī)模分布式發(fā)展作為數(shù)字經(jīng)濟和實體經(jīng)濟深度融合的新模式,AIGC通過應用大量新型人工智能技術來創(chuàng)造和制作豐富的創(chuàng)新型、高質量、可交互的數(shù)字內(nèi)容,這給當前人工智能技術的研究帶來了全新的挑戰(zhàn),針對大規(guī)模分布式AIGC交互算法的研究是時下緊迫且熱門的主題,也是AIGC技術未來的發(fā)展方向之一。隨著AIGC核心技術的不斷發(fā)展,其內(nèi)容孿生、內(nèi)容編輯、內(nèi)容創(chuàng)作三大基礎能力將顯著增強。目前,AIGC已經(jīng)在多個領域得到廣泛應用,如金融、傳媒、文娛、電商等,未來應用場景會進一步多元化生態(tài)建設日

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論