AIGC應(yīng)用重塑交互體驗看好虛擬人、教育

上傳人：b*** IP屬地：境外上傳時間：2023-04-09 格式：PPTX 頁數(shù)：37 大?。?.45MB 積分：22 舉報 版權(quán)申訴

已閱讀5頁，還剩32頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

2目錄第一章前言第三章風(fēng)險提示第二章國內(nèi)相關(guān)公司：新華網(wǎng)、藍(lán)色光標(biāo)等AI升級交互體驗，虛擬人和教育應(yīng)用場景廣闊海外相關(guān)應(yīng)用：AI聊天應(yīng)用Glow和其他產(chǎn)業(yè)鏈公司3前言（1）AI升級交互體驗，虛擬人和教育應(yīng)用場景廣闊圖：在交互體驗提升方面，AI+虛擬人/教育的應(yīng)用場景圖譜中信建投+虛擬人商場和辦公樓導(dǎo)覽虛擬主播（電商、電競）虛擬偶像初音未來+教育教學(xué)輔助早教K12教育職業(yè)培訓(xùn)會說話的湯姆貓TennrAI提詞器多模態(tài)AIGC模型提升交互體驗景區(qū)和博物館導(dǎo)游B端C端4前言（2）走向多模態(tài)，從“數(shù)字人”到“數(shù)智人”Sequoia，中信建投多模態(tài)升級交互體驗，實(shí)現(xiàn)“數(shù)字人”向“數(shù)智人”轉(zhuǎn)變。單模態(tài)以情感陪伴聊天機(jī)器人Glow為代表的“數(shù)字人”為例，其已經(jīng)可以實(shí)現(xiàn)與真人的個性化、擬人化、智能化的聊天互動，但交互方式仍局限在文本、語音。未來，隨著多模態(tài)模型的發(fā)展，虛擬人或機(jī)器人的交互方式，有望拓展至圖片、音樂乃至視頻，并以更貼近真人的邏輯、理解、表達(dá)能力進(jìn)行交流和反饋，從而提升虛擬人在電商、直播、教育、客服、社交、文旅導(dǎo)覽等領(lǐng)域的互動體驗。AI模型與應(yīng)用向多模態(tài)升級迭代。Vision

Transformer模型、擴(kuò)散模型、BEiT模型等技術(shù)的迭代，實(shí)現(xiàn)了傳統(tǒng)單模態(tài)大模型中自然語言處理能力與計算機(jī)視覺能力的結(jié)合，以及大規(guī)模自監(jiān)督預(yù)訓(xùn)練，由此使得大模型具備了理解、處理和生成圖片、音視頻等多模態(tài)的能力，催生了Open

AIGPT-4、谷歌PaLM-E、百度文心一言等多模態(tài)大模型。多模態(tài)模型也帶動了多模態(tài)應(yīng)用的誕生，涉及代碼生成、文本生成、圖像生成、音視頻、游戲、虛擬人等領(lǐng)域。圖：AIGC由單模態(tài)向多模態(tài)迭代DALL-E2StableDiffusionDALL-EImagenVideoMake-a-videoPhenakiGPT-3Jasper.AIChatGPTCodex代碼文本圖像音視頻/3D/游戲2020202120224月8月10月9月11月Midjourney7月6月CodeWhisperer三大AI繪圖應(yīng)用支持模型底層技術(shù)20232月Bard3月文心一言GPT-4Palm-EaiXcoderCopilotCopy.aiMeena2019及更早底層技術(shù)微軟小冰StableDiffusion

2TabNine科大訊飛SMART-TTSMagic3D盜夢師6pen多模態(tài)5前言（3）全球知名創(chuàng)投YC，前瞻性投資30+AI應(yīng)用項目圖：YC

23年Winter

Batch投資的生成式AI項目Y

Combinator，中信建投Y

Combinator成立于2005年，為美國知名創(chuàng)業(yè)孵化公司，在胡潤研究院發(fā)布的《2021全球獨(dú)角獸投資機(jī)構(gòu)百強(qiáng)榜》中，位列第12位。據(jù)福布斯中國，YC目前已資助公司超3500家，包括80家獨(dú)角獸公司，例如Dropbox、Airbnb、Reddit等YC最新投資項目涉及生成式AI在生產(chǎn)力提效、交互場景、開發(fā)者相關(guān)領(lǐng)域應(yīng)用。YC

每年推出2

期孵化計劃，

即WinterBatch

和

Summer

Batch

，由全球申請者中篩選出的具有發(fā)展?jié)摿Φ墓窘M成。YC將為入選項目提供50萬美元種子輪融資、創(chuàng)業(yè)建議以及業(yè)內(nèi)資源。在23年初Winter

Batch的210個項目中，有36個生成式AI項目，應(yīng)用場景涵蓋市場營銷、客戶服務(wù)、知識管理、數(shù)據(jù)分析、基礎(chǔ)設(shè)施、開發(fā)者工具等。6前言（4）虛擬人：擺脫“套皮”，解決“偽需求”問題Y

Combinator，中信建投開發(fā)平臺、交互、算力優(yōu)化等虛擬人產(chǎn)業(yè)鏈布局解決需求問題，推動行業(yè)發(fā)展。通過梳理AIGC應(yīng)用落地場景，我們已看到虛擬人產(chǎn)業(yè)鏈已有智能開發(fā)平臺、交互升級、算法優(yōu)化等方面的布局。隨著AIGC技術(shù)加深與虛擬人產(chǎn)業(yè)鏈的融合，預(yù)計有望降低虛擬人開發(fā)成本、解決“套皮”問題、交互不擬人等，從而推動虛擬人的落地和發(fā)展。虛擬人開發(fā)成本：結(jié)合AIGC的元宇宙內(nèi)容開發(fā)平臺，解決數(shù)字內(nèi)容開發(fā)成本高、效率低的困境。解決“套皮”問題：隨著多模態(tài)模型的推出，有望實(shí)現(xiàn)文本/語音、視頻/模型等多內(nèi)容模式的AI智能化產(chǎn)出，從而擺脫真人套皮問題。加速器減輕設(shè)備壓力：語音和視覺結(jié)合的AI生成對設(shè)備需要較高，而相關(guān)算法的優(yōu)化有助降低運(yùn)營成本壓力，實(shí)現(xiàn)更大規(guī)模的普及。圖：虛擬人產(chǎn)業(yè)鏈的AI落地場景算力優(yōu)化虛擬人互動開發(fā)平臺元宇宙內(nèi)容系統(tǒng)3D建模3D建模視頻生成Glow情感陪伴聊天機(jī)器人ChatGPT加速器7前言（5）教育：AI輔助教學(xué)+虛擬人教學(xué)雙線推動場景落地Y

Combinator，中信建投大模型、專業(yè)知識調(diào)用教育算力優(yōu)化教學(xué)輔助教材生成我們認(rèn)為教育場景的AIGC技術(shù)落地，將主要有兩種模式：AI輔助真人教學(xué)：在海外的AIGC應(yīng)用場景中，我們看到在銷售場景，已有多種輔助工具落地，包括AI提詞器、AI素材生產(chǎn)等，預(yù)計這些場景的AI融合有助真人教學(xué)統(tǒng)一或升級教學(xué)質(zhì)量，多樣化教學(xué)形式，也更有利于在線教育平臺在降本的同時，維持商業(yè)化的能力。虛擬人教學(xué)：隨著文字/語音輸出的內(nèi)容更加擬人，且多模態(tài)模型優(yōu)化了虛擬人動作、表情僵硬等問題，虛擬人也有望落地教育場景。尤其對早教而言，交互體驗升級也有望實(shí)現(xiàn)教學(xué)質(zhì)量的統(tǒng)一和提升。圖：教育產(chǎn)業(yè)鏈的AI落地場景分析調(diào)用大語言模型情況管理大語言模能力構(gòu)建、微調(diào)大語言模能力集成多種機(jī)器學(xué)習(xí)能力加速器基于文字與音樂生成視頻文本修改對應(yīng)音頻編輯對話式檢索內(nèi)容AI培訓(xùn)工具AI提詞器8目錄第一章前言第三章風(fēng)險提示第二章國內(nèi)相關(guān)公司：新華網(wǎng)、藍(lán)色光標(biāo)等AI升級交互體驗，虛擬人和教育應(yīng)用場景廣闊海外相關(guān)應(yīng)用：AI聊天應(yīng)用Glow和其他產(chǎn)業(yè)鏈公司91.1.1Glow：用戶定義人設(shè)的AI情感陪伴聊天機(jī)器人Glow，中信建投Glow為基于大模型的AI聊天應(yīng)用，由國內(nèi)人工智能創(chuàng)業(yè)公司MiniMax在22年11月推出，為用戶提供情感陪伴、滿足虛構(gòu)情景想象的體驗。據(jù)甲子光年，Glow上線約4個月后，目前已有約500萬用戶?；谟脩裘枋?，生成個性化對話機(jī)器人。Glow的基本玩法是用戶在應(yīng)用中創(chuàng)建AI機(jī)器人“智能體”，智能體將基于用戶描述的性格、人設(shè)、頭像及選定的音色等，與用戶開展實(shí)時溝通、互動。也可輸入“參考名人”，智能體將具備特定名人的有關(guān)知識儲備。據(jù)體驗，創(chuàng)建的“托尼斯塔克”智能體有《復(fù)仇者聯(lián)盟》系列的知識儲備，具備較強(qiáng)代入感。圖表：

Glow智能體創(chuàng)建過程設(shè)定智能體的姓名、性別、性格、人設(shè)等基于文字和參考圖片生成頭像根據(jù)基礎(chǔ)音色組合生成智能體音色與智能體開展對話101.1.2

Glow：提供情感陪伴體驗，輔助虛構(gòu)情景聯(lián)想Glow，中信建投1）互動對象多元，提供差異化、多樣化、個性化聊天體驗。用戶可與自己創(chuàng)建的個性化智能體進(jìn)行聊天互動，也可與平臺內(nèi)其他用戶創(chuàng)建的智能體互動。用戶可為其他用戶創(chuàng)建的智能體補(bǔ)充專屬設(shè)定，讓相關(guān)智能體符合用戶個性化需求。據(jù)觀察，平臺內(nèi)部分智能體已與近6萬個用戶進(jìn)行互動。2）互動方式當(dāng)前僅為文字和語音。據(jù)體驗，目前Glow內(nèi)智能體暫時無法反饋圖片內(nèi)容，但從對話內(nèi)容來看，隨著產(chǎn)品的改進(jìn)，圖片內(nèi)容或在后續(xù)版本中引入。此外，用戶也可以切換智能體的反饋，從而按照用戶的偏好推進(jìn)聊天。圖表：平臺內(nèi)其他用戶創(chuàng)建的智能體可設(shè)置個性化設(shè)定圖表：智能體暫時無法提供圖片內(nèi)容切換智能體的反饋智能體可設(shè)置個性化設(shè)定111.1.3

Glow：提供情感陪伴體驗，輔助虛構(gòu)情景聯(lián)想3）互動話題多元，包含情感、虛構(gòu)情景聯(lián)想等。用戶可以與智能體就任何話題內(nèi)容進(jìn)行聊天，可完成情緒反饋、對話問答、簡易信息搜尋等，也可以根據(jù)特定的話題，選擇關(guān)聯(lián)的智能體進(jìn)行聊天，例如情感、美食、虛構(gòu)情景（如遭遇吸血鬼的場景）等。其中，平臺官方智能體季楓和沈思前具備劇情模式，通過主動引導(dǎo)用戶對話，來推動劇情演繹并完成任務(wù)。4）互動記錄可公開，豐富可瀏覽內(nèi)容。Glow擁有記憶簿功能，即用戶可將智能體對話的部分內(nèi)容公開，供平臺內(nèi)其他用戶瀏覽、評價，本質(zhì)上是用戶與AI共創(chuàng)內(nèi)容，以豐富平臺內(nèi)的內(nèi)容供給。Glow，中信建投圖表：Glow話題多圍繞情感、奇幻情景聯(lián)想等圖表：“吸血鬼”話題關(guān)聯(lián)的智能體圖表：同一智能體可就關(guān)聯(lián)的不同話題展開討論圖表：其他用戶公開的智能體記憶簿121.1.4

Glow：提供情感陪伴體驗，輔助虛構(gòu)情景聯(lián)想中信建投我們認(rèn)為，相比于微信、探探、ChatGPT等聊天應(yīng)用，Glow或在一定程度上更好地解決用戶情感陪伴以及奇幻情景聯(lián)想的需求，從而增強(qiáng)用戶的使用粘性。情感陪伴方面：Glow的智能體可實(shí)時響應(yīng)、性格多樣，相比于工具屬性較強(qiáng)的ChatGPT，能反饋個性更加鮮明的回復(fù)，能一定程度上滿足用戶傾訴、尋求情緒反饋乃至獵奇的需求；且相比于微信、探探等真人社交應(yīng)用，用戶使用Glow時，不必?fù)?dān)心情感宣泄給對方造成的負(fù)擔(dān)或?qū)ψ陨碚鎸?shí)形象的影響。奇幻情景聯(lián)想方面：據(jù)體驗，Glow能一定程度滿足用戶對虛構(gòu)人物、虛構(gòu)場景的幻想。智能體設(shè)定方面，可設(shè)定為歷史名人、影視文學(xué)作品人物、動物乃至虛構(gòu)生物；虛構(gòu)場景方面，用戶的話題可設(shè)定在歷代王朝、鬼屋乃至影視文學(xué)作品內(nèi)等。基于真人社交的微信、探探等，這方面體驗較少。圖表：

Glow與其他社交APP對比對比方面微信探探ChatGPTGlow定位熟人社交陌生人社交虛擬社交虛擬社交應(yīng)用場景辦公、日常溝通交友聊天、工具情感陪伴、奇幻聯(lián)想對話發(fā)生背景現(xiàn)實(shí)真實(shí)生活現(xiàn)實(shí)真實(shí)生活-現(xiàn)實(shí)真實(shí)生活或虛擬世界數(shù)學(xué)、代碼等強(qiáng)推理能力因人而異因人而異強(qiáng)弱互動對象真人真人人工智能基于人工智能設(shè)定的多種生物實(shí)時響應(yīng)較及時較慢實(shí)時響應(yīng)實(shí)時響應(yīng)，部分智能體主動問候?qū)υ掞L(fēng)格因人而異因人而異單一千人千面，或按用戶個性化設(shè)定隱私泄露問題較大較大較小較小對用戶真實(shí)人格/經(jīng)歷的熟知程度強(qiáng)較弱弱弱131.1.5

Glow的開發(fā)公司MiniMax：小而美的高科技公司，支持產(chǎn)品迭代、變現(xiàn)Glow的技術(shù)支持由開發(fā)公司MiniMax提供，

核心為三大模態(tài)的基礎(chǔ)模型架構(gòu)、“User-in-the-Loop”的用戶反饋機(jī)制以及優(yōu)秀技術(shù)人員配置。1

）

掌握自研三大模態(tài)的基礎(chǔ)模型架構(gòu)。MiniMax為北京稀宇科技有限公司，是2021年成立的人工智能創(chuàng)業(yè)公司，通過直接從底層模型切入，基于Transformer架構(gòu)，自研了文本到視覺、文本到語音、文本到文本三大模態(tài)的基礎(chǔ)模型架構(gòu)，是國內(nèi)較早同時擁有3個模態(tài)大模型能力的創(chuàng)業(yè)公司。模型開發(fā)投入相對可控。據(jù)技術(shù)合伙人楊斌，文本、語言、視覺三模態(tài)是幾乎所有數(shù)字內(nèi)容的基礎(chǔ)形態(tài)，只需一個較小的團(tuán)隊，來共同維護(hù)優(yōu)化三個大模型、做好用戶閉環(huán)，即可具備較好的內(nèi)容生成能力。據(jù)甲子光年，MiniMax目前團(tuán)隊人數(shù)約100人。資料來源：甲子光年，財報網(wǎng)，量子位，Glow，中信建投圖表：

MiniMax基礎(chǔ)模型架構(gòu)支持Glow運(yùn)作文本到視覺文本到文本文本到語音TransformerMiniMax-

Glow高魯棒性低成本計算推理平臺14Glow，中信建投1.1.6

MiniMax：小而美的高科技公司，支持產(chǎn)品迭代、變現(xiàn)2）用戶反饋機(jī)制優(yōu)化產(chǎn)品體驗。Glow基于“User-in-the-Loop”進(jìn)行產(chǎn)品輸出結(jié)果的人為優(yōu)化，即在與智能體對話過程中，用戶針對智能體的回答可給予“點(diǎn)贊”“差評”“有趣”“邏輯不通”的反饋，模型將由此強(qiáng)化對用戶對話喜好的認(rèn)知，從而優(yōu)化產(chǎn)品體驗。此機(jī)制與ChatGPT的基于人類反饋的強(qiáng)化學(xué)習(xí)機(jī)制類似（Reinforcement

Learning

from

HumanFeedback，RLHF）。即大語言模型（LLM）接收提示符并輸出多個回答后，人類對其回答進(jìn)行評估與排序，在獎勵模型（Reward

Model）中按回答的質(zhì)量高低賦予不同獎勵，并將獎勵結(jié)果反饋給LLM，LLM據(jù)此進(jìn)行強(qiáng)化學(xué)習(xí)，以優(yōu)化下一輪結(jié)果輸出。圖表：

Glow的用戶反饋機(jī)制“User-in-the-Loop”與RLHF類似智能體回答②用戶對智能體回答進(jìn)行反饋③獎勵模型用戶輸入的文字①輸入MiniMax的大語言模型輸出（LargeLanguage

Model）①大語言模型（LargeLanguage

Model）回答（Output）人類研究員對回答（Output）的質(zhì)量進(jìn)行評估與排序獎勵模型（Reward

Model）提示符（Prompt）輸入輸出②③151.1.7

MiniMax：小而美的高科技公司，支持產(chǎn)品迭代、變現(xiàn)3）公司核心技術(shù)成員多具備豐富產(chǎn)業(yè)或?qū)W術(shù)界經(jīng)驗。據(jù)甲子光年，MiniMax核心技術(shù)人員均來自全球知名高校和全球知名科技公司，具備較豐富的自然語言處理、語音、計算機(jī)視覺、計算機(jī)圖形學(xué)等業(yè)界或?qū)W術(shù)界經(jīng)驗，近33%的成員擁有世界知名技術(shù)實(shí)驗室博士學(xué)位，擁有上百個全球發(fā)明專利。例如聯(lián)合創(chuàng)始人閆俊杰為中科院自動化所博士，在深度學(xué)習(xí)和計算機(jī)視覺領(lǐng)域發(fā)表的論文被Google

Scholar引用超1萬次，也曾在商湯負(fù)責(zé)搭建深度學(xué)習(xí)底層算法及人臉識別等技術(shù)體系。資料來源：甲子光年，財報網(wǎng)，量子位，愛企查，游戲葡萄，中信建投圖表：

MiniMax部分核心成員簡歷核心成員公司職位學(xué)術(shù)經(jīng)驗產(chǎn)業(yè)經(jīng)驗閆俊杰聯(lián)合創(chuàng)始人2015年博士畢業(yè)于中科院自動化所；在深度學(xué)習(xí)和計算機(jī)視覺領(lǐng)域，發(fā)表頂級會議和期刊論文100余篇,

Google

Scholar引用超過10000次前商湯科技副總裁、通用智能技術(shù)負(fù)責(zé)人，曾任商湯研究院副院長，負(fù)責(zé)搭建深度學(xué)習(xí)的工具鏈和底層算法，以及通用智能的技術(shù)發(fā)展，搭建了商湯的人臉識別和智慧城市相關(guān)的技術(shù)體系楊斌技術(shù)合伙人2014年碩士期間在中科院自動化所參與深度學(xué)習(xí)相關(guān)項目，2016年在加拿大多倫多大學(xué)攻讀博士學(xué)位Uber

ATG研究院、自動駕駛初創(chuàng)公司W(wǎng)aabi創(chuàng)始團(tuán)隊成員周彧聰法定代表人畢業(yè)于北京航空航天大學(xué)，曾獲得世界大學(xué)生超級計算機(jī)競賽ASC15總決賽和國際超級計算機(jī)大會ISC17第一；面向輕量級人臉識別的挑戰(zhàn)賽AI視覺頂會ICCV

2019

LFR

挑戰(zhàn)賽中，周彧聰所在團(tuán)隊獲得愛奇藝視頻人臉識別大型識別模型iQIYI-Large

賽道的冠軍商湯科技早期員工之一，曾在商湯科技研究院帶領(lǐng)算法團(tuán)隊161.1.8

MiniMax：小而美的高科技公司，支持產(chǎn)品迭代、變現(xiàn)資料來源：甲子光年，財報網(wǎng)，量子位，中信建投OpenAI

GPT-3開放API商業(yè)模式：MiniMax與OpenAI具有相似的商業(yè)模式規(guī)劃，均發(fā)掘C端和B端變現(xiàn)場景。OpenAI：

在完成GPT-3

模型的前期測試后進(jìn)行了C端和B端的商業(yè)化。C端為聊天機(jī)器人應(yīng)用ChatGPT，試點(diǎn)付費(fèi)訂閱版本“ChatGPT

Plus”，可在高峰時段獲得更快的回答響應(yīng)，每月收取20美元。B端則面向付費(fèi)用戶與企業(yè)開放API模型GPT-3.5-turbo，每1k個token價格為0.002美元，比現(xiàn)有的GPT-3.5模型節(jié)省成本90%，海外已有Shopify、Snap、Quizlet等平臺率先接入ChatGPT

API。MiniMax：基于三個基礎(chǔ)模型的調(diào)優(yōu)測試，公司推出了C端聊天機(jī)器人Glow，目前暫未開放收費(fèi)。B端方面，據(jù)甲子光年，MiniMax從2023年起會逐步開放API，讓更多的個人用戶和企業(yè)用戶基于多種模態(tài)的大模型構(gòu)建自己的應(yīng)用。鑒于ChatGPT的收費(fèi)模式，我們預(yù)計當(dāng)Glow用戶數(shù)突破一定數(shù)量時，也會采用付費(fèi)訂閱模式，優(yōu)先保障付費(fèi)會員的流暢使用體驗，或類似ChatGPT接入微軟Teams，接入國內(nèi)其他公司的應(yīng)用生態(tài)，從而實(shí)現(xiàn)變現(xiàn)。圖表：MiniMax與OpenA具有相似的商業(yè)模式規(guī)劃ChatGPT C端B端三大自研基礎(chǔ)模型GlowMiniMax開放APIC端B端171.1.9

MiniMax：小而美的高科技公司，支持產(chǎn)品迭代、變現(xiàn)Glow，游戲葡萄，中信建投或?qū)@得米哈游投資，估值10億美元。2022年上半年，高科技風(fēng)投明勢資本領(lǐng)投MiniMax的天使輪融資，明勢資本已投資理想汽車、小牛電動、赤子城等。此外，據(jù)游戲葡萄了解，米哈游已經(jīng)對去對MiniMax的兩輪投資，近期正考慮與紅杉資本共同開展新一輪投資，MiniMax估值或達(dá)10億美元。新一輪投資有望為MiniMax的產(chǎn)品研發(fā)和推廣提供支持。2月開啟現(xiàn)金激勵用戶推廣Glow。2月，Glow官方開啟代言人招募計劃，用戶通過在抖音、小紅書、B站發(fā)布Glow相關(guān)的視頻或文字內(nèi)容，相關(guān)內(nèi)容瀏覽量、點(diǎn)贊量達(dá)到一定數(shù)額即可獲得10元現(xiàn)金獎勵，后續(xù)發(fā)布內(nèi)容最高單篇獎勵2250元。關(guān)注后續(xù)破圈效果。圖表：Glow開啟代言人招募計劃181.2

虛擬人生成：Runway—GEN-2發(fā)布，視頻制作門檻再降低Runway，中信建投3月20日人工智能初創(chuàng)公司Runway開放了新一代視頻生成模型GEN-2的試用申請，能夠基于文本、圖片、視頻等內(nèi)容，為藝術(shù)家、設(shè)計師、電影制作人員提供了多樣的、低門檻的生成視頻方式。新增功能：第一代視頻生成模型GEN-1，具備視頻生成視頻的能力，具體包括視頻+圖片生成視頻、實(shí)體模型或渲染動畫轉(zhuǎn)為視頻、修改視頻中特定物體外形等；GEN-2模型新增了純文本生成視頻、文本+圖片生成視頻、圖片生成視頻的能力。圖表：GEN-1和GEN-2對比191.3

虛擬人生成：Iliad—游戲模型和圖片素材生成工具Iliad：主要服務(wù)于游戲開發(fā)公司的AI模型和圖片素材生成工具。產(chǎn)品主要將文字生成圖片、2D圖片轉(zhuǎn)3D圖片等AIGC形式應(yīng)用于游戲場景中。Iliad可以幫助游戲公司的美術(shù)人員生成效果圖、3D模型和模型肌理等內(nèi)容，也可以實(shí)現(xiàn)2D轉(zhuǎn)3D的模型生成。圖表：Iliad中的文字生成圖片功能YCombinatorWinter2023Batch，lliad，中信建投①繪制簡單圖形②對目標(biāo)模型進(jìn)行詳細(xì)描述③快速生成模型④可回溯生成進(jìn)度進(jìn)行再修改⑤繼續(xù)生成得到最終模型1.4

虛擬人生成&教材編輯：Decoherence—基于文字與音樂生成視頻Decoherence：基于文字與音樂生成視頻。

Decoherence基于用戶輸入的關(guān)鍵詞，以及時長、FPS、動畫效果、背景音樂等參數(shù)設(shè)置，生成動畫短視頻。

Decoherence能將音頻信號識別為運(yùn)動效果，并將圖像拼接在一起以制作完整的視頻。Decoherence降低了用戶編輯視頻的門檻，但生成的視頻分辨率及時長有限、幀率不高、聲音選擇較少，難以滿足部分高要求用戶。用戶需付費(fèi)使用Decoherence，月度套餐為每月30美元，可生成超過100個視頻。圖表：Decoherence的視頻參數(shù)操作界面①選取視頻風(fēng)格 ①選取視頻時長及FPS ③插入背景音樂文件④設(shè)置動畫隨音樂的運(yùn)動效果⑤設(shè)置文字描述20視頻實(shí)現(xiàn)由“女性”向“車”的過渡YCombinatorWinter

2023Batch

，Decoherence，中信建投211.5

教材編輯：Descript—文本修改對應(yīng)音頻編輯Descript：文本修改對應(yīng)音頻編輯。Descript可以將音頻內(nèi)容轉(zhuǎn)錄成對應(yīng)的文本，用戶編輯轉(zhuǎn)錄后的文稿時，將對應(yīng)修改原始音頻，包括刪詞、改詞、補(bǔ)詞，其中對于新添加的文本，Descript

可在自動轉(zhuǎn)錄時生成原始音頻的聲音，以避免補(bǔ)錄，并支持自動識別和分離不同的說話人。定價方面，Descript根據(jù)團(tuán)隊用戶數(shù)和每月轉(zhuǎn)錄時長提供不同訂閱版本。其中免費(fèi)版每月有1小時轉(zhuǎn)錄時長；每月

10小時、30小時的版本分別對應(yīng)定價每月12美元、24

美元。圖表：Descript通過編輯音頻轉(zhuǎn)錄生成的文本，來編輯音頻YCombinatorWinter2023Batch，36氪，中信建投②通過編輯轉(zhuǎn)錄文檔以刪除或補(bǔ)錄對應(yīng)音頻內(nèi)容①上傳用戶聲音的音頻文件221.6

教學(xué)輔助：Meru—對話方式提取文件中信息Meru：對話式提取文件中數(shù)據(jù)。Meru的作用相當(dāng)于為部分文件內(nèi)嵌對話機(jī)器人，通過調(diào)用API將特定的文檔、文件、網(wǎng)址等文件的信息進(jìn)行提取，從而像人類一樣，通過對話方式，反饋給用戶個性化的相關(guān)答案，免去了用戶主動搜索數(shù)據(jù)信息的過程。Meru也允許直接調(diào)用存儲在Dropbox、Box、GoogleDrive內(nèi)的文檔。Meru已開放多種付費(fèi)套餐。用戶可以免費(fèi)使用Meru，更高價格的付費(fèi)版本將對應(yīng)更多的詢問次數(shù)、可調(diào)用的文件存儲服務(wù)及其他增值服務(wù)等，價位在99美元/599元每月，也可定制需求。長文檔YCombinatorWinter2023Batch，

Meru

，中信建投圖表：

用戶使用Meru，從美國稅務(wù)局文件中，快速提取關(guān)于報稅的電話上傳文檔至Meru的云服務(wù)平臺Meru根據(jù)文檔內(nèi)容回答用戶提問231.7

教學(xué)輔助的替代場景：Fabius—AI銷售培訓(xùn)工具Fabius：AI銷售培訓(xùn)工具。Fabius利用Gong/Chorus等軟件的錄音，分析銷售人員在產(chǎn)品定位和向客戶推銷的做法，并提供個性化和實(shí)用的改進(jìn)建議，也可以為客戶對話匹配相關(guān)的銷售培訓(xùn)課程，幫助銷售團(tuán)隊提高銷售效率和質(zhì)量。銷售主管也可以改進(jìn)Fabius的預(yù)測，糾正其中缺少的關(guān)鍵步驟。圖表：

Fabius為銷售人員提供的反饋意見YCombinatorWinter2023Batch，中信建投圖表：

Fabius可為銷售主管提高銷售流程的可見性241.8

教學(xué)輔助的替代場景：Tennr—輔助銷售人員的AI提詞器Tennr：輔助銷售人員的AI提詞器。Tennr本質(zhì)為提詞器，通過使用AI技術(shù)，可為銷售人員和經(jīng)理提供每次電話銷售前的準(zhǔn)備工作，提高交易達(dá)成的幾率。例如，Tennr可根據(jù)買家關(guān)心的方面，調(diào)取銷售人員過去贏得的類似交易，從而向銷售人員展示業(yè)務(wù)中使用的話術(shù)，或提供與過去類似交易相關(guān)的最佳解決方案；也可以分析銷售通話，提取關(guān)鍵信息，如買家的需求、痛點(diǎn)、預(yù)算和時間表PersanaAI

，Tennr，中信建投圖表：

Tennr為銷售人員可能面臨的提問給予參考Tennr內(nèi)部業(yè)務(wù)文件（通話錄音、CRM數(shù)據(jù)、營銷文檔）交易室（用戶正在交談的每家公司的相關(guān)內(nèi)容）為銷售人員提供參考外部數(shù)據(jù)（第三方來源）圖表：

Tennr工作原理251.9

專業(yè)知識學(xué)習(xí)：Anarchy—為第三方應(yīng)用構(gòu)建可調(diào)用特定API的對話機(jī)器人Anarchy：為第三方應(yīng)用構(gòu)建可調(diào)用特定API的對話機(jī)器人。Anarchy本質(zhì)是幫開發(fā)者客戶集成外部API以及大語言模型，讓客戶為自己的產(chǎn)品增加對話機(jī)器人的功能。Anarchy可以調(diào)用任何外部API，例如可調(diào)用谷歌地圖

API

，回答用戶關(guān)于兩地之間旅程距離的問題；或者調(diào)用股票應(yīng)用了解股票股價APIYCombinatorWinter2023Batch，Anarchy

AI，中信建投用戶提問“蘋果股價”Anarchy應(yīng)用程序Open

AI應(yīng)用的數(shù)據(jù)信息回答用戶問題調(diào)用大語言模型圖：Anarchy原理示意圖。Anarchy的原理在于：開發(fā)者用戶提供自身應(yīng)用的API接口，以及對接OpenAI大語言模型的秘鑰，Anarchy則提供大語言模型端點(diǎn)，即網(wǎng)頁界面形式的聊天機(jī)器人，此機(jī)器人將使用API的數(shù)據(jù)信息，借助OpenAI的能力，來回答終端用戶的問題。開發(fā)者用戶由此可專注于自身應(yīng)用的優(yōu)化，省去了尋找合適的調(diào)取大語言模型指令的工作。終端用戶查看到的機(jī)器人名稱“Stock”O(jiān)pen

AI秘鑰應(yīng)用的API功能描述機(jī)器人反饋結(jié)果圖：Anarchy調(diào)用API解答蘋果股價信息261.10

算力優(yōu)化：Texel—AI模型和視頻處理的加速器YCombinatorWinter2023Batch，中信建投Texel：AI模型和視頻處理的加速器。Texel能提高媒體上使用AI運(yùn)算推理的效率，例如AI生成圖像、視頻等應(yīng)用。Texel為用戶提供一個可控的API，允許用戶控制要激活的功能，從而加速相應(yīng)的推理過程。推理過程的用時將被縮短，所需GPU內(nèi)存的減少也能節(jié)約成本。據(jù)官網(wǎng)，Texel將使得運(yùn)行速度比標(biāo)準(zhǔn)解決方案提高10倍，同時降低90%的成本。圖表：使用Vanilla

PyTorch運(yùn)行Stable

Diffusion（左），比Texel

生成圖片（右）的速度慢27目錄第一章前言第三章風(fēng)險提示第二章國內(nèi)相關(guān)公司：新華網(wǎng)、藍(lán)色光標(biāo)等AI升級交互體驗，虛擬人和教育應(yīng)用場景廣闊海外相關(guān)應(yīng)用：AI聊天應(yīng)用Glow和其他產(chǎn)業(yè)鏈公司2.1

新華網(wǎng)：子公司布局AIGC+虛擬人，發(fā)布元宇宙系統(tǒng)“元卯”28資料來源：新華智云官網(wǎng)，海報新聞，江西新聞，新華網(wǎng)，媒體大腦，中信建投智媒體融合平臺媒體大腦·MAGIC剪貝文旅智能傳播平臺云上新聞中心智能金融MCNDATA數(shù)芯AI賦能媒體全流程短視頻智能生產(chǎn)平臺移動版MAGIC游客短視頻互動體系會展賽智能傳播和數(shù)據(jù)服務(wù)中心金融內(nèi)容視頻解決方案短視頻數(shù)據(jù)服務(wù)商媒體數(shù)據(jù)中臺新華智云是由新華網(wǎng)和阿里巴巴成立的合資公司。新華智云科技有限公司主要布局媒體人工智能領(lǐng)域，核心產(chǎn)品包括17年12月發(fā)布的媒體人工智能平臺“媒體大腦”，開始在媒體領(lǐng)域?qū)嵺`機(jī)器生產(chǎn)內(nèi)容（MGC），18年6月發(fā)布的短視頻智能生產(chǎn)平臺“媒體大腦·MAGIC”，進(jìn)一步推動人工智能技術(shù)在媒體、文旅、金融等領(lǐng)域集成化、產(chǎn)品化、商業(yè)化的應(yīng)用。落地案例包括在18年兩會期間用15秒發(fā)布關(guān)于會議的MGC視頻新聞，在俄羅斯世界杯期間制作賽事播報視頻。關(guān)注AIGC驅(qū)動的元宇宙系統(tǒng)“元卯”表現(xiàn)。3月22日，公司發(fā)布全國首個AIGC驅(qū)動的元宇宙系統(tǒng)“元卯”，結(jié)合AIGC模型和此前已多年實(shí)踐的機(jī)器生產(chǎn)內(nèi)容（MGC），幫助媒體、文旅、金融等企業(yè)實(shí)現(xiàn)元宇宙數(shù)字人、數(shù)字內(nèi)容、數(shù)字場景的智能化生產(chǎn)，解決元宇宙內(nèi)容生產(chǎn)成本高、效率低的問題。圖：新華智云推出的虛擬主播的部分應(yīng)用案例圖：新華智云已發(fā)布多個機(jī)器生成內(nèi)容（MGC）產(chǎn)品和解決方案產(chǎn)品及解決方案介紹媒體大腦中國第一個媒體人工智能平臺29虛擬人“蘇小妹”等將接入百度文心一言。據(jù)投資者互動易，藍(lán)色光標(biāo)旗下元宇宙營銷場景解決方案公司藍(lán)色宇宙，將接入百度生成式對話模型文心一言，將智能對話技術(shù)應(yīng)用在AIGC營銷場景，包括以“蘇小妹”為代表的虛擬人驅(qū)動與實(shí)時對話能力升級，及其他商業(yè)化解決方案，例如藍(lán)標(biāo)智播、分身有術(shù)、MEME等產(chǎn)品的生產(chǎn)創(chuàng)造。將與OpenAI開展技術(shù)產(chǎn)品合作。據(jù)藍(lán)色光標(biāo)官方公眾號及投資者互動易，成為中國區(qū)官方代理商后，公司將與微軟開展基于OpenAI的技術(shù)產(chǎn)品合作，讓出?？蛻襞c海外消費(fèi)者更好地互動。據(jù)藍(lán)色光標(biāo)官方公眾號，公司提出了與GPT-4可能的合作方式，包括驅(qū)動虛擬人的多模態(tài)個性化交互、生成NFT、打造用于營銷或社交的虛擬空間。2.2

藍(lán)色光標(biāo)：虛擬人將接入文心一言，涉及與OpenAI合作資料來源：紅星新聞，wind圖表：虛擬IP“蘇小妹”是眉山數(shù)字代言人302.3

捷成股份：參股公司世優(yōu)科技旗下數(shù)字人已接入ChatGPT，具備眾多應(yīng)用場景資料來源：公司公眾號，wind類型虛擬人所屬企業(yè)虛擬IP秋月華優(yōu)酷動漫虛擬IP品牌形象海爾兄弟海爾集團(tuán)品牌形象IP品牌形象白老頭、金老太腦白金品牌形象IP虛擬偶像小繆MUSINESS孵化音樂數(shù)字人虛擬數(shù)字人女媧世優(yōu)科技&北京女媧數(shù)字人科技虛擬IP阿央央視網(wǎng)虛擬IP/AI助手度曉曉百度虛擬AI助手?jǐn)?shù)字員工AIYA百信銀行虛擬數(shù)字員工虛擬主播幕蘭Mulan世優(yōu)科技&OST傳媒&頤姬娛樂數(shù)字員工小觀川觀新聞虛擬數(shù)字員工數(shù)字人已接入ChatGPT，可應(yīng)用在線下展廳、直播、電商等場景。據(jù)投資者互動易，公司參股世優(yōu)科技的數(shù)字人，已經(jīng)接入ChatGPT，通過數(shù)字人自身的人設(shè)背景等相關(guān)數(shù)據(jù)，對其進(jìn)行訓(xùn)練，并基于OpenAI來訓(xùn)練數(shù)字人專有大腦，形成個性化模型，未來擬應(yīng)用于線下展廳的AI講解介紹數(shù)字人、線上AI主播、AIGC快速短視頻系統(tǒng)、智能客服、電商等多個場景。已為眾多頭部客戶打造數(shù)字人。世優(yōu)科技已經(jīng)為百度、央視網(wǎng)、海爾集團(tuán)、腦白金等頭部客戶定制數(shù)字人，用于品牌形象IP、智能助手等場景。其中，數(shù)字人“阿央”已經(jīng)接入世優(yōu)正在開發(fā)的ChatGPT微信小程序——世優(yōu)數(shù)字人元宇宙。該程序可以展示排行靠前的熱門問題，并通過接入ChatGPT后的世優(yōu)科技數(shù)字人進(jìn)行實(shí)時的內(nèi)容解答。圖表：世優(yōu)科技與央視網(wǎng)合作的數(shù)字人“阿央” 圖表：世優(yōu)科技部分虛擬人案例31旗下“MetaSurfing-元享智能云平臺”接入ChatGPT，并已引入TikTok直播場景。公司旗下的虛擬人制作SaaS平臺“MetaSurfing-元享智能云平臺”，主要是為實(shí)現(xiàn)元宇宙人貨場的“批量化、短周期、低成本”制作，已應(yīng)用在Tik

Tok跨境電商直播、虛擬主播直播互動等場景。1）形象制作：客戶通過關(guān)鍵詞與描述，即可實(shí)時生成符合直播與內(nèi)容生成的虛擬形象。2）直播交互：該平臺已經(jīng)接入ChatGPT等智能機(jī)器模型，輸入商品的關(guān)鍵詞描述，就可在選定的對應(yīng)的直播平臺，使用選定語種，一鍵完成7×24小時的無人值守直播。將接入文心一言，提升虛擬人交互等能力。據(jù)公司公眾號，MetaSurfing-元享智能云平臺也將接入百度文心一言，將智能對話技術(shù)應(yīng)用在元宇宙智能生產(chǎn)，及公司旗下的天妤等全體虛擬數(shù)字人，提升公司在虛擬人交互體驗、數(shù)字內(nèi)容制作效率、元宇宙創(chuàng)意空間等方面的生產(chǎn)能力。2.4天娛數(shù)科：將借助ChatGPT及文心一言，提升直播交互能力資料來源：公司公眾號，同花順財經(jīng)，中信建投圖表：公司利用AIGC技術(shù)融合虛擬人直播場景圖表：

MetaSurfing-元享智能云平臺制作虛擬人32與新華社發(fā)布“云游中國”，探索數(shù)字人+虛擬文旅。23年1月，天下秀與新華社共同發(fā)布文旅數(shù)字化云平臺“云游中國”，用戶可定義自身虛擬數(shù)字人形象、購買數(shù)字藏品裝扮、劇情化游覽虛擬景點(diǎn)等。天下秀將提供AI交互及數(shù)字孿生、區(qū)塊鏈、虛擬現(xiàn)實(shí)、3D引擎等技術(shù)。我們認(rèn)為，新華智云AIGC驅(qū)動的元宇宙系統(tǒng)“元卯”發(fā)布，也有望為“云游中國”平臺提供數(shù)字人、數(shù)字內(nèi)容、數(shù)字場景的智能化生產(chǎn)，從而進(jìn)一步提升用戶的虛擬文旅體驗。有望改善“虹宇宙”內(nèi)虛擬社交體驗。天下秀于21年12月內(nèi)測元宇宙社交應(yīng)用虹宇宙，據(jù)公司公告，截至22年6月底累計用戶已超50萬，用戶可通過自定義虛擬形象，在平臺內(nèi)社交互動、收藏數(shù)字藏品等。后續(xù)AIGC的引入，有望豐富虹宇宙內(nèi)的虛擬內(nèi)容供給、讓NPC與用戶的互動更智能化，從而改善社交體驗。2.5

天下秀：AIGC有望改善虛擬文旅、社交領(lǐng)域的交互體驗圖表：云游中國資料來源：齊魯壹點(diǎn)，和訊網(wǎng)，虹宇宙，中信建投圖表：虹宇宙332.6

其他虛擬人相關(guān)公司資料來源：投資者互動易，中信建投遙望科技：虛擬人與AIGC運(yùn)用在直播領(lǐng)域。據(jù)投資者互動易，公司旗下數(shù)字虛擬人孔襄已較為成熟，在NFT和廣告代言方面已經(jīng)開展了商業(yè)化變現(xiàn)。公司規(guī)劃在2023年發(fā)力虛擬人直播等業(yè)務(wù)，計劃利用公司過往積淀的技術(shù)優(yōu)勢，實(shí)現(xiàn)高效率低成本的AIGC內(nèi)容生成。公司關(guān)于利用GPT技術(shù)框架做直播帶貨的AIGC生成，目前正處于研究階段。風(fēng)雨筑：將接入ChatGPT與文心一言，提升虛擬人在展館等場景的交互體驗。據(jù)投資者互動易，公司已探索AI在虛擬展廳、虛擬數(shù)字人、虛擬場景及數(shù)字藝術(shù)創(chuàng)作領(lǐng)域的應(yīng)用。虛擬數(shù)字人方面，1）公司目前正嘗試將打造的數(shù)字人接入ChatGPT，以強(qiáng)化數(shù)字虛擬人的場景識別和更新能力；2）也將把接入“文心一言”，支撐AI驅(qū)動數(shù)字人多模態(tài)交互識別感知和分析決策功能，為線上元宇宙空間里的數(shù)字人導(dǎo)覽以及線下沉浸式場景中的VR/AR內(nèi)容、對話交互等環(huán)節(jié)提供AI能力支撐，打造更有趣的互動交互體驗。凡拓數(shù)創(chuàng)：將接入文心一言，驅(qū)動虛擬人及展館交互體驗。與風(fēng)語筑類似，凡拓數(shù)創(chuàng)也接入“文心一言”，以AI驅(qū)動數(shù)字人多模態(tài)交互識別感知和分析決策功能，讓虛擬人實(shí)現(xiàn)能聽、能答、能學(xué)習(xí)。此外，文心一言也可運(yùn)用在公司的數(shù)智展館，打造更沉浸場景、更智能交互的VR/AR導(dǎo)覽新體驗。34核心IP在家庭娛樂和親子互動領(lǐng)域具備高知名度。湯姆貓以親子品牌會說話的湯姆貓家族IP為核心，打造了《會說話的湯姆貓》等超20款線上休閑益智移動應(yīng)用，具備模仿人類說話、對用戶的觸摸/拍打做出即時反應(yīng)、打電話與玩家互動等玩法。據(jù)投資者問答，截至23年3月，湯姆貓系列移動應(yīng)用產(chǎn)品累計下載量超200億人次，全球月活數(shù)超4億，其中超80的活躍用戶來自海外。籌集資金，加大AI教育相關(guān)產(chǎn)品、模型等投入。公司在23年2月發(fā)布公告，計劃通過非公開發(fā)行股票籌集資金，用于投向通用人工智能交互終端產(chǎn)品研發(fā)、預(yù)訓(xùn)練語言模型的自建與接入、IDC算力基礎(chǔ)設(shè)施建設(shè)。其中預(yù)訓(xùn)練語言模型將圍繞公司擅長的情感陪伴、教育類等垂直領(lǐng)域，并接入公司研發(fā)的人工智能交互終端產(chǎn)品及第三方機(jī)構(gòu)的通識大模型。2.7

湯姆貓：核心“湯姆貓”IP與GPT能力結(jié)合，開發(fā)親子互動產(chǎn)品圖表：會聊天的湯姆貓測試效果資料來源：IT之家，wind“湯姆貓”接入GPT模型，提升產(chǎn)品交互體驗。據(jù)投資者問答，公司已嘗試應(yīng)用GPT-3.5模型進(jìn)行AI語音互動產(chǎn)品功能原型測試，并已將湯姆貓IP形象植入產(chǎn)品功能原型，加入語音識別、語音合成、性格設(shè)定、內(nèi)容過濾等功能。公司也已接入ChatGPT

API進(jìn)行測試，獲得了更快的響應(yīng)速度和更豐富語句表達(dá)，當(dāng)前正著手開發(fā)正式產(chǎn)品。據(jù)IT之家，基于ChatGPT的《會聊天的湯姆貓》，已開啟安

人人文庫> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

AIGC應(yīng)用重塑交互體驗看好虛擬人、教育

文檔簡介

溫馨提示

最新文檔

評論

AIGC應(yīng)用重塑交互體驗看好虛擬人、教育

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔

AIGC應(yīng)用重塑交互體驗看好虛擬人、教育