AIGC應(yīng)用重塑交互體驗看好虛擬人、教育_第1頁
AIGC應(yīng)用重塑交互體驗看好虛擬人、教育_第2頁
AIGC應(yīng)用重塑交互體驗看好虛擬人、教育_第3頁
AIGC應(yīng)用重塑交互體驗看好虛擬人、教育_第4頁
AIGC應(yīng)用重塑交互體驗看好虛擬人、教育_第5頁
已閱讀5頁,還剩32頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

2目 錄第一章前言第三章風(fēng)險提示第二章國內(nèi)相關(guān)公司:新華網(wǎng)、藍(lán)色光標(biāo)等AI升級交互體驗,虛擬人和教育應(yīng)用場景廣闊海外相關(guān)應(yīng)用:AI聊天應(yīng)用Glow和其他產(chǎn)業(yè)鏈公司3前言(1)AI升級交互體驗,虛擬人和教育應(yīng)用場景廣闊圖:在交互體驗提升方面,AI+虛擬人/教育的應(yīng)用場景圖譜中信建投+虛擬人商場和辦公樓導(dǎo)覽虛擬主播(電商、電競)虛擬偶像初音未來+教育教學(xué)輔助早教K12教育職業(yè)培訓(xùn)會說話的湯姆貓TennrAI提詞器多模態(tài)AIGC模型提升交互體驗景區(qū)和博物館導(dǎo)游B端C端4前言(2)走向多模態(tài),從“數(shù)字人”到“數(shù)智人”Sequoia,中信建投多模態(tài)升級交互體驗,實(shí)現(xiàn)“數(shù)字人”向“數(shù)智人”轉(zhuǎn)變。單模態(tài)以情感陪伴聊天機(jī)器人Glow為代表的“數(shù)字人”為例,其已經(jīng)可以實(shí)現(xiàn)與真人的個性化、擬人化、智能化的聊天互動,但交互方式仍局限在文本、語音。未來,隨著多模態(tài)模型的發(fā)展,虛擬人或機(jī)器人的交互方式,有望拓展至圖片、音樂乃至視頻,并以更貼近真人的邏輯、理解、表達(dá)能力進(jìn)行交流和反饋,從而提升虛擬人在電商、直播、教育、客服、社交、文旅導(dǎo)覽等領(lǐng)域的互動體驗。AI模型與應(yīng)用向多模態(tài)升級迭代。Vision

Transformer模型、擴(kuò)散模型、BEiT模型等技術(shù)的迭代,實(shí)現(xiàn)了傳統(tǒng)單模態(tài)大模型中自然語言處理能力與計算機(jī)視覺能力的結(jié)合,以及大規(guī)模自監(jiān)督預(yù)訓(xùn)練,由此使得大模型具備了理解、處理和生成圖片、音視頻等多模態(tài)的能力,催生了Open

AIGPT-4、谷歌PaLM-E、百度文心一言等多模態(tài)大模型。多模態(tài)模型也帶動了多模態(tài)應(yīng)用的誕生,涉及代碼生成、文本生成、圖像生成、音視頻、游戲、虛擬人等領(lǐng)域。圖:AIGC由單模態(tài)向多模態(tài)迭代DALL-E2StableDiffusionDALL-EImagenVideoMake-a-videoPhenakiGPT-3Jasper.AIChatGPTCodex代碼文本圖像音視頻/3D/游戲2020202120224月8月10月9月11月Midjourney7月6月CodeWhisperer三大AI繪圖應(yīng)用支持模型底層技術(shù)20232月Bard3月文心一言GPT-4Palm-EaiXcoderCopilotCopy.aiMeena2019及更早底層技術(shù)微軟小冰StableDiffusion

2TabNine科大訊飛SMART-TTSMagic3D盜夢師6pen多模態(tài)5前言(3)全球知名創(chuàng)投YC,前瞻性投資30+AI應(yīng)用項目圖:YC

23年Winter

Batch投資的生成式AI項目Y

Combinator,中信建投Y

Combinator成立于2005年,為美國知名創(chuàng)業(yè)孵化公司,在胡潤研究院發(fā)布的《2021全球獨(dú)角獸投資機(jī)構(gòu)百強(qiáng)榜》中,位列第12位。據(jù)福布斯中國,YC目前已資助公司超3500家,包括80家獨(dú)角獸公司,例如Dropbox、Airbnb、Reddit等YC最新投資項目涉及生成式AI在生產(chǎn)力提效、交互場景、開發(fā)者相關(guān)領(lǐng)域應(yīng)用。YC

每年推出2

期孵化計劃,

即WinterBatch

Summer

Batch

,由全球申請者中篩選出的具有發(fā)展?jié)摿Φ墓窘M成。YC將為入選項目提供50萬美元種子輪融資、創(chuàng)業(yè)建議以及業(yè)內(nèi)資源。在23年初Winter

Batch的210個項目中,有36個生成式AI項目,應(yīng)用場景涵蓋市場營銷、客戶服務(wù)、知識管理、數(shù)據(jù)分析、基礎(chǔ)設(shè)施、開發(fā)者工具等。6前言(4)虛擬人:擺脫“套皮”,解決“偽需求”問題Y

Combinator,中信建投開發(fā)平臺、交互、算力優(yōu)化等虛擬人產(chǎn)業(yè)鏈布局解決需求問題,推動行業(yè)發(fā)展。通過梳理AIGC應(yīng)用落地場景,我們已看到虛擬人產(chǎn)業(yè)鏈已有智能開發(fā)平臺、交互升級、算法優(yōu)化等方面的布局。隨著AIGC技術(shù)加深與虛擬人產(chǎn)業(yè)鏈的融合,預(yù)計有望降低虛擬人開發(fā)成本、解決“套皮”問題、交互不擬人等,從而推動虛擬人的落地和發(fā)展。虛擬人開發(fā)成本:結(jié)合AIGC的元宇宙內(nèi)容開發(fā)平臺,解決數(shù)字內(nèi)容開發(fā)成本高、效率低的困境。解決“套皮”問題:隨著多模態(tài)模型的推出,有望實(shí)現(xiàn)文本/語音、視頻/模型等多內(nèi)容模式的AI智能化產(chǎn)出,從而擺脫真人套皮問題。加速器減輕設(shè)備壓力:語音和視覺結(jié)合的AI生成對設(shè)備需要較高,而相關(guān)算法的優(yōu)化有助降低運(yùn)營成本壓力,實(shí)現(xiàn)更大規(guī)模的普及。圖:虛擬人產(chǎn)業(yè)鏈的AI落地場景算力優(yōu)化虛擬人互動開發(fā)平臺元宇宙內(nèi)容系統(tǒng)3D建模3D建模視頻生成Glow情感陪伴聊天機(jī)器人ChatGPT加速器7前言(5)教育:AI輔助教學(xué)+虛擬人教學(xué)雙線推動場景落地Y

Combinator,中信建投大模型、專業(yè)知識調(diào)用教育算力優(yōu)化教學(xué)輔助教材生成我們認(rèn)為教育場景的AIGC技術(shù)落地,將主要有兩種模式:AI輔助真人教學(xué):在海外的AIGC應(yīng)用場景中,我們看到在銷售場景,已有多種輔助工具落地,包括AI提詞器、AI素材生產(chǎn)等,預(yù)計這些場景的AI融合有助真人教學(xué)統(tǒng)一或升級教學(xué)質(zhì)量,多樣化教學(xué)形式,也更有利于在線教育平臺在降本的同時,維持商業(yè)化的能力。虛擬人教學(xué):隨著文字/語音輸出的內(nèi)容更加擬人,且多模態(tài)模型優(yōu)化了虛擬人動作、表情僵硬等問題,虛擬人也有望落地教育場景。尤其對早教而言,交互體驗升級也有望實(shí)現(xiàn)教學(xué)質(zhì)量的統(tǒng)一和提升。圖:教育產(chǎn)業(yè)鏈的AI落地場景分析調(diào)用大語言模型情況管理大語言模能力構(gòu)建、微調(diào)大語言模能力集成多種機(jī)器學(xué)習(xí)能力加速器基于文字與音樂生成視頻文本修改對應(yīng)音頻編輯對話式檢索內(nèi)容AI培訓(xùn)工具AI提詞器8目 錄第一章前言第三章風(fēng)險提示第二章國內(nèi)相關(guān)公司:新華網(wǎng)、藍(lán)色光標(biāo)等AI升級交互體驗,虛擬人和教育應(yīng)用場景廣闊海外相關(guān)應(yīng)用:AI聊天應(yīng)用Glow和其他產(chǎn)業(yè)鏈公司91.1.1Glow:用戶定義人設(shè)的AI情感陪伴聊天機(jī)器人Glow,中信建投Glow為基于大模型的AI聊天應(yīng)用,由國內(nèi)人工智能創(chuàng)業(yè)公司MiniMax在22年11月推出,為用戶提供情感陪伴、滿足虛構(gòu)情景想象的體驗。據(jù)甲子光年,Glow上線約4個月后,目前已有約500萬用戶?;谟脩裘枋?,生成個性化對話機(jī)器人。Glow的基本玩法是用戶在應(yīng)用中創(chuàng)建AI機(jī)器人“智能體”,智能體將基于用戶描述的性格、人設(shè)、頭像及選定的音色等,與用戶開展實(shí)時溝通、互動。也可輸入“參考名人”,智能體將具備特定名人的有關(guān)知識儲備。據(jù)體驗,創(chuàng)建的“托尼斯塔克”智能體有《復(fù)仇者聯(lián)盟》系列的知識儲備,具備較強(qiáng)代入感。圖表:

Glow智能體創(chuàng)建過程設(shè)定智能體的姓名、性別、性格、人設(shè)等基于文字和參考圖片生成頭像根據(jù)基礎(chǔ)音色組合生成智能體音色與智能體開展對話101.1.2

Glow:提供情感陪伴體驗,輔助虛構(gòu)情景聯(lián)想Glow,中信建投1)互動對象多元,提供差異化、多樣化、個性化聊天體驗。用戶可與自己創(chuàng)建的個性化智能體進(jìn)行聊天互動,也可與平臺內(nèi)其他用戶創(chuàng)建的智能體互動。用戶可為其他用戶創(chuàng)建的智能體補(bǔ)充專屬設(shè)定,讓相關(guān)智能體符合用戶個性化需求。據(jù)觀察,平臺內(nèi)部分智能體已與近6萬個用戶進(jìn)行互動。2)互動方式當(dāng)前僅為文字和語音。據(jù)體驗,目前Glow內(nèi)智能體暫時無法反饋圖片內(nèi)容,但從對話內(nèi)容來看,隨著產(chǎn)品的改進(jìn),圖片內(nèi)容或在后續(xù)版本中引入。此外,用戶也可以切換智能體的反饋,從而按照用戶的偏好推進(jìn)聊天。圖表:平臺內(nèi)其他用戶創(chuàng)建的智能體可設(shè)置個性化設(shè)定 圖表:智能體暫時無法提供圖片內(nèi)容切換智能體的反饋智能體可設(shè)置個性化設(shè)定111.1.3

Glow:提供情感陪伴體驗,輔助虛構(gòu)情景聯(lián)想3)互動話題多元,包含情感、虛構(gòu)情景聯(lián)想等。用戶可以與智能體就任何話題內(nèi)容進(jìn)行聊天,可完成情緒反饋、對話問答、簡易信息搜尋等,也可以根據(jù)特定的話題,選擇關(guān)聯(lián)的智能體進(jìn)行聊天,例如情感、美食、虛構(gòu)情景(如遭遇吸血鬼的場景)等。其中,平臺官方智能體季楓和沈思前具備劇情模式,通過主動引導(dǎo)用戶對話,來推動劇情演繹并完成任務(wù)。4)互動記錄可公開,豐富可瀏覽內(nèi)容。Glow擁有記憶簿功能,即用戶可將智能體對話的部分內(nèi)容公開,供平臺內(nèi)其他用戶瀏覽、評價,本質(zhì)上是用戶與AI共創(chuàng)內(nèi)容,以豐富平臺內(nèi)的內(nèi)容供給。Glow,中信建投圖表:Glow話題多圍繞情感、奇幻情景聯(lián)想等圖表:“吸血鬼”話題關(guān)聯(lián)的智能體圖表:同一智能體可就關(guān)聯(lián)的不同話題展開討論圖表:其他用戶公開的智能體記憶簿121.1.4

Glow:提供情感陪伴體驗,輔助虛構(gòu)情景聯(lián)想中信建投我們認(rèn)為,相比于微信、探探、ChatGPT等聊天應(yīng)用,Glow或在一定程度上更好地解決用戶情感陪伴以及奇幻情景聯(lián)想的需求,從而增強(qiáng)用戶的使用粘性。情感陪伴方面:Glow的智能體可實(shí)時響應(yīng)、性格多樣,相比于工具屬性較強(qiáng)的ChatGPT,能反饋個性更加鮮明的回復(fù),能一定程度上滿足用戶傾訴、尋求情緒反饋乃至獵奇的需求;且相比于微信、探探等真人社交應(yīng)用,用戶使用Glow時,不必?fù)?dān)心情感宣泄給對方造成的負(fù)擔(dān)或?qū)ψ陨碚鎸?shí)形象的影響。奇幻情景聯(lián)想方面:據(jù)體驗,Glow能一定程度滿足用戶對虛構(gòu)人物、虛構(gòu)場景的幻想。智能體設(shè)定方面,可設(shè)定為歷史名人、影視文學(xué)作品人物、動物乃至虛構(gòu)生物;虛構(gòu)場景方面,用戶的話題可設(shè)定在歷代王朝、鬼屋乃至影視文學(xué)作品內(nèi)等。基于真人社交的微信、探探等,這方面體驗較少。圖表:

Glow與其他社交APP對比對比方面微信探探ChatGPTGlow定位熟人社交陌生人社交虛擬社交虛擬社交應(yīng)用場景辦公、日常溝通交友聊天、工具情感陪伴、奇幻聯(lián)想對話發(fā)生背景現(xiàn)實(shí)真實(shí)生活現(xiàn)實(shí)真實(shí)生活-現(xiàn)實(shí)真實(shí)生活或虛擬世界數(shù)學(xué)、代碼等強(qiáng)推理能力因人而異因人而異強(qiáng)弱互動對象真人真人人工智能基于人工智能設(shè)定的多種生物實(shí)時響應(yīng)較及時較慢實(shí)時響應(yīng)實(shí)時響應(yīng),部分智能體主動問候?qū)υ掞L(fēng)格因人而異因人而異單一千人千面,或按用戶個性化設(shè)定隱私泄露問題較大較大較小較小對用戶真實(shí)人格/經(jīng)歷的熟知程度強(qiáng)較弱弱弱131.1.5

Glow的開發(fā)公司MiniMax:小而美的高科技公司,支持產(chǎn)品迭代、變現(xiàn)Glow的技術(shù)支持由開發(fā)公司MiniMax提供,

核心為三大模態(tài)的基礎(chǔ)模型架構(gòu)、“User-in-the-Loop”的用戶反饋機(jī)制以及優(yōu)秀技術(shù)人員配置。1

掌握自研三大模態(tài)的基礎(chǔ)模型架構(gòu)。MiniMax為北京稀宇科技有限公司,是2021年成立的人工智能創(chuàng)業(yè)公司,通過直接從底層模型切入,基于Transformer架構(gòu),自研了文本到視覺、文本到語音、文本到文本三大模態(tài)的基礎(chǔ)模型架構(gòu),是國內(nèi)較早同時擁有3個模態(tài)大模型能力的創(chuàng)業(yè)公司。模型開發(fā)投入相對可控。據(jù)技術(shù)合伙人楊斌,文本、語言、視覺三模態(tài)是幾乎所有數(shù)字內(nèi)容的基礎(chǔ)形態(tài),只需一個較小的團(tuán)隊,來共同維護(hù)優(yōu)化三個大模型、做好用戶閉環(huán),即可具備較好的內(nèi)容生成能力。據(jù)甲子光年,MiniMax目前團(tuán)隊人數(shù)約100人。資料來源:甲子光年,財報網(wǎng),量子位,Glow,中信建投圖表:

MiniMax基礎(chǔ)模型架構(gòu)支持Glow運(yùn)作文本到視覺文本到文本文本到語音TransformerMiniMax-

Glow高魯棒性 低成本計算推理平臺14Glow,中信建投1.1.6

MiniMax:小而美的高科技公司,支持產(chǎn)品迭代、變現(xiàn)2)用戶反饋機(jī)制優(yōu)化產(chǎn)品體驗。Glow基于“User-in-the-Loop”進(jìn)行產(chǎn)品輸出結(jié)果的人為優(yōu)化,即在與智能體對話過程中,用戶針對智能體的回答可給予“點(diǎn)贊”“差評”“有趣”“邏輯不通”的反饋,模型將由此強(qiáng)化對用戶對話喜好的認(rèn)知,從而優(yōu)化產(chǎn)品體驗。此機(jī)制與ChatGPT的基于人類反饋的強(qiáng)化學(xué)習(xí)機(jī)制類似(Reinforcement

Learning

from

HumanFeedback,RLHF)。即大語言模型(LLM)接收提示符并輸出多個回答后,人類對其回答進(jìn)行評估與排序,在獎勵模型(Reward

Model)中按回答的質(zhì)量高低賦予不同獎勵,并將獎勵結(jié)果反饋給LLM,LLM據(jù)此進(jìn)行強(qiáng)化學(xué)習(xí),以優(yōu)化下一輪結(jié)果輸出。圖表:

Glow的用戶反饋機(jī)制“User-in-the-Loop”與RLHF類似智能體回答②用戶對智能體回答進(jìn)行反饋③獎勵模型用戶輸入的文字①輸入MiniMax的大語言模型 輸出(LargeLanguage

Model)①大語言模型(LargeLanguage

Model)回答(Output)人類研究員對回答(Output)的質(zhì)量進(jìn)行評估與排序獎勵模型(Reward

Model)提示符(Prompt)輸入輸出②③151.1.7

MiniMax:小而美的高科技公司,支持產(chǎn)品迭代、變現(xiàn)3)公司核心技術(shù)成員多具備豐富產(chǎn)業(yè)或?qū)W術(shù)界經(jīng)驗。據(jù)甲子光年,MiniMax核心技術(shù)人員均來自全球知名高校和全球知名科技公司,具備較豐富的自然語言處理、語音、計算機(jī)視覺、計算機(jī)圖形學(xué)等業(yè)界或?qū)W術(shù)界經(jīng)驗,近33%的成員擁有世界知名技術(shù)實(shí)驗室博士學(xué)位,擁有上百個全球發(fā)明專利。例如聯(lián)合創(chuàng)始人閆俊杰為中科院自動化所博士,在深度學(xué)習(xí)和計算機(jī)視覺領(lǐng)域發(fā)表的論文被Google

Scholar引用超1萬次,也曾在商湯負(fù)責(zé)搭建深度學(xué)習(xí)底層算法及人臉識別等技術(shù)體系。資料來源:甲子光年,財報網(wǎng),量子位,愛企查,游戲葡萄,中信建投圖表:

MiniMax部分核心成員簡歷核心成員公司職位學(xué)術(shù)經(jīng)驗產(chǎn)業(yè)經(jīng)驗閆俊杰聯(lián)合創(chuàng)始人2015年博士畢業(yè)于中科院自動化所;在深度學(xué)習(xí)和計算機(jī)視覺領(lǐng)域,發(fā)表頂級會議和期刊論文100余篇,

Google

Scholar引用超過10000次前商湯科技副總裁、通用智能技術(shù)負(fù)責(zé)人,曾任商湯研究院副院長,負(fù)責(zé)搭建深度學(xué)習(xí)的工具鏈和底層算法,以及通用智能的技術(shù)發(fā)展,搭建了商湯的人臉識別和智慧城市相關(guān)的技術(shù)體系楊斌技術(shù)合伙人2014年碩士期間在中科院自動化所參與深度學(xué)習(xí)相關(guān)項目,2016年在加拿大多倫多大學(xué)攻讀博士學(xué)位Uber

ATG研究院、自動駕駛初創(chuàng)公司W(wǎng)aabi創(chuàng)始團(tuán)隊成員周彧聰法定代表人畢業(yè)于北京航空航天大學(xué),曾獲得世界大學(xué)生超級計算機(jī)競賽ASC15總決賽和國際超級計算機(jī)大會ISC17第一;面向輕量級人臉識別的挑戰(zhàn)賽AI視覺頂會ICCV

2019

LFR

挑戰(zhàn)賽中,周彧聰所在團(tuán)隊獲得愛奇藝視頻人臉識別大型識別模型iQIYI-Large

賽道的冠軍商湯科技早期員工之一,曾在商湯科技研究院帶領(lǐng)算法團(tuán)隊161.1.8

MiniMax:小而美的高科技公司,支持產(chǎn)品迭代、變現(xiàn)資料來源:甲子光年,財報網(wǎng),量子位,中信建投OpenAI

GPT-3開放API商業(yè)模式:MiniMax與OpenAI具有相似的商業(yè)模式規(guī)劃,均發(fā)掘C端和B端變現(xiàn)場景。OpenAI:

在完成GPT-3

模型的前期測試后進(jìn)行了C端和B端的商業(yè)化。C端為聊天機(jī)器人應(yīng)用ChatGPT,試點(diǎn)付費(fèi)訂閱版本“ChatGPT

Plus”,可在高峰時段獲得更快的回答響應(yīng),每月收取20美元。B端則面向付費(fèi)用戶與企業(yè)開放API模型GPT-3.5-turbo,每1k個token價格為0.002美元,比現(xiàn)有的GPT-3.5模型節(jié)省成本90%,海外已有Shopify、Snap、Quizlet等平臺率先接入ChatGPT

API。MiniMax:基于三個基礎(chǔ)模型的調(diào)優(yōu)測試,公司推出了C端聊天機(jī)器人Glow,目前暫未開放收費(fèi)。B端方面,據(jù)甲子光年,MiniMax從2023年起會逐步開放API,讓更多的個人用戶和企業(yè)用戶基于多種模態(tài)的大模型構(gòu)建自己的應(yīng)用。鑒于ChatGPT的收費(fèi)模式,我們預(yù)計當(dāng)Glow用戶數(shù)突破一定數(shù)量時,也會采用付費(fèi)訂閱模式,優(yōu)先保障付費(fèi)會員的流暢使用體驗,或類似ChatGPT接入微軟Teams,接入國內(nèi)其他公司的應(yīng)用生態(tài),從而實(shí)現(xiàn)變現(xiàn)。圖表:MiniMax與OpenA具有相似的商業(yè)模式規(guī)劃ChatGPT C端B端三大自研基礎(chǔ)模型GlowMiniMax開放APIC端B端171.1.9

MiniMax:小而美的高科技公司,支持產(chǎn)品迭代、變現(xiàn)Glow,游戲葡萄,中信建投或?qū)@得米哈游投資,估值10億美元。2022年上半年,高科技風(fēng)投明勢資本領(lǐng)投MiniMax的天使輪融資,明勢資本已投資理想汽車、小牛電動、赤子城等。此外,據(jù)游戲葡萄了解,米哈游已經(jīng)對去對MiniMax的兩輪投資,近期正考慮與紅杉資本共同開展新一輪投資,MiniMax估值或達(dá)10億美元。新一輪投資有望為MiniMax的產(chǎn)品研發(fā)和推廣提供支持。2月開啟現(xiàn)金激勵用戶推廣Glow。2月,Glow官方開啟代言人招募計劃,用戶通過在抖音、小紅書、B站發(fā)布Glow相關(guān)的視頻或文字內(nèi)容,相關(guān)內(nèi)容瀏覽量、點(diǎn)贊量達(dá)到一定數(shù)額即可獲得10元現(xiàn)金獎勵,后續(xù)發(fā)布內(nèi)容最高單篇獎勵2250元。關(guān)注后續(xù)破圈效果。圖表:Glow開啟代言人招募計劃181.2

虛擬人生成:Runway—GEN-2發(fā)布,視頻制作門檻再降低Runway,中信建投3月20日人工智能初創(chuàng)公司Runway開放了新一代視頻生成模型GEN-2的試用申請,能夠基于文本、圖片、視頻等內(nèi)容,為藝術(shù)家、設(shè)計師、電影制作人員提供了多樣的、低門檻的生成視頻方式。新增功能:第一代視頻生成模型GEN-1,具備視頻生成視頻的能力,具體包括視頻+圖片生成視頻、實(shí)體模型或渲染動畫轉(zhuǎn)為視頻、修改視頻中特定物體外形等;GEN-2模型新增了純文本生成視頻、文本+圖片生成視頻、圖片生成視頻的能力。圖表:GEN-1和GEN-2對比191.3

虛擬人生成:Iliad—游戲模型和圖片素材生成工具Iliad:主要服務(wù)于游戲開發(fā)公司的AI模型和圖片素材生成工具。產(chǎn)品主要將文字生成圖片、2D圖片轉(zhuǎn)3D圖片等AIGC形式應(yīng)用于游戲場景中。Iliad可以幫助游戲公司的美術(shù)人員生成效果圖、3D模型和模型肌理等內(nèi)容,也可以實(shí)現(xiàn)2D轉(zhuǎn)3D的模型生成。圖表:Iliad中的文字生成圖片功能YCombinatorWinter2023Batch,lliad,中信建投①繪制簡單圖形②對目標(biāo)模型進(jìn)行詳細(xì)描述③快速生成模型④可回溯生成進(jìn)度進(jìn)行再修改⑤繼續(xù)生成得到最終模型1.4

虛擬人生成&教材編輯:Decoherence—基于文字與音樂生成視頻Decoherence:基于文字與音樂生成視頻。

Decoherence基于用戶輸入的關(guān)鍵詞,以及時長、FPS、動畫效果、背景音樂等參數(shù)設(shè)置,生成動畫短視頻。

Decoherence能將音頻信號識別為運(yùn)動效果,并將圖像拼接在一起以制作完整的視頻。Decoherence降低了用戶編輯視頻的門檻,但生成的視頻分辨率及時長有限、幀率不高、聲音選擇較少,難以滿足部分高要求用戶。用戶需付費(fèi)使用Decoherence,月度套餐為每月30美元,可生成超過100個視頻。圖表:Decoherence的視頻參數(shù)操作界面①選取視頻風(fēng)格 ①選取視頻時長及FPS ③插入背景音樂文件④設(shè)置動畫隨音樂的運(yùn)動效果⑤設(shè)置文字描述20視頻實(shí)現(xiàn)由“女性”向“車”的過渡YCombinatorWinter

2023Batch

,Decoherence,中信建投211.5

教材編輯:Descript—文本修改對應(yīng)音頻編輯Descript:文本修改對應(yīng)音頻編輯。Descript可以將音頻內(nèi)容轉(zhuǎn)錄成對應(yīng)的文本,用戶編輯轉(zhuǎn)錄后的文稿時,將對應(yīng)修改原始音頻,包括刪詞、改詞、補(bǔ)詞,其中對于新添加的文本,Descript

可在自動轉(zhuǎn)錄時生成原始音頻的聲音,以避免補(bǔ)錄,并支持自動識別和分離不同的說話人。定價方面,Descript根據(jù)團(tuán)隊用戶數(shù)和每月轉(zhuǎn)錄時長提供不同訂閱版本。其中免費(fèi)版每月有1小時轉(zhuǎn)錄時長;每月

10小時、30小時的版本分別對應(yīng)定價每月12美元、24

美元。圖表:Descript通過編輯音頻轉(zhuǎn)錄生成的文本,來編輯音頻YCombinatorWinter2023Batch,36氪,中信建投②通過編輯轉(zhuǎn)錄文檔以刪除或補(bǔ)錄對應(yīng)音頻內(nèi)容①上傳用戶聲音的音頻文件221.6

教學(xué)輔助:Meru—對話方式提取文件中信息Meru:對話式提取文件中數(shù)據(jù)。Meru的作用相當(dāng)于為部分文件內(nèi)嵌對話機(jī)器人,通過調(diào)用API將特定的文檔、文件、網(wǎng)址等文件的信息進(jìn)行提取,從而像人類一樣,通過對話方式,反饋給用戶個性化的相關(guān)答案,免去了用戶主動搜索數(shù)據(jù)信息的過程。Meru也允許直接調(diào)用存儲在Dropbox、Box、GoogleDrive內(nèi)的文檔。Meru已開放多種付費(fèi)套餐。用戶可以免費(fèi)使用Meru,更高價格的付費(fèi)版本將對應(yīng)更多的詢問次數(shù)、可調(diào)用的文件存儲服務(wù)及其他增值服務(wù)等,價位在99美元/599元每月,也可定制需求。長文檔YCombinatorWinter2023Batch,

Meru

,中信建投圖表:

用戶使用Meru,從美國稅務(wù)局文件中,快速提取關(guān)于報稅的電話上傳文檔至Meru的云服務(wù)平臺Meru根據(jù)文檔內(nèi)容回答用戶提問231.7

教學(xué)輔助的替代場景:Fabius—AI銷售培訓(xùn)工具Fabius:AI銷售培訓(xùn)工具。Fabius利用Gong/Chorus等軟件的錄音,分析銷售人員在產(chǎn)品定位和向客戶推銷的做法,并提供個性化和實(shí)用的改進(jìn)建議,也可以為客戶對話匹配相關(guān)的銷售培訓(xùn)課程,幫助銷售團(tuán)隊提高銷售效率和質(zhì)量。銷售主管也可以改進(jìn)Fabius的預(yù)測,糾正其中缺少的關(guān)鍵步驟。圖表:

Fabius為銷售人員提供的反饋意見YCombinatorWinter2023Batch,中信建投圖表:

Fabius可為銷售主管提高銷售流程的可見性241.8

教學(xué)輔助的替代場景:Tennr—輔助銷售人員的AI提詞器Tennr:輔助銷售人員的AI提詞器。Tennr本質(zhì)為提詞器,通過使用AI技術(shù),可為銷售人員和經(jīng)理提供每次電話銷售前的準(zhǔn)備工作,提高交易達(dá)成的幾率。例如,Tennr可根據(jù)買家關(guān)心的方面,調(diào)取銷售人員過去贏得的類似交易,從而向銷售人員展示業(yè)務(wù)中使用的話術(shù),或提供與過去類似交易相關(guān)的最佳解決方案;也可以分析銷售通話,提取關(guān)鍵信息,如買家的需求、痛點(diǎn)、預(yù)算和時間表PersanaAI

,Tennr,中信建投圖表:

Tennr為銷售人員可能面臨的提問給予參考Tennr內(nèi)部業(yè)務(wù)文件(通話錄音、CRM數(shù)據(jù)、營銷文檔)交易室(用戶正在交談的每家公司的相關(guān)內(nèi)容)為銷售人員提供參考外部數(shù)據(jù)(第三方來源)圖表:

Tennr工作原理251.9

專業(yè)知識學(xué)習(xí):Anarchy—為第三方應(yīng)用構(gòu)建可調(diào)用特定API的對話機(jī)器人Anarchy:為第三方應(yīng)用構(gòu)建可調(diào)用特定API的對話機(jī)器人。Anarchy本質(zhì)是幫開發(fā)者客戶集成外部API以及大語言模型,讓客戶為自己的產(chǎn)品增加對話機(jī)器人的功能。Anarchy可以調(diào)用任何外部API,例如可調(diào)用谷歌地圖

API

,回答用戶關(guān)于兩地之間旅程距離的問題;或者調(diào)用股票應(yīng)用了解股票股價APIYCombinatorWinter2023Batch,Anarchy

AI,中信建投用戶提問“蘋果股價”Anarchy應(yīng)用程序Open

AI應(yīng)用的數(shù)據(jù)信息回答用戶問題調(diào)用大語言模型圖:Anarchy原理示意圖。Anarchy的原理在于:開發(fā)者用戶提供自身應(yīng)用的API接口,以及對接OpenAI大語言模型的秘鑰,Anarchy則提供大語言模型端點(diǎn),即網(wǎng)頁界面形式的聊天機(jī)器人,此機(jī)器人將使用API的數(shù)據(jù)信息,借助OpenAI的能力,來回答終端用戶的問題。開發(fā)者用戶由此可專注于自身應(yīng)用的優(yōu)化,省去了尋找合適的調(diào)取大語言模型指令的工作。終端用戶查看到的機(jī)器人名稱“Stock”O(jiān)pen

AI秘鑰應(yīng)用的API功能描述機(jī)器人反饋結(jié)果圖:Anarchy調(diào)用API解答蘋果股價信息261.10

算力優(yōu)化:Texel—AI模型和視頻處理的加速器YCombinatorWinter2023Batch,中信建投Texel:AI模型和視頻處理的加速器。Texel能提高媒體上使用AI運(yùn)算推理的效率,例如AI生成圖像、視頻等應(yīng)用。Texel為用戶提供一個可控的API,允許用戶控制要激活的功能,從而加速相應(yīng)的推理過程。推理過程的用時將被縮短,所需GPU內(nèi)存的減少也能節(jié)約成本。據(jù)官網(wǎng),Texel將使得運(yùn)行速度比標(biāo)準(zhǔn)解決方案提高10倍,同時降低90%的成本。圖表:使用Vanilla

PyTorch運(yùn)行Stable

Diffusion(左),比Texel

生成圖片(右)的速度慢27目 錄第一章前言第三章風(fēng)險提示第二章國內(nèi)相關(guān)公司:新華網(wǎng)、藍(lán)色光標(biāo)等AI升級交互體驗,虛擬人和教育應(yīng)用場景廣闊海外相關(guān)應(yīng)用:AI聊天應(yīng)用Glow和其他產(chǎn)業(yè)鏈公司2.1

新華網(wǎng):子公司布局AIGC+虛擬人,發(fā)布元宇宙系統(tǒng)“元卯”28資料來源:新華智云官網(wǎng),海報新聞,江西新聞,新華網(wǎng),媒體大腦,中信建投智媒體融合平臺媒體大腦·MAGIC剪貝文旅智能傳播平臺云上新聞中心智能金融MCNDATA數(shù)芯AI賦能媒體全流程短視頻智能生產(chǎn)平臺移動版MAGIC游客短視頻互動體系會展賽智能傳播和數(shù)據(jù)服務(wù)中心金融內(nèi)容視頻解決方案短視頻數(shù)據(jù)服務(wù)商媒體數(shù)據(jù)中臺新華智云是由新華網(wǎng)和阿里巴巴成立的合資公司。新華智云科技有限公司主要布局媒體人工智能領(lǐng)域,核心產(chǎn)品包括17年12月發(fā)布的媒體人工智能平臺“媒體大腦”,開始在媒體領(lǐng)域?qū)嵺`機(jī)器生產(chǎn)內(nèi)容(MGC),18年6月發(fā)布的短視頻智能生產(chǎn)平臺“媒體大腦·MAGIC”,進(jìn)一步推動人工智能技術(shù)在媒體、文旅、金融等領(lǐng)域集成化、產(chǎn)品化、商業(yè)化的應(yīng)用。落地案例包括在18年兩會期間用15秒發(fā)布關(guān)于會議的MGC視頻新聞,在俄羅斯世界杯期間制作賽事播報視頻。關(guān)注AIGC驅(qū)動的元宇宙系統(tǒng)“元卯”表現(xiàn)。3月22日,公司發(fā)布全國首個AIGC驅(qū)動的元宇宙系統(tǒng)“元卯”,結(jié)合AIGC模型和此前已多年實(shí)踐的機(jī)器生產(chǎn)內(nèi)容(MGC),幫助媒體、文旅、金融等企業(yè)實(shí)現(xiàn)元宇宙數(shù)字人、數(shù)字內(nèi)容、數(shù)字場景的智能化生產(chǎn),解決元宇宙內(nèi)容生產(chǎn)成本高、效率低的問題。圖:新華智云推出的虛擬主播的部分應(yīng)用案例 圖:新華智云已發(fā)布多個機(jī)器生成內(nèi)容(MGC)產(chǎn)品和解決方案產(chǎn)品及解決方案 介紹媒體大腦 中國第一個媒體人工智能平臺29虛擬人“蘇小妹”等將接入百度文心一言。據(jù)投資者互動易,藍(lán)色光標(biāo)旗下元宇宙營銷場景解決方案公司藍(lán)色宇宙,將接入百度生成式對話模型文心一言,將智能對話技術(shù)應(yīng)用在AIGC營銷場景,包括以“蘇小妹”為代表的虛擬人驅(qū)動與實(shí)時對話能力升級,及其他商業(yè)化解決方案,例如藍(lán)標(biāo)智播、分身有術(shù)、MEME等產(chǎn)品的生產(chǎn)創(chuàng)造。將與OpenAI開展技術(shù)產(chǎn)品合作。據(jù)藍(lán)色光標(biāo)官方公眾號及投資者互動易,成為中國區(qū)官方代理商后,公司將與微軟開展基于OpenAI的技術(shù)產(chǎn)品合作,讓出??蛻襞c海外消費(fèi)者更好地互動。據(jù)藍(lán)色光標(biāo)官方公眾號,公司提出了與GPT-4可能的合作方式,包括驅(qū)動虛擬人的多模態(tài)個性化交互、生成NFT、打造用于營銷或社交的虛擬空間。2.2

藍(lán)色光標(biāo):虛擬人將接入文心一言,涉及與OpenAI合作資料來源:紅星新聞,wind圖表:虛擬IP“蘇小妹”是眉山數(shù)字代言人302.3

捷成股份:參股公司世優(yōu)科技旗下數(shù)字人已接入ChatGPT,具備眾多應(yīng)用場景資料來源:公司公眾號,wind類型虛擬人所屬企業(yè)虛擬IP秋月華優(yōu)酷動漫虛擬IP品牌形象海爾兄弟海爾集團(tuán)品牌形象IP品牌形象白老頭、金老太腦白金品牌形象IP虛擬偶像小繆MUSINESS孵化音樂數(shù)字人虛擬數(shù)字人女媧世優(yōu)科技&北京女媧數(shù)字人科技虛擬IP阿央央視網(wǎng)虛擬IP/AI助手度曉曉百度虛擬AI助手?jǐn)?shù)字員工AIYA百信銀行虛擬數(shù)字員工虛擬主播幕蘭Mulan世優(yōu)科技&OST傳媒&頤姬娛樂數(shù)字員工小觀川觀新聞虛擬數(shù)字員工數(shù)字人已接入ChatGPT,可應(yīng)用在線下展廳、直播、電商等場景。據(jù)投資者互動易,公司參股世優(yōu)科技的數(shù)字人,已經(jīng)接入ChatGPT,通過數(shù)字人自身的人設(shè)背景等相關(guān)數(shù)據(jù),對其進(jìn)行訓(xùn)練,并基于OpenAI來訓(xùn)練數(shù)字人專有大腦,形成個性化模型,未來擬應(yīng)用于線下展廳的AI講解介紹數(shù)字人、線上AI主播、AIGC快速短視頻系統(tǒng)、智能客服、電商等多個場景。已為眾多頭部客戶打造數(shù)字人。世優(yōu)科技已經(jīng)為百度、央視網(wǎng)、海爾集團(tuán)、腦白金等頭部客戶定制數(shù)字人,用于品牌形象IP、智能助手等場景。其中,數(shù)字人“阿央”已經(jīng)接入世優(yōu)正在開發(fā)的ChatGPT微信小程序——世優(yōu)數(shù)字人元宇宙。該程序可以展示排行靠前的熱門問題,并通過接入ChatGPT后的世優(yōu)科技數(shù)字人進(jìn)行實(shí)時的內(nèi)容解答。圖表:世優(yōu)科技與央視網(wǎng)合作的數(shù)字人“阿央” 圖表:世優(yōu)科技部分虛擬人案例31旗下“MetaSurfing-元享智能云平臺”接入ChatGPT,并已引入TikTok直播場景。公司旗下的虛擬人制作SaaS平臺“MetaSurfing-元享智能云平臺”,主要是為實(shí)現(xiàn)元宇宙人貨場的“批量化、短周期、低成本”制作,已應(yīng)用在Tik

Tok跨境電商直播、虛擬主播直播互動等場景。1)形象制作:客戶通過關(guān)鍵詞與描述,即可實(shí)時生成符合直播與內(nèi)容生成的虛擬形象。2)直播交互:該平臺已經(jīng)接入ChatGPT等智能機(jī)器模型,輸入商品的關(guān)鍵詞描述,就可在選定的對應(yīng)的直播平臺,使用選定語種,一鍵完成7×24小時的無人值守直播。將接入文心一言,提升虛擬人交互等能力。據(jù)公司公眾號,MetaSurfing-元享智能云平臺也將接入百度文心一言,將智能對話技術(shù)應(yīng)用在元宇宙智能生產(chǎn),及公司旗下的天妤等全體虛擬數(shù)字人,提升公司在虛擬人交互體驗、數(shù)字內(nèi)容制作效率、元宇宙創(chuàng)意空間等方面的生產(chǎn)能力。2.4天娛數(shù)科:將借助ChatGPT及文心一言,提升直播交互能力資料來源:公司公眾號,同花順財經(jīng),中信建投圖表:公司利用AIGC技術(shù)融合虛擬人直播場景圖表:

MetaSurfing-元享智能云平臺制作虛擬人32與新華社發(fā)布“云游中國”,探索數(shù)字人+虛擬文旅。23年1月,天下秀與新華社共同發(fā)布文旅數(shù)字化云平臺“云游中國”,用戶可定義自身虛擬數(shù)字人形象、購買數(shù)字藏品裝扮、劇情化游覽虛擬景點(diǎn)等。天下秀將提供AI交互及數(shù)字孿生、區(qū)塊鏈、虛擬現(xiàn)實(shí)、3D引擎等技術(shù)。我們認(rèn)為,新華智云AIGC驅(qū)動的元宇宙系統(tǒng)“元卯”發(fā)布,也有望為“云游中國”平臺提供數(shù)字人、數(shù)字內(nèi)容、數(shù)字場景的智能化生產(chǎn),從而進(jìn)一步提升用戶的虛擬文旅體驗。有望改善“虹宇宙”內(nèi)虛擬社交體驗。天下秀于21年12月內(nèi)測元宇宙社交應(yīng)用虹宇宙,據(jù)公司公告,截至22年6月底累計用戶已超50萬,用戶可通過自定義虛擬形象,在平臺內(nèi)社交互動、收藏數(shù)字藏品等。后續(xù)AIGC的引入,有望豐富虹宇宙內(nèi)的虛擬內(nèi)容供給、讓NPC與用戶的互動更智能化,從而改善社交體驗。2.5

天下秀:AIGC有望改善虛擬文旅、社交領(lǐng)域的交互體驗圖表:云游中國資料來源:齊魯壹點(diǎn),和訊網(wǎng),虹宇宙,中信建投圖表:虹宇宙332.6

其他虛擬人相關(guān)公司資料來源:投資者互動易,中信建投遙望科技:虛擬人與AIGC運(yùn)用在直播領(lǐng)域。據(jù)投資者互動易,公司旗下數(shù)字虛擬人孔襄已較為成熟,在NFT和廣告代言方面已經(jīng)開展了商業(yè)化變現(xiàn)。公司規(guī)劃在2023年發(fā)力虛擬人直播等業(yè)務(wù),計劃利用公司過往積淀的技術(shù)優(yōu)勢,實(shí)現(xiàn)高效率低成本的AIGC內(nèi)容生成。公司關(guān)于利用GPT技術(shù)框架做直播帶貨的AIGC生成,目前正處于研究階段。風(fēng)雨筑:將接入ChatGPT與文心一言,提升虛擬人在展館等場景的交互體驗。據(jù)投資者互動易,公司已探索AI在虛擬展廳、虛擬數(shù)字人、虛擬場景及數(shù)字藝術(shù)創(chuàng)作領(lǐng)域的應(yīng)用。虛擬數(shù)字人方面,1)公司目前正嘗試將打造的數(shù)字人接入ChatGPT,以強(qiáng)化數(shù)字虛擬人的場景識別和更新能力;2)也將把接入“文心一言”,支撐AI驅(qū)動數(shù)字人多模態(tài)交互識別感知和分析決策功能,為線上元宇宙空間里的數(shù)字人導(dǎo)覽以及線下沉浸式場景中的VR/AR內(nèi)容、對話交互等環(huán)節(jié)提供AI能力支撐,打造更有趣的互動交互體驗。凡拓數(shù)創(chuàng):將接入文心一言,驅(qū)動虛擬人及展館交互體驗。與風(fēng)語筑類似,凡拓數(shù)創(chuàng)也接入“文心一言”,以AI驅(qū)動數(shù)字人多模態(tài)交互識別感知和分析決策功能,讓虛擬人實(shí)現(xiàn)能聽、能答、能學(xué)習(xí)。此外,文心一言也可運(yùn)用在公司的數(shù)智展館,打造更沉浸場景、更智能交互的VR/AR導(dǎo)覽新體驗。34核心IP在家庭娛樂和親子互動領(lǐng)域具備高知名度。湯姆貓以親子品牌會說話的湯姆貓家族IP為核心,打造了《會說話的湯姆貓》等超20款線上休閑益智移動應(yīng)用,具備模仿人類說話、對用戶的觸摸/拍打做出即時反應(yīng)、打電話與玩家互動等玩法。據(jù)投資者問答,截至23年3月,湯姆貓系列移動應(yīng)用產(chǎn)品累計下載量超200億人次,全球月活數(shù)超4億,其中超80的活躍用戶來自海外。籌集資金,加大AI教育相關(guān)產(chǎn)品、模型等投入。公司在23年2月發(fā)布公告,計劃通過非公開發(fā)行股票籌集資金,用于投向通用人工智能交互終端產(chǎn)品研發(fā)、預(yù)訓(xùn)練語言模型的自建與接入、IDC算力基礎(chǔ)設(shè)施建設(shè)。其中預(yù)訓(xùn)練語言模型將圍繞公司擅長的情感陪伴、教育類等垂直領(lǐng)域,并接入公司研發(fā)的人工智能交互終端產(chǎn)品及第三方機(jī)構(gòu)的通識大模型。2.7

湯姆貓:核心“湯姆貓”IP與GPT能力結(jié)合,開發(fā)親子互動產(chǎn)品圖表:會聊天的湯姆貓測試效果資料來源:IT之家,wind“湯姆貓”接入GPT模型,提升產(chǎn)品交互體驗。據(jù)投資者問答,公司已嘗試應(yīng)用GPT-3.5模型進(jìn)行AI語音互動產(chǎn)品功能原型測試,并已將湯姆貓IP形象植入產(chǎn)品功能原型,加入語音識別、語音合成、性格設(shè)定、內(nèi)容過濾等功能。公司也已接入ChatGPT

API進(jìn)行測試,獲得了更快的響應(yīng)速度和更豐富語句表達(dá),當(dāng)前正著手開發(fā)正式產(chǎn)品。據(jù)IT之家,基于ChatGPT的《會聊天的湯姆貓》,已開啟安

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論