【信達(dá)傳媒】AI音頻軟硬結(jié)合聲動(dòng)未來(lái)AI視頻揚(yáng)帆起航_第1頁(yè)
【信達(dá)傳媒】AI音頻軟硬結(jié)合聲動(dòng)未來(lái)AI視頻揚(yáng)帆起航_第2頁(yè)
【信達(dá)傳媒】AI音頻軟硬結(jié)合聲動(dòng)未來(lái)AI視頻揚(yáng)帆起航_第3頁(yè)
【信達(dá)傳媒】AI音頻軟硬結(jié)合聲動(dòng)未來(lái)AI視頻揚(yáng)帆起航_第4頁(yè)
【信達(dá)傳媒】AI音頻軟硬結(jié)合聲動(dòng)未來(lái)AI視頻揚(yáng)帆起航_第5頁(yè)
已閱讀5頁(yè),還剩13頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

CINDASECURITIES馮翠婷傳媒互聯(lián)網(wǎng)及海外首席分析師CINDASECURITIESC0.,LTD郵編:1000532024年10月1日,OpenAI開發(fā)者大會(huì)上,公司公布了幾大創(chuàng)新:調(diào)整后的EBITDA為4810萬(wàn)美元,去年同期為2090萬(wàn)美元,24Q2和23Q2調(diào)整后的EBITDA利潤(rùn)率分別為27.0%和16.5%;用戶情況:24Q2Duolingo月活超過1億,季度末付費(fèi)用戶總數(shù)達(dá)到800生成、精確視頻編輯和音頻生成。2)字節(jié)豆包視頻大模型線開放。AI視頻生成+剪輯+故事創(chuàng)作有望成為產(chǎn)業(yè)核心發(fā)展方向。Al+視頻時(shí)代來(lái)臨,思考哪類公司存在商業(yè)化變現(xiàn)的可能性?我們認(rèn)為,1)一站式平臺(tái)型公司,如Adobe、美圖公司;2)Al+視頻技術(shù)頭部服如快手;4)廣告營(yíng)銷類公司,如易點(diǎn)天下、藍(lán)色光標(biāo)、因賽集團(tuán)、利歐股份;5)UGC社區(qū)類公司,如Bilibili;6)視頻數(shù)據(jù)類公司,如捷成股份、華策影視、視覺中國(guó)、中廣天擇;7)IP類公司,如上海電影、閱文集團(tuán)、湯姆貓、中文在線、果麥文化;8)探索AI視頻9)其他建議關(guān)注貓眼娛樂、光線傳媒、芒果超媒、萬(wàn)達(dá)電影等。表:相關(guān)上市公司估值表(截至2024.10.15)分類證券簡(jiǎn)稱(億元)市盈率站式平臺(tái)美圖公司閱文集團(tuán)IP類公司易點(diǎn)天下639.6因賽集團(tuán)視頻數(shù)據(jù)訓(xùn)練類視覺中國(guó)超訊通信其他2524.2162.4200).0盛天網(wǎng)絡(luò)53.7224.4440.0864.7中文在線請(qǐng)閱讀最后一頁(yè)免責(zé)聲明及信息披露3一、AI+視頻持續(xù)火熱:Meta、字節(jié)發(fā)布新模型,可靈、Pika、美圖迭代版本 5二、OpenAIDevDayAI音頻更新亮眼,有望催化AI語(yǔ)音交互應(yīng)用成熟 三、投資建議 四、風(fēng)險(xiǎn)因素 表1:OpenAIRealtime音頻API價(jià)格和其他模型文本價(jià)格比較 表2:相關(guān)上市公司估值表(截至2024.10.15) 圖1:MetaMovieGen基礎(chǔ)架構(gòu) 5圖2:MetaMovieGen視頻模型和其他模型量化指標(biāo)比較 6圖3:MetaMovieGen視頻模型生成效果比較 6圖4:MetaMovieGen模型視頻編輯原理 7圖5:MetaMovieGen模型可生成帶有音頻的視頻 7圖6:字節(jié)PixelDance視頻模型復(fù)雜prompt時(shí)序性指令生成 8圖7:可靈AI0930更新“對(duì)口型”功能 9 9 圖10:Speak接入OpenAIRealtimeAPI支持其角色扮演進(jìn)行新語(yǔ)言聯(lián)系功能 圖11:Duolingo2024Duocon更新功能(videocallwithLily,Adventures,Math,Music) 圖12:20Q3-24Q2Duolingo日活和月活用戶數(shù) 圖13:20Q1-24Q2Duolingo付費(fèi)訂閱用戶數(shù) 圖15:西湖心辰LingoAl語(yǔ)音交互演示 圖16:盛天網(wǎng)絡(luò)給麥AI功能迭代 圖17:昆侖萬(wàn)維Mureka創(chuàng)作頁(yè)面 請(qǐng)閱讀最后一頁(yè)免責(zé)聲明及信息披露http://www.cindasc.com4CINDASECURITIES2024年10月4日,Meta發(fā)布了MetaMovieGen模型,是一項(xiàng)針對(duì)圖像、視頻和音頻的突破性生成式Al研究,MovieGen具有四種功能:視頻生成、個(gè)性化視頻生成、精確視頻編輯和音頻生成。1)視頻生成:該30B參數(shù)轉(zhuǎn)換器模型能夠以每秒16幀的速度生成長(zhǎng)達(dá)16秒的視頻。2)個(gè)性化視頻生成:將一個(gè)人的圖像作為輸入,并將其與文本提示相結(jié)合,以生成包含參考人物和文本提示所告知的豐富視覺細(xì)節(jié)的視頻。3)視頻編輯:同一基礎(chǔ)模型的編輯變體以視頻和文本提示作為輸入,精確執(zhí)行任務(wù)以生成所需的輸出。它將視頻生成與高級(jí)圖像編輯相結(jié)合,執(zhí)行局部編輯(例如添加、刪除或替換元素)以及全局更改(例如背景或樣式修改)。4)音頻生成:13B參數(shù)音頻生成模型,該模型可以接收視頻和可選的文本提示,生成長(zhǎng)達(dá)45秒的高質(zhì)量高保真音頻,包括環(huán)境聲音、音效(Foley)和樂器背景音樂,所有這些都與視頻內(nèi)容同步,在音頻質(zhì)量、視頻到音頻對(duì)齊和文本到音頻對(duì)齊方面總體上實(shí)現(xiàn)了一流的性能。Meta首先通過一個(gè)時(shí)間自動(dòng)編碼器模型(TAE)訓(xùn)練了一個(gè)時(shí)空壓縮的隱空間,然后再基于此訓(xùn)練了一個(gè)生成模型。模型架構(gòu)上,Meta采用了Transformer,整體位于Lama3的設(shè)計(jì)空間中。推理階段,Meta的一個(gè)創(chuàng)新思路是首先使用Llama3對(duì)用戶輸入的提示詞進(jìn)行重寫,將其擴(kuò)展成更加詳細(xì)的版本。實(shí)踐表明該方法確實(shí)有助于提升生成結(jié)果的質(zhì)量。TimesteptByT5Anemuholdingasignsays“No,MovieGenisthebest”個(gè)性化視頻生成:基于Meta發(fā)布的30BMovieGen視頻模型,公司拓展到了個(gè)性化視頻的生成,用戶只需提供人物圖像輸入和對(duì)應(yīng)的文本提示詞,就能生成包含該人物以及文本描述的細(xì)節(jié)的視頻。Meta表示MovieGen生成的個(gè)性化視頻在保留人類身份和運(yùn)動(dòng)方面做到了SOTA。訓(xùn)練過程先是進(jìn)行預(yù)訓(xùn)練(分為身份注入、長(zhǎng)視頻生成、提升自然度三個(gè)階段),然后執(zhí)行監(jiān)督式微調(diào)。請(qǐng)閱讀最后一頁(yè)免責(zé)聲明及信息披露請(qǐng)閱讀最后一頁(yè)免責(zé)聲明及信息披露5MoVIEGENVIDEOnetwinrateRunwayGen3LumaLabsOpenAIvs.priorworkSoraKling1.5σOverallQuality士5.07Consistency士4.08MotionNaturalness士3.98MotionCompleteness-10.04Text-alignment士3.74RealnessAesthetics士4.84Prompt:AcomputermousewithlegsrunningonatreadmillKling1.5請(qǐng)閱讀最后一頁(yè)免責(zé)聲明及信息披露6首先執(zhí)行單幀編輯,然后進(jìn)行多幀編輯,之后再整體編輯視頻,效果圖中展示較好。圖4:MetaMovieGen模型視頻編輯原理Jointtrainingofimageeditingandtext-to-videoJointtrainingofanimatededitingandobjectsegmentation音頻同步生成:Meta訓(xùn)練了一個(gè)13B參數(shù)的音頻生成模型MovieGenAudio。該模型可以基于視頻和可選的文本提示詞生成長(zhǎng)達(dá)45秒的高質(zhì)量高保真音頻,包括環(huán)境聲音、音效(Folev)和背景音樂所有這些都與視頻內(nèi)容同步。公司還提出了一種音頻擴(kuò)展技術(shù),可以為任意長(zhǎng)度的視頻生成連貫的音頻,用戶后續(xù)可以直接生成帶有背景音樂的AI視頻,相較目前AI視頻競(jìng)品來(lái)看,技術(shù)端有了較為不錯(cuò)的進(jìn)步。圖5:MetaMovieGen模型可生成帶有音頻的視頻SFX+musicgenerationforsingle-shotvideos(a)ATVtrick/high-energy,action-packedelectronicrocktrack(b)Waterfall/dramaticandintenseorchestralpiece(c)Penguin/Afun,upbeat,andquirkyjazzpianotrack請(qǐng)閱讀最后一頁(yè)免責(zé)聲明及信息披露7(二)字節(jié)豆包視頻大模型PixelDance&Seaweed——主打時(shí)序性復(fù)雜動(dòng)作指令和交互能力字節(jié)跳動(dòng)正式進(jìn)軍AI視頻生成領(lǐng)域,其數(shù)據(jù)、技術(shù)和人才等儲(chǔ)備深厚。2024年9月24日,2024火山引擎AI創(chuàng)新巡展在深圳舉辦,發(fā)布了兩款豆包視頻生成大模型——PixelDance和Seaweed,開啟了邀測(cè)階段。9月25日,視頻大模型賦能的字節(jié)C端產(chǎn)品——即夢(mèng)正式開啟內(nèi)測(cè)邀請(qǐng)。1)PixelDanceV1.4是基于DiT結(jié)構(gòu)的視頻生成大模型,同時(shí)支持文生視頻和圖生視頻,能夠一次性生成長(zhǎng)達(dá)10秒的精彩視頻片段。模型可完成時(shí)序性多拍動(dòng)作,支持多主體復(fù)雜交互,還擁有豐富的運(yùn)鏡效果,多風(fēng)格多比例兼容性強(qiáng),能快速生成優(yōu)質(zhì)的視頻片段,賦能影視創(chuàng)作,廣告?zhèn)髅剑桃曨l,直播,電商等多個(gè)場(chǎng)景。2)Seaweed視頻生成大模型基于Transformer架構(gòu),支持文生視頻和圖生視頻。利用時(shí)空壓縮的潛空間進(jìn)行訓(xùn)練,模型原生支持多分辨率生成,適配橫屏、豎屏,并能夠根據(jù)用戶輸入的高清圖像分辨率進(jìn)行適配和保真。默認(rèn)輸出為720p分辨率、24fps、時(shí)長(zhǎng)5秒,并可動(dòng)態(tài)延長(zhǎng)至20-30秒。圖6:字節(jié)PixelDance視頻模型復(fù)雜prompt時(shí)序性指令生成(男人走進(jìn)畫面,女人轉(zhuǎn)頭看著他,互相擁抱,背景周圍的人在走)2024年9月30日,快手可靈AAI生成人物視頻后,上傳配音或歌唱,可靈AI就能讓視頻人物口型和音頻完美同步,仿佛真人對(duì)話唱歌,視頻瞬間栩栩如生。1)使用可靈AI,生成包含完整的人物面容的視頻;2)點(diǎn)擊預(yù)覽視頻下的「對(duì)口型;3)上傳配音/歌唱音頻,即可進(jìn)行對(duì)口型效果生成。可靈AI后續(xù)同樣有望發(fā)力視頻剪輯功能,更好滿足創(chuàng)作者需求。請(qǐng)閱讀最后一頁(yè)免責(zé)聲明及信息披露8圖7:可靈AI0930更新“對(duì)口型”功能請(qǐng)閱讀最后一頁(yè)免責(zé)聲明及信息披露92024年9月27日,美圖公司宣布,旗下AI短片創(chuàng)作工具M(jìn)OKI全面開放,用戶可登錄MOKI官網(wǎng)進(jìn)行體圖9:美圖MOKI一鍵成片功能展示二、OpenAIDevDayAI音頻更新亮眼,有望催化AI語(yǔ)音交互應(yīng)用成熟2024年10月1日,OpenAI3)模型蒸餾:讓開發(fā)人員可以使用較大的AI模型(例如01-preview和GPT-4o)來(lái)微調(diào)較小的模型(例如在ChatCompletionsAPI中引入了音頻輸入和輸出(在新窗口中打開)以支持不需要RealtimeAPI的低延遲請(qǐng)閱讀最后一頁(yè)免責(zé)聲明及信息披露10入約0.06美元,每分鐘音頻輸出約0.24美元。表1:OpenAIRealtime音頻API價(jià)格和其他模型文本價(jià)格比較輸入文本:5美元/1Mtokens2.5美元/1Mtokens0.15美元/1Mtokens音頻:100美元/1Mtokens,0.06美元/分鐘輸出文本:20美元/1Mtokens10美元/1Mtokens0.6美元/1Mtokens音頻:200美元/1Mtokens,0.24美元/分鐘2024年9月24日,全球領(lǐng)先的移動(dòng)學(xué)習(xí)平臺(tái)Duolingo在其年度會(huì)議Duocon2024上宣布了重大產(chǎn)品創(chuàng)請(qǐng)閱讀最后一頁(yè)免責(zé)聲明及信息披露11圖11:Duolingo2024Duocon更新功能(videocallwithLily,Adventures,Math,Music)現(xiàn)較為亮眼。24Q2公司實(shí)現(xiàn)營(yíng)收1.78億美元,比去年同期增長(zhǎng)41%;調(diào)整后的EBITDA為4810萬(wàn)美元,去年同期為2090萬(wàn)美元,24Q2和23Q2調(diào)整后的EBITDA利潤(rùn)率分別為27.0%和16.5%;用戶情況:24Q2Duolingo月活超過1億,季度末付費(fèi)用戶總數(shù)達(dá)到800萬(wàn),比去年同期增長(zhǎng)52%,即目前Max產(chǎn)品付費(fèi)率圖12:20Q3-24Q2Duolingo日活和月活用戶數(shù)(單位:百萬(wàn)人)請(qǐng)閱讀最后一頁(yè)免責(zé)聲明及信息披露12圖13:20Q1-24Q2Duolingo付費(fèi)訂閱用戶數(shù)(單位:百萬(wàn)人)圖14:20Q1-24Q2Duolingo季度收入(單位:百萬(wàn)美元)先。西湖心辰成立于2021年7月9日,已獲得湯姆貓、藍(lán)馳創(chuàng)投、凱泰資本、百度風(fēng)投、西湖教育基金會(huì)可請(qǐng)閱讀最后一頁(yè)免責(zé)聲明及信息披露13CINDASECURITIES寫寫Al作品廣場(chǎng)1.0(AL寫數(shù)/曲間Al寫歌原創(chuàng)音樂榜音色高級(jí)克陵精度)2024年8月14日,昆侖萬(wàn)維正式發(fā)布全球首個(gè)AI流媒體音樂平臺(tái)Melodio,并同步推出AI音樂商用創(chuàng)作平請(qǐng)閱讀最后一頁(yè)免責(zé)聲明及信息披露14圖17:昆侖萬(wàn)維Mureka創(chuàng)作頁(yè)面只MurekaCreate只月Cr表2:相關(guān)上市公司估值表(截至2024.10.15)分類證券簡(jiǎn)稱總市值(億元)歸母凈利潤(rùn)(百萬(wàn)元)市盈率一站式平臺(tái)美圖公司技術(shù)服務(wù)類-3645.0-2522.0-1742.0UGC社區(qū)類-1734.0-143.8視頻剪輯類IP類公司閱文集團(tuán)上海電影湯姆貓請(qǐng)閱讀最后一頁(yè)免責(zé)聲明及信息披露15廣告營(yíng)銷類易點(diǎn)天下82.9217.0286.7433.0藍(lán)色光標(biāo)639.645.6因賽集團(tuán)41.6//////利歐股份//////視頻數(shù)據(jù)訓(xùn)練類華策影視455.8視覺中國(guó)86.7224.143.8捷成股份450.0650.3中廣天擇-8.7//////AI短劇/短片探索類博納影業(yè)-552.6498.9超訊通信47.2243.442.5檸萌影視213.6258.1其他光線傳媒232.0417.8萬(wàn)達(dá)電影226.0912.2芒果超媒438.53555.72040.42273.72524.2AI音頻湯姆貓-864.6200.0400.081.240.6盛天網(wǎng)絡(luò)224.4291.7昆侖萬(wàn)維440.0864.7962.045.742.1中文在線89.4215.181.5請(qǐng)閱讀最后一頁(yè)免責(zé)聲明及信息披露請(qǐng)閱讀最后一頁(yè)免責(zé)聲明及信息披露16CINDASECURITIES馮翠婷,信達(dá)證券傳媒互聯(lián)網(wǎng)及海外首席分析師,北京大學(xué)管理學(xué)碩士,香港大學(xué)金融學(xué)碩士,中山大學(xué)管理學(xué)學(xué)士。2016-2021年任職于天風(fēng)證券,覆蓋互聯(lián)網(wǎng)、游戲、廣告、電商等多個(gè)板塊,及元宇宙、體育二級(jí)市場(chǎng)研究先行者(首篇報(bào)告作者),曾獲21年?yáng)|方財(cái)富Choice金牌分析師第一、金牌分析師第三、水晶球獎(jiǎng)第六、金麒麟第七,20年金牌分析師第一、第一財(cái)經(jīng)第一、金麒麟新銳第三。劉旺,信達(dá)證券傳媒互聯(lián)網(wǎng)及海外團(tuán)隊(duì)高級(jí)研究員。北京大學(xué)金融學(xué)碩士,北京郵電大學(xué)計(jì)算機(jī)碩士,北京郵電大學(xué)計(jì)算機(jī)學(xué)士,曾任職于騰訊,一級(jí)市場(chǎng)從業(yè)3年,創(chuàng)業(yè)5年(人工智能、虛擬數(shù)字人等),擁有人工智能、虛擬數(shù)字人、互聯(lián)網(wǎng)等領(lǐng)域的產(chǎn)業(yè)經(jīng)歷。李依韓,信達(dá)證券傳媒互聯(lián)網(wǎng)及海外團(tuán)隊(duì)研究員。中國(guó)農(nóng)業(yè)大學(xué)金融碩士,2022年加入信達(dá)證券研發(fā)中心,覆蓋互聯(lián)網(wǎng)板塊。曾任職于華創(chuàng)證券,所在團(tuán)隊(duì)曾入圍2021年新財(cái)富傳播與文化類最佳分析師評(píng)比,2021年21世紀(jì)金牌分析師第四名,2021年金麒麟獎(jiǎng)第五名,2021年水晶球評(píng)比入圍。資部,一級(jí)市場(chǎng)從業(yè)2年。后任職于私募基金擔(dān)任研究員,二級(jí)市場(chǎng)從業(yè)3年,覆蓋傳媒互聯(lián)網(wǎng)賽道。請(qǐng)閱讀最后一頁(yè)免責(zé)聲明及信息披露請(qǐng)閱讀最后一頁(yè)免責(zé)聲明及信息披露17CINDASECURITIES負(fù)責(zé)本報(bào)告全部或部分內(nèi)容的每一位分析師在此申明,本人具有證券投資咨詢執(zhí)業(yè)資格,并在中國(guó)證券業(yè)協(xié)會(huì)注冊(cè)登記為證券分析師,以勤勉的職業(yè)態(tài)度,獨(dú)立、客觀地出具本報(bào)告;本報(bào)告所表述的所有觀點(diǎn)準(zhǔn)確反映了分析師本人的研究觀點(diǎn);本人薪酬的任何組成部分不曾與,不與,也將不會(huì)與本報(bào)告中的具體分析意見或觀點(diǎn)直接或間接相關(guān)。免責(zé)聲明信達(dá)證券股份有限公司(以下簡(jiǎn)稱“信達(dá)證券”)具有中國(guó)證監(jiān)會(huì)批復(fù)的證券投資咨詢業(yè)務(wù)資格。本報(bào)告由信達(dá)證券制作并發(fā)布。本報(bào)告是針對(duì)與信達(dá)證券簽署服務(wù)協(xié)議的簽約客戶的專屬研究產(chǎn)品,為該類客戶進(jìn)行投資決策時(shí)提供輔助和參考,雙方對(duì)權(quán)利與義務(wù)均有嚴(yán)格約定。本報(bào)告僅提供給上述特定客戶,并不面向公眾發(fā)布。信達(dá)證券不會(huì)因接收人收到本報(bào)告而視其為本公司的當(dāng)然客戶??蛻魬?yīng)當(dāng)認(rèn)識(shí)到有關(guān)本報(bào)告的電話、短信、郵件提示僅為研究觀點(diǎn)的簡(jiǎn)要溝通,對(duì)本報(bào)告的參考使用須以本報(bào)告的完整版本為準(zhǔn)。本報(bào)告是基于信達(dá)證券認(rèn)為可靠的已公開信息編制,但信達(dá)證券不保證所載信息的準(zhǔn)確性和完整性。本報(bào)告所載的意見、評(píng)估及預(yù)測(cè)僅為本報(bào)告最初出具日的觀點(diǎn)和判斷,本報(bào)告所指的證券或投資標(biāo)的的價(jià)格、價(jià)值及投資收入可能會(huì)出現(xiàn)不同程度的波動(dòng),涉及證券或投資標(biāo)的的歷史表現(xiàn)不應(yīng)作為日后表現(xiàn)的保證。在不同時(shí)期,或因使用不同假設(shè)和標(biāo)準(zhǔn),采用不同觀點(diǎn)和分析方法,致使信達(dá)證券發(fā)出與本報(bào)告所載意見、評(píng)估及預(yù)測(cè)不一致的研究報(bào)告,對(duì)此信達(dá)證券可不發(fā)出特別通知。在任何情況下,本報(bào)告中的信息或所表述的意見并不構(gòu)成對(duì)任何人的投資建議,也沒有考慮到客戶特殊的投資目標(biāo)、財(cái)務(wù)狀況或需求??蛻魬?yīng)考慮本報(bào)告中的任何意見或建議是否符合其

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論