【信達(dá)傳媒】AI音頻軟硬結(jié)合聲動(dòng)未來AI視頻揚(yáng)帆起航

上傳人：緣*** IP屬地：四川上傳時(shí)間：2024-12-17 格式：DOCX 頁數(shù)：18 大小：3.43MB 積分：15 舉報(bào) 版權(quán)申訴

【信達(dá)傳媒】AI音頻軟硬結(jié)合聲動(dòng)未來AI視頻揚(yáng)帆起航_第2頁

【信達(dá)傳媒】AI音頻軟硬結(jié)合聲動(dòng)未來AI視頻揚(yáng)帆起航_第3頁

【信達(dá)傳媒】AI音頻軟硬結(jié)合聲動(dòng)未來AI視頻揚(yáng)帆起航_第4頁

【信達(dá)傳媒】AI音頻軟硬結(jié)合聲動(dòng)未來AI視頻揚(yáng)帆起航_第5頁

已閱讀5頁，還剩13頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

CINDASECURITIES馮翠婷傳媒互聯(lián)網(wǎng)及海外首席分析師CINDASECURITIESC0.,LTD郵編：1000532024年10月1日，OpenAI開發(fā)者大會(huì)上，公司公布了幾大創(chuàng)新：調(diào)整后的EBITDA為4810萬美元，去年同期為2090萬美元，24Q2和23Q2調(diào)整后的EBITDA利潤率分別為27.0%和16.5%;用戶情況：24Q2Duolingo月活超過1億，季度末付費(fèi)用戶總數(shù)達(dá)到800生成、精確視頻編輯和音頻生成。2)字節(jié)豆包視頻大模型線開放。AI視頻生成+剪輯+故事創(chuàng)作有望成為產(chǎn)業(yè)核心發(fā)展方向。Al+視頻時(shí)代來臨，思考哪類公司存在商業(yè)化變現(xiàn)的可能性?我們認(rèn)為，1)一站式平臺(tái)型公司，如Adobe、美圖公司；2)Al+視頻技術(shù)頭部服如快手；4)廣告營銷類公司，如易點(diǎn)天下、藍(lán)色光標(biāo)、因賽集團(tuán)、利歐股份；5)UGC社區(qū)類公司，如Bilibili;6)視頻數(shù)據(jù)類公司，如捷成股份、華策影視、視覺中國、中廣天擇；7)IP類公司，如上海電影、閱文集團(tuán)、湯姆貓、中文在線、果麥文化；8)探索AI視頻9)其他建議關(guān)注貓眼娛樂、光線傳媒、芒果超媒、萬達(dá)電影等。表：相關(guān)上市公司估值表(截至2024.10.15)分類證券簡稱(億元)市盈率站式平臺(tái)美圖公司閱文集團(tuán)IP類公司易點(diǎn)天下639.6因賽集團(tuán)視頻數(shù)據(jù)訓(xùn)練類視覺中國超訊通信其他2524.2162.4200).0盛天網(wǎng)絡(luò)53.7224.4440.0864.7中文在線請(qǐng)閱讀最后一頁免責(zé)聲明及信息披露3一、AI+視頻持續(xù)火熱：Meta、字節(jié)發(fā)布新模型，可靈、Pika、美圖迭代版本 5二、OpenAIDevDayAI音頻更新亮眼，有望催化AI語音交互應(yīng)用成熟三、投資建議四、風(fēng)險(xiǎn)因素表1:OpenAIRealtime音頻API價(jià)格和其他模型文本價(jià)格比較表2:相關(guān)上市公司估值表(截至2024.10.15) 圖1:MetaMovieGen基礎(chǔ)架構(gòu) 5圖2:MetaMovieGen視頻模型和其他模型量化指標(biāo)比較 6圖3:MetaMovieGen視頻模型生成效果比較 6圖4:MetaMovieGen模型視頻編輯原理 7圖5:MetaMovieGen模型可生成帶有音頻的視頻 7圖6:字節(jié)PixelDance視頻模型復(fù)雜prompt時(shí)序性指令生成 8圖7:可靈AI0930更新“對(duì)口型”功能 9 9 圖10:Speak接入OpenAIRealtimeAPI支持其角色扮演進(jìn)行新語言聯(lián)系功能圖11:Duolingo2024Duocon更新功能(videocallwithLily,Adventures,Math,Music) 圖12:20Q3-24Q2Duolingo日活和月活用戶數(shù) 圖13:20Q1-24Q2Duolingo付費(fèi)訂閱用戶數(shù) 圖15:西湖心辰LingoAl語音交互演示圖16:盛天網(wǎng)絡(luò)給麥AI功能迭代圖17:昆侖萬維Mureka創(chuàng)作頁面請(qǐng)閱讀最后一頁免責(zé)聲明及信息披露http://www.cindasc.com4CINDASECURITIES2024年10月4日，Meta發(fā)布了MetaMovieGen模型，是一項(xiàng)針對(duì)圖像、視頻和音頻的突破性生成式Al研究，MovieGen具有四種功能：視頻生成、個(gè)性化視頻生成、精確視頻編輯和音頻生成。1)視頻生成：該30B參數(shù)轉(zhuǎn)換器模型能夠以每秒16幀的速度生成長達(dá)16秒的視頻。2)個(gè)性化視頻生成：將一個(gè)人的圖像作為輸入，并將其與文本提示相結(jié)合，以生成包含參考人物和文本提示所告知的豐富視覺細(xì)節(jié)的視頻。3)視頻編輯：同一基礎(chǔ)模型的編輯變體以視頻和文本提示作為輸入，精確執(zhí)行任務(wù)以生成所需的輸出。它將視頻生成與高級(jí)圖像編輯相結(jié)合，執(zhí)行局部編輯(例如添加、刪除或替換元素)以及全局更改(例如背景或樣式修改)。4)音頻生成：13B參數(shù)音頻生成模型，該模型可以接收視頻和可選的文本提示，生成長達(dá)45秒的高質(zhì)量高保真音頻，包括環(huán)境聲音、音效(Foley)和樂器背景音樂，所有這些都與視頻內(nèi)容同步，在音頻質(zhì)量、視頻到音頻對(duì)齊和文本到音頻對(duì)齊方面總體上實(shí)現(xiàn)了一流的性能。Meta首先通過一個(gè)時(shí)間自動(dòng)編碼器模型(TAE)訓(xùn)練了一個(gè)時(shí)空壓縮的隱空間，然后再基于此訓(xùn)練了一個(gè)生成模型。模型架構(gòu)上，Meta采用了Transformer,整體位于Lama3的設(shè)計(jì)空間中。推理階段，Meta的一個(gè)創(chuàng)新思路是首先使用Llama3對(duì)用戶輸入的提示詞進(jìn)行重寫，將其擴(kuò)展成更加詳細(xì)的版本。實(shí)踐表明該方法確實(shí)有助于提升生成結(jié)果的質(zhì)量。TimesteptByT5Anemuholdingasignsays“No,MovieGenisthebest”個(gè)性化視頻生成：基于Meta發(fā)布的30BMovieGen視頻模型，公司拓展到了個(gè)性化視頻的生成，用戶只需提供人物圖像輸入和對(duì)應(yīng)的文本提示詞，就能生成包含該人物以及文本描述的細(xì)節(jié)的視頻。Meta表示MovieGen生成的個(gè)性化視頻在保留人類身份和運(yùn)動(dòng)方面做到了SOTA。訓(xùn)練過程先是進(jìn)行預(yù)訓(xùn)練(分為身份注入、長視頻生成、提升自然度三個(gè)階段),然后執(zhí)行監(jiān)督式微調(diào)。請(qǐng)閱讀最后一頁免責(zé)聲明及信息披露請(qǐng)閱讀最后一頁免責(zé)聲明及信息披露5MoVIEGENVIDEOnetwinrateRunwayGen3LumaLabsOpenAIvs.priorworkSoraKling1.5σOverallQuality士5.07Consistency士4.08MotionNaturalness士3.98MotionCompleteness-10.04Text-alignment士3.74RealnessAesthetics士4.84Prompt:AcomputermousewithlegsrunningonatreadmillKling1.5請(qǐng)閱讀最后一頁免責(zé)聲明及信息披露6首先執(zhí)行單幀編輯，然后進(jìn)行多幀編輯，之后再整體編輯視頻，效果圖中展示較好。圖4:MetaMovieGen模型視頻編輯原理Jointtrainingofimageeditingandtext-to-videoJointtrainingofanimatededitingandobjectsegmentation音頻同步生成：Meta訓(xùn)練了一個(gè)13B參數(shù)的音頻生成模型MovieGenAudio。該模型可以基于視頻和可選的文本提示詞生成長達(dá)45秒的高質(zhì)量高保真音頻，包括環(huán)境聲音、音效(Folev)和背景音樂所有這些都與視頻內(nèi)容同步。公司還提出了一種音頻擴(kuò)展技術(shù)，可以為任意長度的視頻生成連貫的音頻，用戶后續(xù)可以直接生成帶有背景音樂的AI視頻，相較目前AI視頻競品來看，技術(shù)端有了較為不錯(cuò)的進(jìn)步。圖5:MetaMovieGen模型可生成帶有音頻的視頻SFX+musicgenerationforsingle-shotvideos(a)ATVtrick/high-energy,action-packedelectronicrocktrack(b)Waterfall/dramaticandintenseorchestralpiece(c)Penguin/Afun,upbeat,andquirkyjazzpianotrack請(qǐng)閱讀最后一頁免責(zé)聲明及信息披露7(二)字節(jié)豆包視頻大模型PixelDance&Seaweed——主打時(shí)序性復(fù)雜動(dòng)作指令和交互能力字節(jié)跳動(dòng)正式進(jìn)軍AI視頻生成領(lǐng)域，其數(shù)據(jù)、技術(shù)和人才等儲(chǔ)備深厚。2024年9月24日，2024火山引擎AI創(chuàng)新巡展在深圳舉辦，發(fā)布了兩款豆包視頻生成大模型——PixelDance和Seaweed,開啟了邀測(cè)階段。9月25日，視頻大模型賦能的字節(jié)C端產(chǎn)品——即夢(mèng)正式開啟內(nèi)測(cè)邀請(qǐng)。1)PixelDanceV1.4是基于DiT結(jié)構(gòu)的視頻生成大模型，同時(shí)支持文生視頻和圖生視頻，能夠一次性生成長達(dá)10秒的精彩視頻片段。模型可完成時(shí)序性多拍動(dòng)作，支持多主體復(fù)雜交互，還擁有豐富的運(yùn)鏡效果，多風(fēng)格多比例兼容性強(qiáng)，能快速生成優(yōu)質(zhì)的視頻片段，賦能影視創(chuàng)作，廣告?zhèn)髅?，短視頻，直播，電商等多個(gè)場(chǎng)景。2)Seaweed視頻生成大模型基于Transformer架構(gòu)，支持文生視頻和圖生視頻。利用時(shí)空壓縮的潛空間進(jìn)行訓(xùn)練，模型原生支持多分辨率生成，適配橫屏、豎屏，并能夠根據(jù)用戶輸入的高清圖像分辨率進(jìn)行適配和保真。默認(rèn)輸出為720p分辨率、24fps、時(shí)長5秒，并可動(dòng)態(tài)延長至20-30秒。圖6:字節(jié)PixelDance視頻模型復(fù)雜prompt時(shí)序性指令生成(男人走進(jìn)畫面，女人轉(zhuǎn)頭看著他，互相擁抱，背景周圍的人在走)2024年9月30日，快手可靈AAI生成人物視頻后，上傳配音或歌唱，可靈AI就能讓視頻人物口型和音頻完美同步，仿佛真人對(duì)話唱歌，視頻瞬間栩栩如生。1)使用可靈AI,生成包含完整的人物面容的視頻；2)點(diǎn)擊預(yù)覽視頻下的「對(duì)口型；3)上傳配音/歌唱音頻，即可進(jìn)行對(duì)口型效果生成?？伸`AI后續(xù)同樣有望發(fā)力視頻剪輯功能，更好滿足創(chuàng)作者需求。請(qǐng)閱讀最后一頁免責(zé)聲明及信息披露8圖7:可靈AI0930更新“對(duì)口型”功能請(qǐng)閱讀最后一頁免責(zé)聲明及信息披露92024年9月27日，美圖公司宣布，旗下AI短片創(chuàng)作工具M(jìn)OKI全面開放，用戶可登錄MOKI官網(wǎng)進(jìn)行體圖9:美圖MOKI一鍵成片功能展示二、OpenAIDevDayAI音頻更新亮眼，有望催化AI語音交互應(yīng)用成熟2024年10月1日，OpenAI3)模型蒸餾：讓開發(fā)人員可以使用較大的AI模型(例如01-preview和GPT-4o)來微調(diào)較小的模型(例如在ChatCompletionsAPI中引入了音頻輸入和輸出(在新窗口中打開)以支持不需要RealtimeAPI的低延遲請(qǐng)閱讀最后一頁免責(zé)聲明及信息披露10入約0.06美元，每分鐘音頻輸出約0.24美元。表1:OpenAIRealtime音頻API價(jià)格和其他模型文本價(jià)格比較輸入文本：5美元/1Mtokens2.5美元/1Mtokens0.15美元/1Mtokens音頻：100美元/1Mtokens,0.06美元/分鐘輸出文本：20美元/1Mtokens10美元/1Mtokens0.6美元/1Mtokens音頻：200美元/1Mtokens,0.24美元/分鐘2024年9月24日，全球領(lǐng)先的移動(dòng)學(xué)習(xí)平臺(tái)Duolingo在其年度會(huì)議Duocon2024上宣布了重大產(chǎn)品創(chuàng)請(qǐng)閱讀最后一頁免責(zé)聲明及信息披露11圖11:Duolingo2024Duocon更新功能(videocallwithLily,Adventures,Math,Music)現(xiàn)較為亮眼。24Q2公司實(shí)現(xiàn)營收1.78億美元，比去年同期增長41%;調(diào)整后的EBITDA為4810萬美元，去年同期為2090萬美元，24Q2和23Q2調(diào)整后的EBITDA利潤率分別為27.0%和16.5%;用戶情況：24Q2Duolingo月活超過1億，季度末付費(fèi)用戶總數(shù)達(dá)到800萬，比去年同期增長52%,即目前Max產(chǎn)品付費(fèi)率圖12:20Q3-24Q2Duolingo日活和月活用戶數(shù)(單位：百萬人)請(qǐng)閱讀最后一頁免責(zé)聲明及信息披露12圖13:20Q1-24Q2Duolingo付費(fèi)訂閱用戶數(shù)(單位：百萬人)圖14:20Q1-24Q2Duolingo季度收入(單位：百萬美元)先。西湖心辰成立于2021年7月9日，已獲得湯姆貓、藍(lán)馳創(chuàng)投、凱泰資本、百度風(fēng)投、西湖教育基金會(huì)可請(qǐng)閱讀最后一頁免責(zé)聲明及信息披露13CINDASECURITIES寫寫Al作品廣場(chǎng)1.0(AL寫數(shù)/曲間Al寫歌原創(chuàng)音樂榜音色高級(jí)克陵精度)2024年8月14日，昆侖萬維正式發(fā)布全球首個(gè)AI流媒體音樂平臺(tái)Melodio,并同步推出AI音樂商用創(chuàng)作平請(qǐng)閱讀最后一頁免責(zé)聲明及信息披露14圖17:昆侖萬維Mureka創(chuàng)作頁面只MurekaCreate只月Cr表2:相關(guān)上市公司估值表(截至2024.10.15)分類證券簡稱總市值(億元)歸母凈利潤(百萬元)市盈率一站式平臺(tái)美圖公司技術(shù)服務(wù)類-3645.0-2522.0-1742.0UGC社區(qū)類-1734.0-143.8視頻剪輯類IP類公司閱文集團(tuán)上海電影湯姆貓請(qǐng)閱讀最后一頁免責(zé)聲明及信息披露15廣告營銷類易點(diǎn)天下82.9217.0286.7433.0藍(lán)色光標(biāo)639.645.6因賽集團(tuán)41.6//////利歐股份//////視頻數(shù)據(jù)訓(xùn)練類華策影視455.8視覺中國86.7224.143.8捷成股份450.0650.3中廣天擇-8.7//////AI短劇/短片探索類博納影業(yè)-552.6498.9超訊通信47.2243.442.5檸萌影視213.6258.1其他光線傳媒232.0417.8萬達(dá)電影226.0912.2芒果超媒438.53555.72040.42273.72524.2AI音頻湯姆貓-864.6200.0400.081.240.6盛天網(wǎng)絡(luò)224.4291.7昆侖萬維440.0864.7962.045.742.1中文在線89.4215.181.5請(qǐng)閱讀最后一頁免責(zé)聲明及信息披露請(qǐng)閱讀最后一頁免責(zé)聲明及信息披露16CINDASECURITIES馮翠婷，信達(dá)證券傳媒互聯(lián)網(wǎng)及海外首席分析師，北京大學(xué)管理學(xué)碩士，香港大學(xué)金融學(xué)碩士，中山大學(xué)管理學(xué)學(xué)士。2016-2021年任職于天風(fēng)證券，覆蓋互聯(lián)網(wǎng)、游戲、廣告、電商等多個(gè)板塊，及元宇宙、體育二級(jí)市場(chǎng)研究先行者(首篇報(bào)告作者),曾獲21年東方財(cái)富Choice金牌分析師第一、金牌分析師第三、水晶球獎(jiǎng)第六、金麒麟第七，20年金牌分析師第一、第一財(cái)經(jīng)第一、金麒麟新銳第三。劉旺，信達(dá)證券傳媒互聯(lián)網(wǎng)及海外團(tuán)隊(duì)高級(jí)研究員。北京大學(xué)金融學(xué)碩士，北京郵電大學(xué)計(jì)算機(jī)碩士，北京郵電大學(xué)計(jì)算機(jī)學(xué)士，曾任職于騰訊，一級(jí)市場(chǎng)從業(yè)3年，創(chuàng)業(yè)5年(人工智能、虛擬數(shù)字人等),擁有人工智能、虛擬數(shù)字人、互聯(lián)網(wǎng)等領(lǐng)域的產(chǎn)業(yè)經(jīng)歷。李依韓，信達(dá)證券傳媒互聯(lián)網(wǎng)及海外團(tuán)隊(duì)研究員。中國農(nóng)業(yè)大學(xué)金融碩士，2022年加入信達(dá)證券研發(fā)中心，覆蓋互聯(lián)網(wǎng)板塊。曾任職于華創(chuàng)證券，所在團(tuán)隊(duì)曾入圍2021年新財(cái)富傳播與文化類最佳分析師評(píng)比，2021年21世紀(jì)金牌分析師第四名，2021年金麒麟獎(jiǎng)第五名，2021年水晶球評(píng)比入圍。資部，一級(jí)市場(chǎng)從業(yè)2年。后任職于私募基金擔(dān)任研究員，二級(jí)市場(chǎng)從業(yè)3年，覆蓋傳媒互聯(lián)網(wǎng)賽道。請(qǐng)閱讀最后一頁免責(zé)聲明及信息披露請(qǐng)閱讀最后一頁免責(zé)聲明及信息披露17CINDASECURITIES負(fù)責(zé)本報(bào)告全部或部分內(nèi)容的每一位分析師在此申明，本人具有證券投資咨詢執(zhí)業(yè)資格，并在中國證券業(yè)協(xié)會(huì)注冊(cè)登記為證券分析師，以勤勉的職業(yè)態(tài)度，獨(dú)立、客觀地出具本報(bào)告；本報(bào)告所表述的所有觀點(diǎn)準(zhǔn)確反映了分析師本人的研究觀點(diǎn)；本人薪酬的任何組成部分不曾與，不與，也將不會(huì)與本報(bào)告中的具體分析意見或觀點(diǎn)直接或間接相關(guān)。免責(zé)聲明信達(dá)證券股份有限公司(以下簡稱“信達(dá)證券”)具有中國證監(jiān)會(huì)批復(fù)的證券投資咨詢業(yè)務(wù)資格。本報(bào)告由信達(dá)證券制作并發(fā)布。本報(bào)告是針對(duì)與信達(dá)證券簽署服務(wù)協(xié)議的簽約客戶的專屬研究產(chǎn)品，為該類客戶進(jìn)行投資決策時(shí)提供輔助和參考，雙方對(duì)權(quán)利與義務(wù)均有嚴(yán)格約定。本報(bào)告僅提供給上述特定客戶，并不面向公眾發(fā)布。信達(dá)證券不會(huì)因接收人收到本報(bào)告而視其為本公司的當(dāng)然客戶?？蛻魬?yīng)當(dāng)認(rèn)識(shí)到有關(guān)本報(bào)告的電話、短信、郵件提示僅為研究觀點(diǎn)的簡要溝通，對(duì)本報(bào)告的參考使用須以本報(bào)告的完整版本為準(zhǔn)。本報(bào)告是基于信達(dá)證券認(rèn)為可靠的已公開信息編制，但信達(dá)證券不保證所載信息的準(zhǔn)確性和完整性。本報(bào)告所載的意見、評(píng)估及預(yù)測(cè)僅為本報(bào)告最初出具日的觀點(diǎn)和判斷，本報(bào)告所指的證券或投資標(biāo)的的價(jià)格、價(jià)值及投資收入可能會(huì)出現(xiàn)不同程度的波動(dòng)，涉及證券或投資標(biāo)的的歷史表現(xiàn)不應(yīng)作為日后表現(xiàn)的保證。在不同時(shí)期，或因使用不同假設(shè)和標(biāo)準(zhǔn)，采用不同觀點(diǎn)和分析方法，致使信達(dá)證券發(fā)出與本報(bào)告所載意見、評(píng)估及預(yù)測(cè)不一致的研究報(bào)告，對(duì)此信達(dá)證券可不發(fā)出特別通知。在任何情況下，本報(bào)告中的信息或所表述的意見并不構(gòu)成對(duì)任何人的投資建議，也沒有考慮到客戶特殊的投資目標(biāo)、財(cái)務(wù)狀況或需求。客戶應(yīng)考慮本報(bào)告中的任何意見或建議是否符合其

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

【信達(dá)傳媒】AI音頻軟硬結(jié)合聲動(dòng)未來AI視頻揚(yáng)帆起航

文檔簡介

溫馨提示

最新文檔

評(píng)論

【信達(dá)傳媒】AI音頻軟硬結(jié)合聲動(dòng)未來AI視頻揚(yáng)帆起航

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔