艾瑞咨詢:2022年中國(guó)智能語(yǔ)音轉(zhuǎn)寫(xiě)行業(yè)研究報(bào)告-43正式版_第1頁(yè)
艾瑞咨詢:2022年中國(guó)智能語(yǔ)音轉(zhuǎn)寫(xiě)行業(yè)研究報(bào)告-43正式版_第2頁(yè)
艾瑞咨詢:2022年中國(guó)智能語(yǔ)音轉(zhuǎn)寫(xiě)行業(yè)研究報(bào)告-43正式版_第3頁(yè)
艾瑞咨詢:2022年中國(guó)智能語(yǔ)音轉(zhuǎn)寫(xiě)行業(yè)研究報(bào)告-43正式版_第4頁(yè)
艾瑞咨詢:2022年中國(guó)智能語(yǔ)音轉(zhuǎn)寫(xiě)行業(yè)研究報(bào)告-43正式版_第5頁(yè)
已閱讀5頁(yè),還剩46頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

釋放數(shù)字生產(chǎn)力,留存探索語(yǔ)音內(nèi)容智能語(yǔ)音轉(zhuǎn)寫(xiě)行業(yè)研究報(bào)告?2022.12iResearchInc.前言研究背景:在工具不發(fā)達(dá)的年代,會(huì)議記錄主要依靠人力完成,以多人合作的分工形式提升記錄效率。后隨著記錄工具不斷升級(jí)和專業(yè)培訓(xùn),人工轉(zhuǎn)寫(xiě)的效率也在不斷提升,專業(yè)速錄師可依靠速錄機(jī)完成會(huì)議等場(chǎng)景的轉(zhuǎn)寫(xiě)需求,但成本較高。后隨著互聯(lián)網(wǎng)及人工智能技術(shù)的不斷發(fā)展,智能語(yǔ)音轉(zhuǎn)寫(xiě)產(chǎn)品應(yīng)運(yùn)而生。尤其在2011年,大量研究人員轉(zhuǎn)向深度學(xué)習(xí)在智能語(yǔ)音領(lǐng)域的研究,利用大數(shù)據(jù)、機(jī)器學(xué)習(xí)和大算力“三駕馬車(chē)”,讓語(yǔ)音識(shí)別的識(shí)別準(zhǔn)確度再一次得到明顯提升,智能語(yǔ)音技術(shù)迎來(lái)落地應(yīng)用的發(fā)展期?!惫び破涫?,必先利其器“,智能化的語(yǔ)音轉(zhuǎn)寫(xiě)服務(wù)以價(jià)優(yōu)、質(zhì)高、便捷的優(yōu)勢(shì)滿足了轉(zhuǎn)寫(xiě)記錄這一交流場(chǎng)景的需求痛點(diǎn),并在遠(yuǎn)程辦公、新媒體、國(guó)際化交流的需求背景下,未來(lái)保持強(qiáng)勁市場(chǎng)增長(zhǎng)力。對(duì)此,艾瑞發(fā)布《中國(guó)智能語(yǔ)音轉(zhuǎn)寫(xiě)行業(yè)研究報(bào)告》,從語(yǔ)音識(shí)別-智能轉(zhuǎn)寫(xiě)產(chǎn)品角度出發(fā),確立智能語(yǔ)音轉(zhuǎn)寫(xiě)服務(wù)的范圍定義,描繪智能語(yǔ)音轉(zhuǎn)寫(xiě)服務(wù)的產(chǎn)業(yè)圖譜與需求市場(chǎng),梳理智能語(yǔ)音轉(zhuǎn)寫(xiě)服務(wù)在SaaS軟件服務(wù)及本地解決方案的不同產(chǎn)品形式、商業(yè)模式及廠商格局,并為中國(guó)智能語(yǔ)音轉(zhuǎn)寫(xiě)行業(yè)的趨勢(shì)發(fā)展提供分析判斷,希望通過(guò)本報(bào)告,為讀者呈現(xiàn)中國(guó)智能語(yǔ)音轉(zhuǎn)寫(xiě)的產(chǎn)業(yè)發(fā)展背景、行業(yè)廠商動(dòng)態(tài)、產(chǎn)品發(fā)展機(jī)遇的多維視角,歡迎各界探討指正。研究對(duì)象:作為語(yǔ)音識(shí)別技術(shù)的產(chǎn)品應(yīng)用,智能語(yǔ)音轉(zhuǎn)寫(xiě)產(chǎn)品是可以支持長(zhǎng)音頻識(shí)別的語(yǔ)音轉(zhuǎn)文字服務(wù),分為實(shí)時(shí)語(yǔ)音轉(zhuǎn)寫(xiě)與非實(shí)時(shí)語(yǔ)音轉(zhuǎn)寫(xiě),可為信息處理和數(shù)據(jù)挖掘提供基礎(chǔ)。研究方法:本報(bào)告通過(guò)業(yè)內(nèi)資深的專家訪談、桌面研究、產(chǎn)品對(duì)比研究、行業(yè)數(shù)據(jù)統(tǒng)計(jì)與行業(yè)規(guī)模推算輸出相應(yīng)研究成果。

報(bào)告撰寫(xiě)艾瑞咨詢產(chǎn)業(yè)數(shù)字化研究部人工智能研究組2摘要智能語(yǔ)音產(chǎn)業(yè)發(fā)展智能語(yǔ)音轉(zhuǎn)寫(xiě)產(chǎn)品智能語(yǔ)音轉(zhuǎn)寫(xiě)市場(chǎng)智能語(yǔ)音轉(zhuǎn)寫(xiě)趨勢(shì)洞察

近年來(lái),智能語(yǔ)音技術(shù)與互聯(lián)網(wǎng)、企業(yè)服務(wù)、消費(fèi)硬件、傳媒、醫(yī)療健康等各行業(yè)的深度融合帶來(lái)了新的用戶需求增長(zhǎng)和商業(yè)模式創(chuàng)新,創(chuàng)造產(chǎn)業(yè)經(jīng)濟(jì)價(jià)值、繁榮產(chǎn)業(yè)生態(tài),算法模型、優(yōu)質(zhì)數(shù)據(jù)集與多樣化應(yīng)用場(chǎng)景助力產(chǎn)業(yè)規(guī)模走高。部分智能語(yǔ)音產(chǎn)品如語(yǔ)音助手、語(yǔ)音轉(zhuǎn)寫(xiě)、智能客服等取得產(chǎn)品價(jià)值突破或商業(yè)上的顯著成就,語(yǔ)音識(shí)別相關(guān)產(chǎn)品多已進(jìn)入穩(wěn)步上升期。但在細(xì)分產(chǎn)品的交互體驗(yàn)、使用效果、場(chǎng)景優(yōu)化等方面仍面臨長(zhǎng)期求索。人們面對(duì)“AI”時(shí)希望得到的自然、類人、甚至高信息密度的交互體驗(yàn),仍然是一個(gè)宏偉的開(kāi)放性課題。語(yǔ)音識(shí)別產(chǎn)品早期主要是語(yǔ)音聽(tīng)寫(xiě),即用戶說(shuō)一句、機(jī)器識(shí)別一句;后來(lái)發(fā)展成語(yǔ)音轉(zhuǎn)寫(xiě),更聚焦于人人交流場(chǎng)景。智能語(yǔ)音轉(zhuǎn)寫(xiě)是可以支持長(zhǎng)音視頻的語(yǔ)音轉(zhuǎn)文字服務(wù),附加產(chǎn)品服務(wù)、多語(yǔ)種翻譯、內(nèi)容分析等智能化功能,滿足用戶在會(huì)議、庭審、采訪、直播、視頻制作、客服質(zhì)檢等場(chǎng)景中的實(shí)時(shí)與非實(shí)時(shí)語(yǔ)音轉(zhuǎn)寫(xiě)需求。隨著語(yǔ)音識(shí)別準(zhǔn)確性及效率的提升、多語(yǔ)種與方言轉(zhuǎn)寫(xiě)服務(wù)豐富,以及上下文糾正、標(biāo)點(diǎn)過(guò)濾、自定義熱詞配置、聲紋角色分離、語(yǔ)音內(nèi)容分析提取等功能的逐步優(yōu)化,智能語(yǔ)音轉(zhuǎn)寫(xiě)服務(wù)的商業(yè)化落地與多場(chǎng)景復(fù)用持續(xù)推進(jìn),成為語(yǔ)音識(shí)別產(chǎn)品的“排頭兵”。在人力成本、協(xié)同辦公、傳媒音視頻、會(huì)展交流、跨國(guó)溝通等多重因素驅(qū)動(dòng)下,中國(guó)智能轉(zhuǎn)寫(xiě)市場(chǎng)不斷注入需求活力,2021年中國(guó)智能語(yǔ)音轉(zhuǎn)寫(xiě)市場(chǎng)規(guī)模已約為10億元。未來(lái),隨著智能轉(zhuǎn)寫(xiě)的技術(shù)突破、功能豐富及場(chǎng)景泛化,智能轉(zhuǎn)寫(xiě)市場(chǎng)規(guī)模將加速上揚(yáng),預(yù)計(jì)2026年市場(chǎng)規(guī)模將達(dá)到38億。從產(chǎn)品形態(tài)來(lái)看,智能轉(zhuǎn)寫(xiě)產(chǎn)品主要包括SaaS類產(chǎn)品與本地化部署解決方案兩大類。其中,SaaS市場(chǎng)頭部聚集效應(yīng)顯著,訊飛聽(tīng)見(jiàn)與搜狗聽(tīng)寫(xiě)位列第一梯隊(duì),訊飛聽(tīng)見(jiàn)在轉(zhuǎn)寫(xiě)準(zhǔn)確率尤其是小語(yǔ)種和方言等、產(chǎn)品豐富度、品牌影響力和發(fā)展?jié)摿S度拔得頭籌。未來(lái),SaaS形式API調(diào)用與垂類解決方案將形成合力,構(gòu)成智能語(yǔ)音轉(zhuǎn)寫(xiě)產(chǎn)業(yè)既快且穩(wěn)的增長(zhǎng)飛輪,高生態(tài)活性加硬解決方案實(shí)力的企業(yè)將更能突出重圍,搶占更多增量市場(chǎng)。從技術(shù)趨勢(shì)來(lái)看,語(yǔ)音識(shí)別技術(shù)的精度和速度仍取決于實(shí)際應(yīng)用環(huán)境,面對(duì)“混合語(yǔ)種”“嘈雜環(huán)境”下的“多人”“交互”“重疊”等多重因素交織的復(fù)雜語(yǔ)音場(chǎng)景,語(yǔ)音轉(zhuǎn)寫(xiě)技術(shù)應(yīng)用仍有待突破;從場(chǎng)景價(jià)值來(lái)看,如今智能轉(zhuǎn)寫(xiě)應(yīng)用領(lǐng)域大多僅服務(wù)于從語(yǔ)音到文字轉(zhuǎn)寫(xiě)內(nèi)容的實(shí)現(xiàn),未來(lái)轉(zhuǎn)寫(xiě)應(yīng)用可結(jié)合自然語(yǔ)言理解、機(jī)器學(xué)習(xí)、知識(shí)圖譜等AI技術(shù),拓展轉(zhuǎn)寫(xiě)產(chǎn)品的場(chǎng)景邊界,深入挖掘轉(zhuǎn)寫(xiě)內(nèi)容價(jià)值,以更高階、智能的輔助替代角色,為客戶提供問(wèn)題預(yù)警、策略總結(jié)、決策分析等功能服務(wù);從廠商策略來(lái)看,各家將以構(gòu)建自身產(chǎn)品生態(tài),加強(qiáng)外部場(chǎng)景合作為策略核心,基于自身企業(yè)特點(diǎn)選擇差異化側(cè)重,共同推進(jìn)轉(zhuǎn)寫(xiě)技術(shù)的應(yīng)用滲透與市場(chǎng)發(fā)展。來(lái)源:艾瑞咨詢研究院自主研究繪制。?2022.12iResearchInc. 3智能語(yǔ)音轉(zhuǎn)寫(xiě)行業(yè)——發(fā)展背景篇 1智能語(yǔ)音轉(zhuǎn)寫(xiě)行業(yè)——市場(chǎng)分析篇 2智能語(yǔ)音轉(zhuǎn)寫(xiě)行業(yè)典型企業(yè)案例 3智能語(yǔ)音轉(zhuǎn)寫(xiě)行業(yè)——發(fā)展趨勢(shì)篇 44智能語(yǔ)音產(chǎn)業(yè)的宏觀背景數(shù)字信息輸入輸出的重要載體,人工智能產(chǎn)業(yè)落地“先鋒軍”智能語(yǔ)音技術(shù)指通過(guò)聲音信號(hào)的前端處理、語(yǔ)音識(shí)別(ASR)、自然語(yǔ)言處理(NLP)、語(yǔ)音合成(TTS)等技術(shù)形成完整的人機(jī)語(yǔ)音交互流程,是實(shí)現(xiàn)人與機(jī)器交流的紐帶,也是數(shù)字信息輸入與輸出的重要載體。近年來(lái),智能語(yǔ)音技術(shù)與互聯(lián)網(wǎng)、企業(yè)服務(wù)、消費(fèi)硬件、傳媒、醫(yī)療健康等各行業(yè)的深度融合帶來(lái)了新的用戶需求增長(zhǎng)和商業(yè)模式創(chuàng)新,創(chuàng)造產(chǎn)業(yè)經(jīng)濟(jì)價(jià)值、繁榮產(chǎn)業(yè)生態(tài)。智能語(yǔ)音產(chǎn)業(yè)的迅速發(fā)展促進(jìn)了我國(guó)數(shù)字經(jīng)濟(jì)發(fā)展、提高了社會(huì)治理的智能化水平、推動(dòng)了我國(guó)人工智能技術(shù)創(chuàng)新的戰(zhàn)略突破。作為人工智能產(chǎn)業(yè)落地的“先鋒軍”,智能語(yǔ)音產(chǎn)業(yè)得到了國(guó)家和地方政策的有力支持,且隨著參與者不斷進(jìn)入智能語(yǔ)音賽道,“百舸爭(zhēng)流,千帆競(jìng)發(fā)”,產(chǎn)業(yè)技術(shù)水平和產(chǎn)品競(jìng)爭(zhēng)力不斷提高。中國(guó)智能語(yǔ)音產(chǎn)業(yè)典型應(yīng)用場(chǎng)景及政策匯總(部分)發(fā)布日期相關(guān)機(jī)構(gòu)重點(diǎn)內(nèi)容2022-05國(guó)務(wù)院辦公廳強(qiáng)化科技賦能,進(jìn)一步加強(qiáng)12345平臺(tái)和網(wǎng)上12345能力建設(shè),開(kāi)發(fā)智能推薦、語(yǔ)音自動(dòng)轉(zhuǎn)寫(xiě)、自助派單功能協(xié)同辦公工業(yè)和信息化部批復(fù)組建國(guó)家智能語(yǔ)音創(chuàng)新中心,將圍繞多語(yǔ)種語(yǔ)音識(shí)別、語(yǔ)音合成2021-11工信部語(yǔ)義理解和專用人工智能語(yǔ)音芯片等研發(fā)方向,構(gòu)建集共性技術(shù)研發(fā)、測(cè)試驗(yàn)證、中試孵化和成果轉(zhuǎn)移轉(zhuǎn)化于一體的創(chuàng)新平臺(tái)提出加強(qiáng)自助下單、智能文本客服、智能語(yǔ)音等智能化應(yīng)用,方便企業(yè)和群眾反映訴智能客服2021-01國(guó)務(wù)院辦公廳求建議智能機(jī)器人2020-10工信部鼓勵(lì)智能家居產(chǎn)品普及語(yǔ)音控制功能,推動(dòng)基于智能語(yǔ)音識(shí)別技術(shù)的智能音箱、智能可穿戴設(shè)備及其他智能家電產(chǎn)品開(kāi)發(fā),老年人可通過(guò)語(yǔ)音方式實(shí)現(xiàn)便捷化操作2019-02最高人民法院全面提升語(yǔ)音識(shí)別技術(shù)在庭審語(yǔ)音同步轉(zhuǎn)錄中的應(yīng)用效能,建成全國(guó)法院智能語(yǔ)音云平臺(tái),實(shí)現(xiàn)全國(guó)法院語(yǔ)音識(shí)別的模型共享和統(tǒng)一管理傳媒制作2018-04國(guó)務(wù)院辦公廳開(kāi)展智能醫(yī)學(xué)影像識(shí)別、病理分型和多學(xué)科會(huì)診以及多種醫(yī)療健康場(chǎng)景下的智能語(yǔ)音技術(shù)應(yīng)用,提高醫(yī)療服務(wù)效率2017-07科技部公布了首批國(guó)家新一代人工智能開(kāi)放創(chuàng)新平臺(tái),包括自動(dòng)駕駛、城市大腦醫(yī)療影像和智能家居智能語(yǔ)音2017-07司法部大力發(fā)展電子公證、法律服務(wù)智能保障等業(yè)務(wù)模式,推進(jìn)人工智能語(yǔ)音熱線和社交網(wǎng)絡(luò)法律服務(wù)機(jī)器人技術(shù)研發(fā),促進(jìn)公共法律服務(wù)提檔來(lái)源:艾瑞研究院根據(jù)公開(kāi)資料自主研究繪制。?2022.12iResearchI5智能語(yǔ)音產(chǎn)業(yè)的市場(chǎng)規(guī)模2022年智能語(yǔ)音市場(chǎng)規(guī)模達(dá)215億元,產(chǎn)業(yè)規(guī)模持續(xù)走高近年來(lái),我國(guó)人工智能產(chǎn)業(yè)維持穩(wěn)步增長(zhǎng)態(tài)勢(shì);其中,智能語(yǔ)音產(chǎn)業(yè)基于語(yǔ)音識(shí)別等算法模型突破、優(yōu)質(zhì)數(shù)據(jù)集積累和豐富的下游應(yīng)用場(chǎng)景創(chuàng)新,已進(jìn)入規(guī)?;罡A段。我國(guó)頭部智能語(yǔ)音企業(yè)、大型互聯(lián)網(wǎng)企業(yè)等紛紛以“開(kāi)放平臺(tái)+垂直賽道”的發(fā)展模式,一方面通過(guò)語(yǔ)音開(kāi)放平臺(tái)為各行業(yè)開(kāi)發(fā)者提供智能語(yǔ)音技術(shù)支撐,協(xié)作場(chǎng)景與產(chǎn)品創(chuàng)新,助力產(chǎn)業(yè)規(guī)模增長(zhǎng);另一方面憑借各自在消費(fèi)硬件、協(xié)同辦公、視頻直播等領(lǐng)域的行業(yè)理解與用戶生態(tài),持續(xù)拓展智能車(chē)載、娛樂(lè)傳媒、協(xié)同辦公、智慧醫(yī)療、在線教育、智能家居等垂直行業(yè)賽道,以語(yǔ)音為信息的出入口,構(gòu)建泛語(yǔ)音產(chǎn)業(yè)生態(tài)集群。2022年中國(guó)智能語(yǔ)音產(chǎn)業(yè)規(guī)??蛇_(dá)215億元且維持較高增速,預(yù)計(jì)到2026年產(chǎn)業(yè)規(guī)??蛇_(dá)469億元。2019-2026年中國(guó)智能語(yǔ)音產(chǎn)業(yè)規(guī)模CAGR=16.9%41.6%45.9%35.2%26.5%21.7%19.6%18.4%469331396215272159109772019202020212022e2023e2024e2025e2026e智能語(yǔ)音產(chǎn)業(yè)規(guī)模(億元)智能語(yǔ)音產(chǎn)業(yè)增速(%)注釋:智能語(yǔ)音典型產(chǎn)品包括對(duì)話機(jī)器人、智能硬件中的AI語(yǔ)音助手以及教育、醫(yī)療、司法、公安、互聯(lián)網(wǎng)等垂直行業(yè)中的智能語(yǔ)音產(chǎn)品及應(yīng)用。來(lái)源:艾瑞咨詢研究院根據(jù)專家訪談,結(jié)合艾瑞統(tǒng)計(jì)模型自主研究繪制。?2022.12iResearchInc.

6智能語(yǔ)音產(chǎn)業(yè)的產(chǎn)品成熟度語(yǔ)音識(shí)別相關(guān)產(chǎn)品多已進(jìn)入穩(wěn)步上升期人類對(duì)機(jī)器語(yǔ)音識(shí)別的探索始于20世紀(jì)50年代,迄今已逾70年。2016年,在深度神經(jīng)網(wǎng)絡(luò)的幫助下,機(jī)器語(yǔ)音識(shí)別準(zhǔn)確率第一次達(dá)到人類水平,意味著智能語(yǔ)音技術(shù)落地期到來(lái)。后隨著近場(chǎng)語(yǔ)音識(shí)別準(zhǔn)確率提升、遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別和喚醒發(fā)展、全雙工語(yǔ)音交互出現(xiàn)、基于NLP的對(duì)話和問(wèn)答能力逐漸成熟、知識(shí)圖譜技術(shù)助力對(duì)話引擎以及針對(duì)實(shí)際應(yīng)用中的算法優(yōu)化,智能語(yǔ)音技術(shù)的落地可用性不斷突破。但其背后涉及的聲學(xué)研究、模式識(shí)別研究、通用NLP研究及垂直場(chǎng)景的深度語(yǔ)義理解等還未成熟到拼成一個(gè)沒(méi)有明顯短板的“木桶”。因此盡管部分智能語(yǔ)音產(chǎn)品如語(yǔ)音助手、語(yǔ)音轉(zhuǎn)寫(xiě)、智能客服等已取得了產(chǎn)品價(jià)值突破或商業(yè)上的顯著成就,但在細(xì)分產(chǎn)品的交互體驗(yàn)、使用效果、場(chǎng)景優(yōu)化等方面仍面臨長(zhǎng)期求索。人們面對(duì)“AI”時(shí)希望得到的自然、類人、甚至高信息密度的交互體驗(yàn),仍然是一個(gè)宏偉的開(kāi)放性課題。2022年中國(guó)智能語(yǔ)音產(chǎn)品成熟度曲線分布產(chǎn)品語(yǔ)音輸入法成語(yǔ)音識(shí)別語(yǔ)音轉(zhuǎn)寫(xiě)熟智能車(chē)載度智能語(yǔ)音開(kāi)發(fā)平臺(tái)智能消費(fèi)硬件表示智能語(yǔ)音相關(guān)技術(shù)的語(yǔ)音助手語(yǔ)音播報(bào)一階產(chǎn)品,可衍生出各細(xì)分領(lǐng)域的產(chǎn)品應(yīng)用。如智能客語(yǔ)音合成智能客服服+金融、基于語(yǔ)音助手的智能音箱等語(yǔ)音審核表示智能語(yǔ)音技術(shù)二階產(chǎn)聲紋識(shí)別品,如基于語(yǔ)音識(shí)別技術(shù)的自然語(yǔ)言處理語(yǔ)音芯片智能語(yǔ)音轉(zhuǎn)寫(xiě)產(chǎn)品、基于語(yǔ)生成式AI(音頻)音合成技術(shù)的語(yǔ)音播報(bào)等萌芽探索期落地實(shí)踐期飛躍發(fā)展期穩(wěn)步上升期生產(chǎn)成熟期階段技術(shù)落地初期階段,產(chǎn)品普及率提升,產(chǎn)品規(guī)?;瘧?yīng)用,成熟度趨于穩(wěn)定,成熟度穩(wěn)定階段。但產(chǎn)品成熟度較低成熟度曲線處于成熟度快速增長(zhǎng)產(chǎn)品及服務(wù)差異化技術(shù)若出現(xiàn)跨越性突緩慢爬坡期競(jìng)爭(zhēng)階段破,產(chǎn)品或回到飛躍來(lái)源:艾瑞咨詢研究院自主研究及繪制。發(fā)展階段?2022.12iResearchI7智能語(yǔ)音轉(zhuǎn)寫(xiě)的定義與分類語(yǔ)音識(shí)別產(chǎn)品的重要輸出形態(tài),分為實(shí)時(shí)與非實(shí)時(shí)語(yǔ)音轉(zhuǎn)寫(xiě)語(yǔ)音識(shí)別產(chǎn)品早期主要是語(yǔ)音聽(tīng)寫(xiě),即用戶說(shuō)一句、機(jī)器識(shí)別一句;后來(lái)發(fā)展成語(yǔ)音轉(zhuǎn)寫(xiě),更聚焦于人人交流場(chǎng)景。智能語(yǔ)音轉(zhuǎn)寫(xiě)是可以支持長(zhǎng)音視頻的語(yǔ)音轉(zhuǎn)文字服務(wù),分為實(shí)時(shí)語(yǔ)音轉(zhuǎn)寫(xiě)與非實(shí)時(shí)語(yǔ)音轉(zhuǎn)寫(xiě),可為信息處理和數(shù)據(jù)挖掘提供基礎(chǔ)。適用于線上線下會(huì)議記錄轉(zhuǎn)寫(xiě)、影視字幕制作、媒體新聞工作、會(huì)議翻譯等多個(gè)應(yīng)用情境。作為數(shù)字化勞動(dòng)力,解決剛需問(wèn)題,有效提高辦公效率。隨著語(yǔ)音識(shí)別準(zhǔn)確性及效率的提升、多語(yǔ)種與方言轉(zhuǎn)寫(xiě)服務(wù)豐富,以及上下文糾正、標(biāo)點(diǎn)過(guò)濾、語(yǔ)氣詞過(guò)濾、自定義熱詞配置、聲紋角色分離、語(yǔ)音內(nèi)容分析提取等智能化服務(wù)功能的逐步優(yōu)化,智能語(yǔ)音轉(zhuǎn)寫(xiě)服務(wù)的商業(yè)化落地與多場(chǎng)景復(fù)用持續(xù)推進(jìn),成為語(yǔ)音識(shí)別產(chǎn)品的“排頭兵”。智能語(yǔ)音轉(zhuǎn)寫(xiě)產(chǎn)品定義與分類語(yǔ)音作為智能交互中的一環(huán),進(jìn)行語(yǔ)音識(shí)別,讓機(jī)器“理解”人類說(shuō)的話語(yǔ),而非以識(shí)別為最終產(chǎn)品目的識(shí)別語(yǔ)音轉(zhuǎn)寫(xiě):支持長(zhǎng)音視頻的語(yǔ)音轉(zhuǎn)文字服務(wù),可為信息處理和數(shù)據(jù)挖掘提供基礎(chǔ)。01 實(shí)時(shí)語(yǔ)音轉(zhuǎn)寫(xiě)

02 非實(shí)時(shí)語(yǔ)音轉(zhuǎn)寫(xiě)實(shí)時(shí)語(yǔ)音轉(zhuǎn)寫(xiě)(流式上傳-同步獲?。簩?shí)時(shí)語(yǔ)音轉(zhuǎn)寫(xiě)可將不限時(shí)長(zhǎng)的音頻流實(shí)時(shí)識(shí)別為文字,并返回帶有時(shí)間戳的文字流;可用于直播實(shí)時(shí)字幕、實(shí)時(shí)會(huì)議記錄;也可配合機(jī)器翻譯,實(shí)現(xiàn)同傳功能。

非實(shí)時(shí)語(yǔ)音轉(zhuǎn)寫(xiě)(已錄制音頻文件上傳-異步獲?。悍菍?shí)時(shí)語(yǔ)音轉(zhuǎn)寫(xiě)將長(zhǎng)段音頻數(shù)據(jù)轉(zhuǎn)換成文本數(shù)據(jù)??捎糜谟耙曌帜恢谱?、會(huì)議訪談?dòng)涗涋D(zhuǎn)寫(xiě)、智能客服錄音質(zhì)檢等場(chǎng)景。來(lái)源:艾瑞咨詢研究院自主研究及繪制。?2022.12iResearchInc.

8語(yǔ)音識(shí)別系統(tǒng)技術(shù)架構(gòu)實(shí)現(xiàn)對(duì)聲音波形序列的識(shí)別,得到相應(yīng)的單詞或者字符序列智能語(yǔ)音轉(zhuǎn)寫(xiě)產(chǎn)品的核心是語(yǔ)音識(shí)別系統(tǒng),需實(shí)現(xiàn)對(duì)給定的聲音波形序列的識(shí)別,得到相應(yīng)的單詞或者字符序列。語(yǔ)音識(shí)別系統(tǒng)由信號(hào)處理和特征提取、聲學(xué)模型(AcousticModel,AM)、語(yǔ)言模型(LanguageModel,LM)和解碼搜索共四部分組成。識(shí)別過(guò)程首先對(duì)音頻流進(jìn)行處理,通過(guò)消除噪聲和信道失真對(duì)語(yǔ)音進(jìn)行增強(qiáng),然后分割聲音片段并轉(zhuǎn)換成一系列數(shù)值,通過(guò)聲學(xué)模型識(shí)別數(shù)值,最終利用語(yǔ)言模型解碼搜索匹配得到最優(yōu)的詞序列作為識(shí)別結(jié)果輸出。聲學(xué)模型和語(yǔ)言模型的獲得需對(duì)預(yù)先收集好的海量語(yǔ)音、語(yǔ)言數(shù)據(jù)庫(kù)進(jìn)行信號(hào)處理和知識(shí)挖掘訓(xùn)練。解碼過(guò)程中還存在一個(gè)“自適應(yīng)”反饋模塊,可對(duì)用戶的語(yǔ)音進(jìn)行自學(xué)習(xí),從而對(duì)模型進(jìn)行校正,進(jìn)一步提高識(shí)別準(zhǔn)確率。智能語(yǔ)音轉(zhuǎn)寫(xiě)產(chǎn)品核心——語(yǔ)音識(shí)別系統(tǒng)的技術(shù)結(jié)構(gòu)Step1信號(hào)處理和特征提取:以音頻模擬信號(hào)輸入,將其轉(zhuǎn)為數(shù)字信號(hào),提取聲音特征,供聲學(xué)模型提取合適有代表性的特征向量。

音頻信號(hào)識(shí)別結(jié)果信號(hào)處理和特征提取 解碼搜索聲音特征 聲學(xué)模型得分 語(yǔ)言模型得分

Step3解碼搜索:對(duì)給定的特征向量序列和若干假設(shè)詞序列計(jì)算聲學(xué)模型分?jǐn)?shù)和語(yǔ)言模型分?jǐn)?shù),將總體輸出分?jǐn)?shù)最高的詞序列作為識(shí)別結(jié)果。Step2聲學(xué)模型語(yǔ)言模型聲學(xué)模型將聲學(xué)和發(fā)音學(xué)(Phonetics)的知語(yǔ)言模型通過(guò)訓(xùn)練語(yǔ)料/數(shù)據(jù)(通常是文本形式)識(shí)進(jìn)行整合,以特征提取部分生成的特征為輸學(xué)習(xí)詞之間的相互關(guān)系,來(lái)估計(jì)假設(shè)詞序列的可能入,并為可變長(zhǎng)特征序列生成聲學(xué)模型分?jǐn)?shù)。性,找出該聲音特征最有可能對(duì)應(yīng)的文字序列。來(lái)源:艾瑞根據(jù)CSDN等公開(kāi)資料整理研究繪制。?2022.12iResearchInc.

0.850.950.700.85聲學(xué)dakaikongtiao模型0.850.950.200.15dakaizhaoming語(yǔ)言打開(kāi)空調(diào)0.95大凱空調(diào)0.70模型大楷空條0.35 9語(yǔ)音識(shí)別技術(shù)發(fā)展歷程聲學(xué)模型突破引領(lǐng)技術(shù)商業(yè)落地進(jìn)程從最初的基于孤立詞的小詞匯量語(yǔ)音識(shí)別系統(tǒng),到目前的基于大詞匯量的連續(xù)語(yǔ)音識(shí)別系統(tǒng),語(yǔ)音識(shí)別技術(shù)取得了顯著的進(jìn)展。語(yǔ)言模型主要基于傳統(tǒng)的N-Gram方法(一種基于統(tǒng)計(jì)語(yǔ)言模型的算法)進(jìn)行統(tǒng)計(jì)匹配。雖然目前也有深度神經(jīng)網(wǎng)絡(luò)的語(yǔ)言模型的研究,但在實(shí)用中主要還是更多用于后處理糾錯(cuò)。或加入NLPEmbedding模型,聯(lián)系上下文,以提升語(yǔ)音識(shí)別結(jié)果準(zhǔn)確率。而縱觀其技術(shù)落地的突破路徑,對(duì)于聲音模型的研究?jī)?yōu)化是實(shí)現(xiàn)產(chǎn)品性能提升的主旋律。聲學(xué)模型是語(yǔ)音識(shí)別系統(tǒng)的重要組成部分,占據(jù)著大部分的計(jì)算資源并決定著語(yǔ)音識(shí)別系統(tǒng)的性能。2009年隨著深度學(xué)習(xí)技術(shù)發(fā)展,基于DNN-HMM的語(yǔ)音聲學(xué)模型成為主流,語(yǔ)音識(shí)別因此取得了突破性進(jìn)展;此后,不同的網(wǎng)絡(luò)結(jié)構(gòu)組合以及優(yōu)化策略極大提升了聲學(xué)模型的性能,如端到端的識(shí)別模型、粗粒度的建模單元、更復(fù)雜的深度神經(jīng)網(wǎng)絡(luò)等。語(yǔ)音識(shí)別技術(shù)中聲學(xué)模型的突破路徑u深度神經(jīng)網(wǎng)絡(luò)方法主導(dǎo)u概率統(tǒng)計(jì)方法主導(dǎo)2006年:深度學(xué)習(xí)進(jìn)入發(fā)展元年。2019年,Hinton將DNN應(yīng)用于語(yǔ)音的聲學(xué)建模;2011年底,微軟研究院將DNN技術(shù)應(yīng)用在了大詞匯量u模板匹配方法主導(dǎo)概率統(tǒng)計(jì)識(shí)別:隱馬爾可夫模型連續(xù)語(yǔ)音識(shí)別任務(wù)上,大大降低了語(yǔ)音識(shí)別錯(cuò)誤率。從此語(yǔ)音識(shí)別進(jìn)入(HMM)和高斯混合模型DNN-HMM時(shí)代。此外LSTM(遞歸神經(jīng)網(wǎng)絡(luò)模型)具有長(zhǎng)短時(shí)記憶模板匹配識(shí)別:提取語(yǔ)音信號(hào)的特(DMM)。GMM-HMM框架中,能力,整體性能比DNN有相對(duì)20%左右穩(wěn)定提升征構(gòu)建參數(shù)模板,將測(cè)試語(yǔ)音與參GMM用于對(duì)語(yǔ)音聲學(xué)特征的分布進(jìn)2015-2017:基于端到端識(shí)別模型可去除HMM,直接從聲學(xué)特征輸入考模板參數(shù)進(jìn)行比較匹配,取距離行建模,HMM則用于對(duì)語(yǔ)音信號(hào)的就可以得到識(shí)別的詞序列,進(jìn)一步提升語(yǔ)音識(shí)別準(zhǔn)確率及解碼速度。最近的樣本所對(duì)應(yīng)的詞標(biāo)注為該語(yǔ)時(shí)序性進(jìn)行建模。自上世紀(jì)90年代2017年以后:隨著各種深度神經(jīng)網(wǎng)絡(luò)以及端到端技術(shù)的興起,業(yè)界廠音信號(hào)的發(fā)音。該方法可有效解決語(yǔ)音識(shí)別聲學(xué)模型的區(qū)分性訓(xùn)練準(zhǔn)則商紛紛發(fā)布及持續(xù)優(yōu)化各自聲學(xué)模型結(jié)構(gòu)。語(yǔ)音識(shí)別準(zhǔn)確率持續(xù)提升。孤立詞識(shí)別,但難以實(shí)現(xiàn)大詞匯量、和模型自適應(yīng)方法被提出以后,語(yǔ)音以科大訊飛為例,2010年中英文識(shí)別準(zhǔn)確率只有60%左右,而在2021非特定人連續(xù)語(yǔ)音識(shí)別。識(shí)別進(jìn)入緩慢發(fā)展期。年8月,科大訊飛廠商的中英文轉(zhuǎn)寫(xiě)準(zhǔn)確率已突破98.33%。~1970s1970s~20062006~至今來(lái)源:艾瑞研究院根據(jù)公開(kāi)資料自主研究繪制。?2022.12iResearchI10智能語(yǔ)音轉(zhuǎn)寫(xiě)的需求場(chǎng)景以轉(zhuǎn)寫(xiě)功能為基礎(chǔ),滿足細(xì)分場(chǎng)景需求,構(gòu)成豐富產(chǎn)品形態(tài)自從以遠(yuǎn)場(chǎng)語(yǔ)音技術(shù)落地為代表的智能音箱產(chǎn)品規(guī)?;瘧?yīng)用、深度神經(jīng)網(wǎng)絡(luò)下的聲學(xué)模型研發(fā)創(chuàng)新進(jìn)入平穩(wěn)發(fā)展期后,語(yǔ)音識(shí)別賽道的產(chǎn)業(yè)競(jìng)爭(zhēng)已經(jīng)從標(biāo)準(zhǔn)環(huán)境下的算法研發(fā)比拼,過(guò)渡到了在真實(shí)細(xì)分需求場(chǎng)景下如何滿足用戶體驗(yàn)的競(jìng)爭(zhēng)。智能語(yǔ)音轉(zhuǎn)寫(xiě)產(chǎn)品也遵循這一賽道特征,以語(yǔ)音轉(zhuǎn)文字功能為基礎(chǔ),附加產(chǎn)品服務(wù)、多語(yǔ)種翻譯、內(nèi)容分析等智能化服務(wù)功能,滿足用戶在會(huì)議、庭審、采訪、直播、視頻制作、客服質(zhì)檢等場(chǎng)景中的實(shí)時(shí)與非實(shí)時(shí)語(yǔ)音轉(zhuǎn)寫(xiě)需求。智能語(yǔ)音轉(zhuǎn)寫(xiě)產(chǎn)品具備豐富的產(chǎn)品形態(tài),可應(yīng)用于娛樂(lè)傳媒、在線教育、會(huì)議會(huì)展、同傳等多行業(yè)領(lǐng)域,幫助提升企事業(yè)單位辦公人群、學(xué)生、自媒體從業(yè)人員、翻譯專業(yè)人士等各類群體的工作效率。智能語(yǔ)音轉(zhuǎn)寫(xiě)產(chǎn)品的需求場(chǎng)景

? 對(duì)響應(yīng)時(shí)間要求更高,需進(jìn)行模型蒸餾與模產(chǎn)品服務(wù)轉(zhuǎn)寫(xiě)功能內(nèi)容分析

提供會(huì)議記錄及會(huì)后整理,可附加會(huì)議軟件等產(chǎn)品功能提供字幕轉(zhuǎn)寫(xiě)服務(wù),可附加音視頻編輯相關(guān)產(chǎn)品功能提供語(yǔ)音轉(zhuǎn)寫(xiě)服務(wù),在多語(yǔ)種環(huán)語(yǔ)種境下,附加實(shí)時(shí)/非實(shí)時(shí)翻譯功能翻譯?提供人機(jī)耦合服務(wù),譯員配合智能轉(zhuǎn)寫(xiě)內(nèi)容優(yōu)化最終產(chǎn)出提供語(yǔ)音轉(zhuǎn)寫(xiě)服務(wù),對(duì)轉(zhuǎn)寫(xiě)文本進(jìn)行內(nèi)容追蹤、實(shí)時(shí)提醒、處理分析、風(fēng)控質(zhì)檢等等操作

實(shí)時(shí)場(chǎng)景非實(shí)時(shí)場(chǎng)景

型優(yōu)化實(shí)時(shí)會(huì)議記錄實(shí)時(shí)直播字幕實(shí)時(shí)庭審記錄實(shí)時(shí)客服記錄實(shí)時(shí)采訪轉(zhuǎn)寫(xiě)實(shí)時(shí)會(huì)議同傳?對(duì)響應(yīng)時(shí)間要求相對(duì)較低,可通過(guò)閑時(shí)轉(zhuǎn)寫(xiě)實(shí)現(xiàn)需求錯(cuò)峰會(huì)議紀(jì)要總結(jié)音視頻字幕編輯庭審數(shù)據(jù)錄入黃暴等語(yǔ)音質(zhì)檢課堂錄音分析電話銷售/客服來(lái)源:艾瑞研究院根據(jù)公開(kāi)資料自主研究繪制。?2022.12iResearchInc.

11智能語(yǔ)音轉(zhuǎn)寫(xiě)的價(jià)值意義存量助力人工轉(zhuǎn)寫(xiě)市場(chǎng),增量釋放更多潛在場(chǎng)景需求傳統(tǒng)人力轉(zhuǎn)寫(xiě)市場(chǎng)依賴經(jīng)驗(yàn)豐富的速錄師與人工轉(zhuǎn)寫(xiě)團(tuán)隊(duì),成本相對(duì)高昂,而隨著智能語(yǔ)音轉(zhuǎn)寫(xiě)產(chǎn)品的規(guī)?;涞貞?yīng)用,該類存量市場(chǎng)可借助智能轉(zhuǎn)寫(xiě)產(chǎn)品,實(shí)現(xiàn)對(duì)人工轉(zhuǎn)寫(xiě)的有效輔助及優(yōu)化,為下游客戶提供更高質(zhì)效的人機(jī)耦合服務(wù);此外,轉(zhuǎn)寫(xiě)應(yīng)用仍有更大規(guī)模的潛在市場(chǎng)需求待挖掘,原受限于渠道、價(jià)格等因素,轉(zhuǎn)寫(xiě)產(chǎn)品多應(yīng)用于有垂類轉(zhuǎn)寫(xiě)需求的小眾應(yīng)用領(lǐng)域,而智能語(yǔ)音轉(zhuǎn)寫(xiě)產(chǎn)品逐步讓轉(zhuǎn)寫(xiě)應(yīng)用實(shí)現(xiàn)泛化,市場(chǎng)邊界也將逐步擴(kuò)散,未來(lái)智能語(yǔ)音轉(zhuǎn)寫(xiě)產(chǎn)品有望開(kāi)發(fā)更多潛在增量市場(chǎng),撬動(dòng)可用智能轉(zhuǎn)寫(xiě)產(chǎn)品滿足的長(zhǎng)尾需求,進(jìn)一步優(yōu)化用戶的應(yīng)用體驗(yàn)。智能語(yǔ)音轉(zhuǎn)寫(xiě)產(chǎn)品意義智能語(yǔ)音轉(zhuǎn)寫(xiě)產(chǎn)品在助力轉(zhuǎn)寫(xiě)人力基礎(chǔ)上,可滿足更多潛在、可被優(yōu)化的轉(zhuǎn)寫(xiě)場(chǎng)景需求。增量市場(chǎng)存量市場(chǎng)來(lái)源:艾瑞研究院根據(jù)公開(kāi)材料自主研究繪制。?2022.12iResearchInc.

2)滿足更多潛在可被優(yōu)化需求本身場(chǎng)景存在潛在轉(zhuǎn)寫(xiě)需求,但人力實(shí)現(xiàn)需要高成本或原本人力難以做到,而智能轉(zhuǎn)寫(xiě)產(chǎn)品可開(kāi)發(fā)該類潛在增量市場(chǎng),釋放更多產(chǎn)值規(guī)模。1)優(yōu)化傳統(tǒng)轉(zhuǎn)寫(xiě)人力服務(wù)傳統(tǒng)人工轉(zhuǎn)寫(xiě)費(fèi)時(shí)費(fèi)力,且轉(zhuǎn)寫(xiě)質(zhì)量與個(gè)人能力高度掛鉤,可借力智能轉(zhuǎn)寫(xiě)產(chǎn)品提高存量市場(chǎng)的轉(zhuǎn)寫(xiě)服務(wù)滲透率。

通過(guò)智能語(yǔ)音轉(zhuǎn)寫(xiě)產(chǎn)品撬動(dòng)更多長(zhǎng)尾需求例:個(gè)人辦公場(chǎng)景,有會(huì)議內(nèi)容的潛在轉(zhuǎn)寫(xiě)需求,出于時(shí)長(zhǎng)與精力考量不會(huì)自做,出于成本考量不會(huì)外購(gòu),但可通過(guò)智能語(yǔ)音轉(zhuǎn)寫(xiě)產(chǎn)品獲得優(yōu)質(zhì)高效、兼具性價(jià)比的轉(zhuǎn)寫(xiě)服務(wù)。例:溝通交流場(chǎng)景,在多語(yǔ)種、方言溝通的日常交流環(huán)境中,存在潛在語(yǔ)音轉(zhuǎn)寫(xiě)需求,可通過(guò)轉(zhuǎn)寫(xiě)產(chǎn)品跨越語(yǔ)言障礙,實(shí)現(xiàn)高效溝通。 12智能語(yǔ)音轉(zhuǎn)寫(xiě)行業(yè)——發(fā)展背景篇 1智能語(yǔ)音轉(zhuǎn)寫(xiě)行業(yè)——市場(chǎng)分析篇 2智能語(yǔ)音轉(zhuǎn)寫(xiě)行業(yè)典型企業(yè)案例 3智能語(yǔ)音轉(zhuǎn)寫(xiě)行業(yè)——發(fā)展趨勢(shì)篇 413智能語(yǔ)音轉(zhuǎn)寫(xiě)產(chǎn)業(yè)圖譜2022年中國(guó)智能語(yǔ)音轉(zhuǎn)寫(xiě)產(chǎn)業(yè)圖譜上游基礎(chǔ)設(shè)施層產(chǎn)品及解決方案提供商下游應(yīng)用領(lǐng)域服務(wù)器智能語(yǔ)音企業(yè)辦公場(chǎng)景電商直播云服務(wù)傳媒場(chǎng)景翻譯場(chǎng)景云服務(wù)廠商數(shù)據(jù)服務(wù)其他場(chǎng)景……專業(yè)轉(zhuǎn)寫(xiě)/開(kāi)源模型翻譯廠商C端用戶B端企業(yè)G端政府來(lái)源:艾瑞根據(jù)公開(kāi)資料自主研究繪制。?2022.12iResearchI14智能語(yǔ)音轉(zhuǎn)寫(xiě)的發(fā)展驅(qū)力(1/5)智能語(yǔ)音轉(zhuǎn)寫(xiě)可化解人工成本走高與質(zhì)量要求提升的發(fā)展矛盾近十年來(lái),中國(guó)人口增勢(shì)放緩,勞動(dòng)人口紅利見(jiàn)頂,供應(yīng)結(jié)構(gòu)性短缺致使企業(yè)人力用工成本不斷攀升。根據(jù)國(guó)家統(tǒng)計(jì)局?jǐn)?shù)據(jù),2020年中國(guó)租賃和商務(wù)服務(wù)業(yè)城鎮(zhèn)單位就業(yè)人員平均工資已達(dá)到92924元,相比十年前漲幅已達(dá)到1.35倍。人工轉(zhuǎn)寫(xiě)成本的大幅上漲為轉(zhuǎn)寫(xiě)行業(yè)帶來(lái)更多價(jià)格壓力。此外,隨著轉(zhuǎn)寫(xiě)場(chǎng)景的泛化升級(jí),轉(zhuǎn)寫(xiě)需求滲透到各行各業(yè),轉(zhuǎn)寫(xiě)內(nèi)容專業(yè)度也不斷提升,具備行業(yè)背景知識(shí)的轉(zhuǎn)寫(xiě)譯員更成為市場(chǎng)供給側(cè)的稀缺人力資源,且轉(zhuǎn)寫(xiě)交付水平存在不穩(wěn)定性,與個(gè)人服務(wù)能力高度掛鉤。在此發(fā)展背景下,轉(zhuǎn)寫(xiě)市場(chǎng)亟需智能語(yǔ)音轉(zhuǎn)寫(xiě)產(chǎn)品,以輔助優(yōu)化人工轉(zhuǎn)寫(xiě)產(chǎn)品的角度切入,提供低成本、高質(zhì)量、具備穩(wěn)定交付水平的轉(zhuǎn)寫(xiě)服務(wù),滿足更多市場(chǎng)需求缺口。2010-2020年中國(guó)租賃和商務(wù)服務(wù)業(yè)城鎮(zhèn)單位就業(yè)人員平均工資情況18.7%13.2%17.6%7.3%8.0%5.9%6.0%4.6%3.6%5.4%813938514788190929246713172489767826253846976531623956620102011201220132014201520162017201820192020租賃和商務(wù)服務(wù)業(yè)城鎮(zhèn)單位就業(yè)人員平均工資(元)平均工資增長(zhǎng)率(%)來(lái)源:國(guó)家統(tǒng)計(jì)局,艾瑞研究院自主研究繪制。?2022.12iResearchI15智能語(yǔ)音轉(zhuǎn)寫(xiě)的發(fā)展驅(qū)力(2/5)企業(yè)協(xié)同在線辦公常態(tài)化,助力轉(zhuǎn)寫(xiě)功能實(shí)現(xiàn)更多用戶觸達(dá)2020年初,受疫情影響,很多企業(yè)無(wú)法按時(shí)復(fù)工復(fù)產(chǎn),遠(yuǎn)程辦公成為維持社會(huì)經(jīng)濟(jì)正常運(yùn)行的重要平臺(tái)應(yīng)用,用戶需求顯著提升,視頻會(huì)議、電話會(huì)議、在線文檔編輯等遠(yuǎn)程協(xié)作功能得到更廣泛應(yīng)用。根據(jù)中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展統(tǒng)計(jì)報(bào)告數(shù)據(jù),2022年月中國(guó)在線辦公用戶規(guī)模已躍升至4.7億,相比2020年6月增長(zhǎng)幅度高達(dá)131.4%。如今疫情仍在延宕反復(fù),隨著用戶在線協(xié)同辦公習(xí)慣的逐漸養(yǎng)成,遠(yuǎn)程協(xié)同辦公或?qū)⒊蔀槌B(tài)化運(yùn)營(yíng)工具,持續(xù)推動(dòng)企業(yè)數(shù)字化轉(zhuǎn)型。而相較于硬件錄音與錄音應(yīng)用的產(chǎn)品形式,會(huì)議應(yīng)用無(wú)需用戶購(gòu)買(mǎi)錄音設(shè)備或額外開(kāi)啟錄音應(yīng)用即可觸達(dá)轉(zhuǎn)寫(xiě)服務(wù),提供了更直接的應(yīng)用切入點(diǎn),助力轉(zhuǎn)寫(xiě)功能在辦公場(chǎng)景實(shí)現(xiàn)更廣泛的用戶觸達(dá)。2018年6月-2022年6月中國(guó)在線辦公用戶規(guī)模及使用率45.4% 43.8%37.7%34.9%21.2%4.62.02020.62020.122021.62021.122022.6用戶規(guī)模(億人)使用率(%)來(lái)源:中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展統(tǒng)計(jì)報(bào)告,艾瑞研究院自主研究繪制。?2022.12iResearchI

辦公場(chǎng)景對(duì)智能轉(zhuǎn)寫(xiě)產(chǎn)品的需求分析相較傳統(tǒng)需要錄音筆與錄音應(yīng)用的場(chǎng)景,協(xié)同在線辦公平臺(tái)及會(huì)議應(yīng)用讓轉(zhuǎn)寫(xiě)功能觸達(dá)到更多辦公人群,應(yīng)用滲透率進(jìn)一步提升。硬件錄音e.g.錄音筆ü需要硬件設(shè)備轉(zhuǎn)專業(yè)辦公人士,高頻錄音場(chǎng)景,對(duì)會(huì)議轉(zhuǎn)寫(xiě)有強(qiáng)需求,需要額外硬件設(shè)備提供在線/離線轉(zhuǎn)寫(xiě)服務(wù)。寫(xiě)產(chǎn)錄音應(yīng)用e.g.語(yǔ)音備忘錄ü需要額外錄音品通過(guò)手機(jī)或電腦的錄音軟件錄音,隨后將錄音文辦公件上傳至平臺(tái)或APP,完成錄音文件轉(zhuǎn)寫(xiě)。場(chǎng)會(huì)議應(yīng)用e.g.騰訊會(huì)議、訊飛聽(tīng)見(jiàn)ü搭載辦公景會(huì)議平臺(tái)會(huì)議APP提供遠(yuǎn)程會(huì)議平臺(tái),通過(guò)會(huì)議APP錄制音視頻,為轉(zhuǎn)寫(xiě)產(chǎn)品提供直接功能切入點(diǎn)。來(lái)源:艾瑞研究院自主研究繪制。?2022.12iResearchI16智能語(yǔ)音轉(zhuǎn)寫(xiě)的發(fā)展驅(qū)力(3/5)網(wǎng)絡(luò)視頻興起,為轉(zhuǎn)寫(xiě)產(chǎn)品開(kāi)拓更多應(yīng)用空間隨著數(shù)字技術(shù)與互聯(lián)網(wǎng)技術(shù)的普及,網(wǎng)絡(luò)視頻快速發(fā)展,短視頻因滿足用戶高漲的碎片化娛樂(lè)需求而迎來(lái)一撥爆發(fā)式增長(zhǎng),進(jìn)一步提升用戶對(duì)整體網(wǎng)絡(luò)視頻領(lǐng)域的關(guān)注度與滲透率。如今網(wǎng)絡(luò)視頻已然成為人們生活?yuàn)蕵?lè)、了解信息的重要組成形式。根據(jù)中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展統(tǒng)計(jì)報(bào)告數(shù)據(jù),2022年6月,中國(guó)網(wǎng)絡(luò)視頻用戶規(guī)模已經(jīng)達(dá)到9.9億人,占全部網(wǎng)民的94.6%。作為網(wǎng)絡(luò)視頻的供給方,自媒體工作者、長(zhǎng)視頻內(nèi)容編輯方均對(duì)視頻內(nèi)容的字幕轉(zhuǎn)寫(xiě)具備強(qiáng)需求,一方面字幕可幫助用戶更好觀看視頻內(nèi)容,并在靜音模式也不影響觀看;另一方面字幕轉(zhuǎn)寫(xiě)還可提供翻譯功能,助力網(wǎng)絡(luò)視頻在國(guó)際環(huán)境下的推動(dòng)傳播;此外,對(duì)于平臺(tái)監(jiān)管方來(lái)說(shuō),語(yǔ)音轉(zhuǎn)寫(xiě)可服務(wù)于平臺(tái)內(nèi)容監(jiān)控需求,及時(shí)進(jìn)行內(nèi)容管理,避免網(wǎng)絡(luò)直播及視頻帶來(lái)的合規(guī)風(fēng)險(xiǎn)。綜合來(lái)看,網(wǎng)絡(luò)視頻的長(zhǎng)足發(fā)展為轉(zhuǎn)寫(xiě)產(chǎn)品開(kāi)拓了更多市場(chǎng)應(yīng)用空間。2018年6月-2022年6月中國(guó)網(wǎng)絡(luò)視頻(含短視頻)用戶規(guī)模及使用率94.1%94.5%93.7%93.4%94.5%94.6%88.7%87.5%88.8%..2.6201820182019202020202020202120212022用戶規(guī)模(億人)使用率(%)來(lái)源:中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展統(tǒng)計(jì)報(bào)告,艾瑞研究院自主研究繪制。?2022.12iResearchI

網(wǎng)絡(luò)視頻對(duì)智能轉(zhuǎn)寫(xiě)產(chǎn)品的需求分析自媒體長(zhǎng)視頻編輯服務(wù)于內(nèi)容生產(chǎn)用戶,智能服務(wù)于長(zhǎng)視頻編輯工作者,切分時(shí)間軸。生成帶時(shí)間戳例如電影、紀(jì)錄片等,長(zhǎng)視的轉(zhuǎn)寫(xiě)字幕內(nèi)容,支持在線頻的語(yǔ)音轉(zhuǎn)寫(xiě)更強(qiáng)調(diào)上下文編輯調(diào)整,極大提升自媒體聯(lián)系及方言理解,對(duì)語(yǔ)音技工作者的字幕配置效率。術(shù)提出更高要求。多語(yǔ)種轉(zhuǎn)寫(xiě)語(yǔ)音內(nèi)容監(jiān)控為外語(yǔ)視頻提供轉(zhuǎn)寫(xiě)及翻實(shí)時(shí)轉(zhuǎn)寫(xiě)可實(shí)時(shí)識(shí)別直播譯服務(wù),可根據(jù)需要配置內(nèi)容風(fēng)險(xiǎn),并給出及時(shí)警專業(yè)翻譯團(tuán)隊(duì),實(shí)現(xiàn)高效告提示;非實(shí)時(shí)轉(zhuǎn)寫(xiě)可對(duì)人機(jī)耦合,完成多語(yǔ)種的平臺(tái)內(nèi)容進(jìn)行進(jìn)一步甄別字幕制作及翻譯需求。提示。來(lái)源:中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展統(tǒng)計(jì)報(bào)告,艾瑞研究院自主研究繪制。?2022.12iResearchI17智能語(yǔ)音轉(zhuǎn)寫(xiě)的市場(chǎng)環(huán)境(4/5)會(huì)展雙線融合舉辦不斷提升,SaaS轉(zhuǎn)寫(xiě)產(chǎn)品需求走高在2020年以前,會(huì)展行業(yè)多在線下舉行。面對(duì)國(guó)際語(yǔ)言的交流環(huán)境,會(huì)展行業(yè)的字幕轉(zhuǎn)寫(xiě)產(chǎn)品大多采用線下人機(jī)耦合的服務(wù)模式,即專業(yè)的語(yǔ)音轉(zhuǎn)寫(xiě)服務(wù)團(tuán)隊(duì)與硬件機(jī)器設(shè)備相結(jié)合,為會(huì)展交流提供字幕上屏、多語(yǔ)種同傳等的現(xiàn)場(chǎng)會(huì)議服務(wù)。而在疫情多點(diǎn)散發(fā)的情況下,會(huì)展活動(dòng)的舉辦面臨很多不確定性因素。根據(jù)中國(guó)會(huì)展主辦機(jī)構(gòu)數(shù)字化調(diào)研報(bào)告顯示,2021年,疫情導(dǎo)致各類會(huì)展活動(dòng)取消、延期、異地舉辦,會(huì)展活動(dòng)選擇線上線下相結(jié)合模式舉辦成為常態(tài)。字幕轉(zhuǎn)寫(xiě)產(chǎn)品形態(tài)也由原來(lái)線下的人機(jī)耦合形式逐漸傾向于線上SaaS服務(wù)形式,并可配合線上人工智能服務(wù)團(tuán)隊(duì)或翻譯團(tuán)隊(duì)提供實(shí)時(shí)校驗(yàn)服務(wù)。此外,SaaS產(chǎn)品形態(tài)的需求延伸進(jìn)一步豐富轉(zhuǎn)寫(xiě)產(chǎn)品的客群覆蓋度,除會(huì)展舉辦方外,更多C端用戶也可通過(guò)SaaS轉(zhuǎn)寫(xiě)及翻譯產(chǎn)品滿足個(gè)人國(guó)際參會(huì)、實(shí)時(shí)翻譯的會(huì)展需求。2021年中國(guó)會(huì)展主辦機(jī)構(gòu)調(diào)研主要數(shù)據(jù)u數(shù)字化轉(zhuǎn)型態(tài)度u數(shù)字化轉(zhuǎn)型方向超過(guò)90%的機(jī)構(gòu)對(duì)數(shù)字化31.3%的機(jī)構(gòu)認(rèn)為數(shù)字化轉(zhuǎn)型呈積極與樂(lè)觀態(tài)度,轉(zhuǎn)型是大方向,超過(guò)50%該比例相較于2020年提升的機(jī)構(gòu)已經(jīng)開(kāi)始數(shù)字化轉(zhuǎn)6個(gè)百分點(diǎn)。型嘗試。u數(shù)字化收入占比u雙線融合辦展趨勢(shì)根據(jù)調(diào)研顯示,超過(guò)60%根據(jù)調(diào)研顯示,近70%的的會(huì)展機(jī)構(gòu)能獲得各位數(shù)主辦機(jī)構(gòu)選擇雙線融合辦字化收入。但數(shù)字化收入展的方式,線上線下結(jié)合占比有待提升。已成為會(huì)展常態(tài)。注釋:N=195。來(lái)源:《DRCEO:中國(guó)會(huì)展主辦機(jī)構(gòu)數(shù)字化調(diào)研2022》,艾瑞咨詢研究院整理及繪制。?2022.12iResearchInc.

2021年中國(guó)會(huì)展主辦機(jī)構(gòu)辦展辦會(huì)方式線上會(huì)展成為線下舉辦的延伸助力,線上+線下呈現(xiàn)深度融合的發(fā)展趨勢(shì)101738361495027331420222113108純線下舉辦純線上舉辦線上+線下相結(jié)合舉辦1-3場(chǎng)(個(gè))4-5場(chǎng)(個(gè))6-10場(chǎng)(個(gè))10場(chǎng)以上(個(gè))以上均沒(méi)有舉辦(個(gè))注釋:N=195。來(lái)源:《DRCEO:中國(guó)會(huì)展主辦機(jī)構(gòu)數(shù)字化調(diào)研2022》,艾瑞咨詢研究院整理及繪制。?2022.12iResearchInc. 18智能語(yǔ)音轉(zhuǎn)寫(xiě)的市場(chǎng)環(huán)境(5/5)轉(zhuǎn)寫(xiě)產(chǎn)品助力解決出海生態(tài)下的復(fù)合型翻譯人才需求近年來(lái)雖然新冠疫情反復(fù)、地緣沖突加劇,全球經(jīng)濟(jì)發(fā)展變數(shù)頻發(fā),但中國(guó)企業(yè)出海浪潮已逐漸越過(guò)探索期,在視頻、游戲、電商、企業(yè)級(jí)SaaS服務(wù)等各領(lǐng)域催生出“出海繁榮”。2021年,中國(guó)對(duì)外直接投資凈額1788.2億美元,比上年增長(zhǎng)16.3%,連續(xù)十年位列全球前三,且超越出現(xiàn)統(tǒng)計(jì)數(shù)據(jù)以來(lái)首次負(fù)增長(zhǎng)的2017年絕對(duì)值。目前,由于海外市場(chǎng)仍處于高速增長(zhǎng)階段且出海市場(chǎng)各賽道集中度不高,我國(guó)出海行業(yè)仍具有極大潛力,在企業(yè)業(yè)務(wù)運(yùn)營(yíng)、跨國(guó)交流等領(lǐng)域?qū)?fù)合型翻譯人才需求較大。根據(jù)中國(guó)翻譯協(xié)會(huì)調(diào)研,高級(jí)翻譯人才稀缺、非通用語(yǔ)種人才匱乏、高校教育與實(shí)際工作需求脫節(jié)、無(wú)法滿足多個(gè)專業(yè)領(lǐng)域翻譯需求是翻譯行業(yè)面臨的發(fā)展難點(diǎn)。在此背景下,智能語(yǔ)音轉(zhuǎn)寫(xiě)產(chǎn)品的翻譯及同傳功能,不僅能有效提高翻譯工作者的工作效率,同時(shí)人機(jī)耦合的形式也使各領(lǐng)域的非翻譯專業(yè)人才具備完成業(yè)務(wù)需要翻譯工作的可能性。2016-2021年中國(guó)對(duì)外直接投資凈額12.3%16.3%-19.3%-9.6%-4.3%1582.91788.21430.41537.11369.120172018201920202021中國(guó)對(duì)外直接投資凈額(億美元)增長(zhǎng)率(%)來(lái)源:商務(wù)部、國(guó)家統(tǒng)計(jì)局和國(guó)家外匯管理局,艾瑞研究院繪制。?2022.12iResearchI

2021年中國(guó)復(fù)合型翻譯人才需求情況6%外交學(xué)、國(guó)際關(guān)系7%8%31%新聞傳播類8%理工及其他專業(yè)法學(xué)類經(jīng)濟(jì)學(xué)類13%哲學(xué)類、中國(guó)語(yǔ)言文學(xué)類27%電子信息類、管理科學(xué)與工程類來(lái)源:中國(guó)翻譯協(xié)會(huì)《2022中國(guó)翻譯人才發(fā)展報(bào)告》,艾瑞研究院繪制。?2022.12iResearchI19智能語(yǔ)音轉(zhuǎn)寫(xiě)的行業(yè)規(guī)模需求活力持續(xù)注入,預(yù)計(jì)2026年市場(chǎng)規(guī)模達(dá)38億目前,智能轉(zhuǎn)寫(xiě)產(chǎn)品率先在辦公會(huì)議、傳媒音視頻、會(huì)展交流等領(lǐng)域展開(kāi)應(yīng)用,用戶接受度日益成熟。據(jù)艾瑞研究院統(tǒng)計(jì)測(cè)算,2021年中國(guó)智能語(yǔ)音轉(zhuǎn)寫(xiě)市場(chǎng)規(guī)模已約為10億元。未來(lái),隨著智能轉(zhuǎn)寫(xiě)的技術(shù)突破、功能豐富及場(chǎng)景泛化,智能轉(zhuǎn)寫(xiě)市場(chǎng)規(guī)模將加速上揚(yáng)。此外,轉(zhuǎn)寫(xiě)產(chǎn)品可結(jié)合NLP、知識(shí)圖譜技術(shù)在單純轉(zhuǎn)寫(xiě)內(nèi)容的基礎(chǔ)上升級(jí)為分析策略的輸出層級(jí),釋放更多價(jià)值勢(shì)能,預(yù)計(jì)2026年中國(guó)智能語(yǔ)音轉(zhuǎn)寫(xiě)行業(yè)市場(chǎng)規(guī)模將達(dá)到38億元,2021-2026五年CAGR=30.7%。2021-2026年中國(guó)智能轉(zhuǎn)寫(xiě)行業(yè)規(guī)模28.3% 29.9%1713102021 2022e2023e智能轉(zhuǎn)寫(xiě)行業(yè)規(guī)模(億元)來(lái)源:艾瑞研究院根據(jù)桌研與專家訪談自主建模測(cè)算。?2022.12iResearchInc.

31.1%32.9%31.4%3829222024e2025e2026e智能轉(zhuǎn)寫(xiě)行業(yè)規(guī)模增長(zhǎng)率(%) 20智能語(yǔ)音轉(zhuǎn)寫(xiě)的參與者類型以語(yǔ)音技術(shù)、產(chǎn)品生態(tài)、細(xì)分領(lǐng)域?yàn)槎鄻恿⒆泓c(diǎn)根據(jù)參與廠商的市場(chǎng)立足點(diǎn)劃分,智能語(yǔ)音轉(zhuǎn)寫(xiě)賽道的玩家可分為語(yǔ)音技術(shù)廠商、云服務(wù)廠商與專業(yè)轉(zhuǎn)寫(xiě)及翻譯服務(wù)商。其中語(yǔ)音技術(shù)廠商在語(yǔ)音識(shí)別能力、轉(zhuǎn)寫(xiě)服務(wù)水平上具備先發(fā)優(yōu)勢(shì),且投入足夠精力進(jìn)行技術(shù)研發(fā)與產(chǎn)品打磨,產(chǎn)品化能力優(yōu)秀,現(xiàn)占據(jù)智能語(yǔ)音轉(zhuǎn)寫(xiě)市場(chǎng)的主流廠商地位;而云服務(wù)廠商的轉(zhuǎn)寫(xiě)能力對(duì)內(nèi)服務(wù)于內(nèi)部產(chǎn)品的轉(zhuǎn)寫(xiě)功能需求,對(duì)外多選擇開(kāi)放語(yǔ)音轉(zhuǎn)寫(xiě)能力達(dá)成外部合作以豐富平臺(tái)生態(tài),垂直于轉(zhuǎn)寫(xiě)的產(chǎn)品化能力較弱;專業(yè)轉(zhuǎn)寫(xiě)及翻譯廠商通常以細(xì)分領(lǐng)域切入,深耕于辦公、翻譯、傳媒等某個(gè)細(xì)分領(lǐng)域,在垂類市場(chǎng)提供精細(xì)化、客制化產(chǎn)品及解決方案,滿足細(xì)分客戶的轉(zhuǎn)寫(xiě)服務(wù)需要。 智能語(yǔ)音轉(zhuǎn)寫(xiě)參與者類型分析以細(xì)分領(lǐng)域切入傳統(tǒng)轉(zhuǎn)寫(xiě)或翻譯服務(wù)商,持續(xù)積累垂直轉(zhuǎn)寫(xiě)需求客群,順應(yīng)智能轉(zhuǎn)寫(xiě)技術(shù)發(fā)展,切入細(xì)分領(lǐng)域,提供人機(jī)耦合的優(yōu)化產(chǎn)品服務(wù)。廠商代表:網(wǎng)易見(jiàn)外、迅捷語(yǔ)音以產(chǎn)品生態(tài)切入依附公司產(chǎn)品生態(tài),見(jiàn)長(zhǎng)于平臺(tái)化能力,在辦公、泛娛樂(lè)、教育等場(chǎng)景搭配軟硬件產(chǎn)品輸出轉(zhuǎn)寫(xiě)能力,一般分為對(duì)內(nèi)與對(duì)外服務(wù)廠商代表:阿里云、騰訊云、百度云、火山引擎

專業(yè)轉(zhuǎn)寫(xiě)/翻譯廠商語(yǔ)音技術(shù)廠商云服務(wù)廠商

以語(yǔ)音技術(shù)切入強(qiáng)于語(yǔ)音識(shí)別能力,為客戶提供語(yǔ)音轉(zhuǎn)寫(xiě)接口、SaaS產(chǎn)品及全套解決方案等多樣化轉(zhuǎn)寫(xiě)產(chǎn)品形式。除軟件服務(wù)外,硬件設(shè)備是觸達(dá)用戶的核心端口,部分語(yǔ)音技術(shù)廠商選擇從AIoT領(lǐng)域切入,依托于智能耳機(jī)、智能錄音筆、智慧屏等智能硬件產(chǎn)品進(jìn)一步開(kāi)拓轉(zhuǎn)寫(xiě)應(yīng)用場(chǎng)景廠商代表:科大訊飛、搜狗聽(tīng)寫(xiě)、思必馳、捷通華聲來(lái)源:艾瑞研究院自主研究繪制。?2022.12iResearchInc. 21智能語(yǔ)音轉(zhuǎn)寫(xiě)的產(chǎn)品形態(tài)包括SaaS類產(chǎn)品及本地化部署解決方案,均可結(jié)合智能硬件智能語(yǔ)音轉(zhuǎn)寫(xiě)服務(wù)的產(chǎn)品形態(tài)主要包括SaaS類產(chǎn)品與本地化部署解決方案兩大類。以SaaS類產(chǎn)品為主,其核心是提供云端語(yǔ)音識(shí)別及轉(zhuǎn)寫(xiě)服務(wù),根據(jù)客戶分類與應(yīng)用情景差異,包括輕量級(jí)的網(wǎng)頁(yè)版/APP/PC/小程序產(chǎn)品和提供給B/G端客戶的API開(kāi)發(fā)接口。SaaS類產(chǎn)品的主要特點(diǎn)是價(jià)格相對(duì)便宜、便捷度較高;而本地化部署的解決方案主要是為了滿足客戶的安全隱私與定制化需求,例如接入到政企內(nèi)部辦公平臺(tái)等,需要服務(wù)商具備定制化開(kāi)發(fā)能力。此外,為了提升語(yǔ)音采集的質(zhì)量及多樣化的移動(dòng)應(yīng)用場(chǎng)景,頭部廠商如訊飛聽(tīng)見(jiàn)、搜狗聽(tīng)寫(xiě)等開(kāi)發(fā)了種類豐富的功能性智能轉(zhuǎn)寫(xiě)硬件,如錄音筆、麥克風(fēng)、智慧屏等,可提供云端或本地轉(zhuǎn)寫(xiě)、錄音、存儲(chǔ)、編輯一體服務(wù)。智能語(yǔ)音轉(zhuǎn)寫(xiě)產(chǎn)品形態(tài)SaaS類產(chǎn)品通過(guò)Web/APP/PC/小程序等提供云端提供封裝語(yǔ)音轉(zhuǎn)以錄音筆、麥語(yǔ)音識(shí)別及轉(zhuǎn)寫(xiě)服務(wù),主要服務(wù)于C端客寫(xiě)能力的API接克風(fēng)、智慧屏戶或企業(yè)賬戶,企業(yè)賬戶或具備空間管理、口。下游應(yīng)用開(kāi)等語(yǔ)音采集硬協(xié)同編輯等增值服務(wù)。通過(guò)行業(yè)詞庫(kù)和模發(fā)商和手機(jī)、錄件為依托,調(diào)型優(yōu)化,產(chǎn)品可滿足傳媒、教培、金融、音筆等智能終端用云端語(yǔ)音識(shí)客服等多場(chǎng)景應(yīng)用需求廠商可進(jìn)行集成別及轉(zhuǎn)寫(xiě)能力本地化部署解決方案提供單機(jī)版軟件/私有化部署SDK接口,在本地 通過(guò)硬件內(nèi)置芯片與本地詞庫(kù),提可運(yùn)行語(yǔ)音識(shí)別及轉(zhuǎn)寫(xiě)能力。滿足客戶的定制化 供本地/離線轉(zhuǎn)寫(xiě)服務(wù)。滿足對(duì)數(shù)需求與安全隱私需求,但部署成本高,主要面向 據(jù)及網(wǎng)絡(luò)安全、便捷性及移動(dòng)辦公對(duì)數(shù)據(jù)安全需求較高的大型企業(yè)或公檢法、廣電 等需求。移動(dòng)端轉(zhuǎn)寫(xiě)能力與實(shí)用性傳媒等政府客戶 的提升,擴(kuò)充轉(zhuǎn)寫(xiě)功能的適用范圍來(lái)源:艾瑞研究院根據(jù)公開(kāi)資料自主研究繪制。?2022.12iResearchInc.

利用麥克風(fēng)陣列,通過(guò)聲學(xué)技術(shù)保障拾音效果,以提升語(yǔ)音采集精準(zhǔn)度。軟硬一體形式提升智能轉(zhuǎn)寫(xiě)質(zhì)量及效率,硬并滿足會(huì)議、訪談件等多類型需求場(chǎng)景價(jià)值點(diǎn) ?豐富消費(fèi)級(jí)智能硬件產(chǎn)品形態(tài),提高產(chǎn)品售價(jià)、促進(jìn)營(yíng)收增長(zhǎng) 22智能語(yǔ)音轉(zhuǎn)寫(xiě)的收費(fèi)模式與用戶畫(huà)像知識(shí)密集行業(yè)用戶的辦公效率提升利器,下游客戶類型豐富1)SaaS產(chǎn)品的前期投入主要集中于產(chǎn)品研發(fā)以及固定的IT支出,得益于其能夠同時(shí)為多租戶提供服務(wù)的特性,使得SaaS的邊際成本極低。這既給SaaS廠商帶來(lái)了相當(dāng)可觀的邊際利潤(rùn),也讓廠商在面對(duì)同類競(jìng)爭(zhēng)時(shí)得以在價(jià)格上做出更多讓步。對(duì)于C端客戶的語(yǔ)音轉(zhuǎn)寫(xiě)服務(wù)需求,產(chǎn)品提供方在早期一般采取低價(jià)或免費(fèi)試用時(shí)長(zhǎng)的模式集聚用戶,占領(lǐng)用戶心智,迅速做大用戶量。后期營(yíng)收增長(zhǎng)依賴滿足準(zhǔn)確率與實(shí)時(shí)率下的剛需客戶續(xù)費(fèi)率、深耕多樣化場(chǎng)景以拓寬潛在客戶市場(chǎng)、軟硬一體的智能硬件產(chǎn)品拉高營(yíng)收等;而企業(yè)客戶的價(jià)格敏感度則相對(duì)較低,更關(guān)注轉(zhuǎn)寫(xiě)精準(zhǔn)度和實(shí)時(shí)性體驗(yàn)等。對(duì)于遠(yuǎn)程會(huì)議、視頻剪輯、CRM等下游應(yīng)用,則多將語(yǔ)音轉(zhuǎn)寫(xiě)作為附加功能提供增值服務(wù),用戶可付費(fèi)解鎖。2)本地部署解決方案可滿足政企客戶的定制化與安全隱私需求。但部署成本高,項(xiàng)目制報(bào)價(jià)形式涵蓋軟件服務(wù)、實(shí)施與運(yùn)維、硬件設(shè)備等費(fèi)用??蛻粼陉P(guān)注轉(zhuǎn)寫(xiě)效果的同時(shí),亦關(guān)注安全性、駐場(chǎng)訓(xùn)練語(yǔ)料、設(shè)備安裝等實(shí)施及售后服務(wù)能力。SaaS類產(chǎn)品單筆訂單單筆付費(fèi)儲(chǔ)值卡(時(shí)長(zhǎng))轉(zhuǎn)寫(xiě)按月/年訂閱制服務(wù)免費(fèi)應(yīng)用后向廣告收費(fèi)

智能語(yǔ)音轉(zhuǎn)寫(xiě)產(chǎn)品的收費(fèi)模式與用戶畫(huà)像個(gè)人用戶畫(huà)像:主要轉(zhuǎn)按照時(shí)長(zhǎng)和并是學(xué)生、媒體工作者、寫(xiě)發(fā)計(jì)費(fèi)IT/金融辦公人群等。能豐富的下游場(chǎng)景應(yīng)主要來(lái)自于一二線城力用客戶市的知識(shí)密集型行業(yè)。接一次性license其中PC端使用者多為口有強(qiáng)辦公需求的企事賦能下游手機(jī)、錄業(yè)單位用戶,更重電音設(shè)備等硬件廠商腦音頻編輯

本地部署解決方案單機(jī)版軟件費(fèi)用私有化部署費(fèi)用項(xiàng)運(yùn)維費(fèi)用目制報(bào)硬件設(shè)備費(fèi)用價(jià)企業(yè)賬戶附加功能企業(yè)賬戶基礎(chǔ)收費(fèi)模式同上,開(kāi)通空間管理、協(xié)同編輯等增值服務(wù)來(lái)源:艾瑞研究院根據(jù)公開(kāi)資料自主研究繪制。?2022.12iResearchInc.

企業(yè)賬戶畫(huà)像:主要集中于影視劇后期、教培機(jī)構(gòu)等

智硬件付費(fèi)+能軟件服務(wù)免費(fèi)硬免費(fèi)使用轉(zhuǎn)寫(xiě)、翻譯件等語(yǔ)言服務(wù)

用戶畫(huà)像:主要面向政府、高校及大型企業(yè)。客戶需要轉(zhuǎn)寫(xiě)功能的對(duì)接與嵌入,對(duì)于數(shù)據(jù)安全、可拓展、靈活性要求更高,包括對(duì)需求響應(yīng)的及時(shí)程度等 23智能語(yǔ)音轉(zhuǎn)寫(xiě)SaaS產(chǎn)品分析高便捷性、開(kāi)箱即用、按需使用、快速響應(yīng)及多場(chǎng)景優(yōu)化1)基于SaaS的語(yǔ)音轉(zhuǎn)寫(xiě)服務(wù)產(chǎn)品通過(guò)將音頻文件上傳至云端,由云端轉(zhuǎn)寫(xiě)引擎進(jìn)行識(shí)別、轉(zhuǎn)寫(xiě)、糾錯(cuò),完成實(shí)時(shí)或非實(shí)時(shí)的語(yǔ)音轉(zhuǎn)寫(xiě)輸出。終端用戶可以在網(wǎng)頁(yè)或者APP上獲取結(jié)果,還可對(duì)結(jié)果進(jìn)行編輯、分享、導(dǎo)出等操作。語(yǔ)音轉(zhuǎn)寫(xiě)服務(wù)廠商通過(guò)多領(lǐng)域的語(yǔ)音轉(zhuǎn)寫(xiě)模型優(yōu)化和行業(yè)詞庫(kù),迭代更新以提升不同應(yīng)用場(chǎng)景下的轉(zhuǎn)寫(xiě)準(zhǔn)確率,服務(wù)多類型客戶。隨著云計(jì)算技術(shù)發(fā)展,目前云端算力和網(wǎng)絡(luò)環(huán)境比較穩(wěn)定,SaaS轉(zhuǎn)寫(xiě)產(chǎn)品的轉(zhuǎn)寫(xiě)準(zhǔn)確率和效率與私有化部署解決方案的用戶感知度差距不是特別顯著。高便捷性、較低成本等優(yōu)勢(shì)使語(yǔ)音轉(zhuǎn)寫(xiě)SaaS產(chǎn)品擁有龐大的終端消費(fèi)群體。2)且SaaS形式的轉(zhuǎn)寫(xiě)產(chǎn)品具有開(kāi)箱即用無(wú)需維護(hù)、按需使用等特點(diǎn),可被集成到下游應(yīng)用軟件或手機(jī)、智慧屏、錄音筆、智能會(huì)議系統(tǒng)等各類硬件設(shè)備中。API轉(zhuǎn)寫(xiě)引擎可支持遠(yuǎn)程會(huì)議、線上會(huì)展、電商直播、短視頻、在線課堂等軟件應(yīng)用的紀(jì)要轉(zhuǎn)寫(xiě)、字幕制作、同傳翻譯等功能,拓寬應(yīng)用的產(chǎn)品服務(wù)邊界。廣泛的下游生態(tài)也有助于語(yǔ)音轉(zhuǎn)寫(xiě)產(chǎn)品加速起量,擴(kuò)大潛在市場(chǎng)空間。智能語(yǔ)音轉(zhuǎn)寫(xiě)SaaS產(chǎn)品特點(diǎn)高便捷性通過(guò)網(wǎng)絡(luò)提供服務(wù),用戶可多設(shè)備、多渠道接入,隨時(shí)訪問(wèn);且數(shù)據(jù)儲(chǔ)存在云端,實(shí)時(shí)同步快速響應(yīng)低時(shí)延,秒級(jí)甚至毫秒級(jí)處理返回語(yǔ)音識(shí)別結(jié)果,支持同傳、直播等實(shí)時(shí)轉(zhuǎn)寫(xiě)場(chǎng)景需求按需使用、成本較低付費(fèi)方式靈活,可通過(guò)充值時(shí)長(zhǎng)卡的方式隨時(shí)使用轉(zhuǎn)寫(xiě)服務(wù)或根據(jù)調(diào)用量及并發(fā)量訂閱付費(fèi)來(lái)源:艾瑞研究院根據(jù)公開(kāi)資料自主研究繪制。?2022.12iResearchInc.

開(kāi)箱即用、無(wú)需維護(hù)B端客戶接入語(yǔ)音轉(zhuǎn)寫(xiě)能力,可隨時(shí)調(diào)用,模型及時(shí)迭代更新針對(duì)多應(yīng)用場(chǎng)景優(yōu)化進(jìn)行語(yǔ)言模型和行業(yè)詞庫(kù)優(yōu)化,滿足多應(yīng)用場(chǎng)景的客戶轉(zhuǎn)寫(xiě)需求??蓱?yīng)用于輕辦公、會(huì)議會(huì)展、傳媒、短視頻直播、同聲傳譯等領(lǐng)域 24智能語(yǔ)音轉(zhuǎn)寫(xiě)SaaS產(chǎn)品發(fā)展環(huán)境云計(jì)算普及助力下游企業(yè)便捷應(yīng)用語(yǔ)音轉(zhuǎn)寫(xiě)服務(wù)智能語(yǔ)音轉(zhuǎn)寫(xiě)SaaS產(chǎn)品的普及推廣離不開(kāi)我國(guó)云計(jì)算基礎(chǔ)設(shè)施的建設(shè)和技術(shù)成熟以及企業(yè)數(shù)字化轉(zhuǎn)型趨勢(shì)。我國(guó)云服務(wù)市場(chǎng)規(guī)模不斷增長(zhǎng),2021年中國(guó)整體云服務(wù)市場(chǎng)規(guī)模為3280億元,同比2020年增加45.4%,根據(jù)艾瑞咨詢推算,未來(lái)幾年的增速仍維持在30%以上。企業(yè)對(duì)云計(jì)算的接受程度也在不斷提高。中國(guó)信通院數(shù)據(jù)顯示,2019年中國(guó)企業(yè)應(yīng)用云計(jì)算的比例達(dá)到66.1%,較2017年增長(zhǎng)11.4pct,企業(yè)在經(jīng)歷信息化階段后開(kāi)始向數(shù)字化轉(zhuǎn)型。而在企業(yè)數(shù)字化轉(zhuǎn)型過(guò)程中,可有效提高會(huì)議交流、字幕轉(zhuǎn)寫(xiě)編輯、同聲傳譯等場(chǎng)景辦公效率的語(yǔ)音轉(zhuǎn)寫(xiě)SaaS產(chǎn)品,具備交付靈活、使用便捷等優(yōu)勢(shì),且可降低企業(yè)現(xiàn)金流壓力,對(duì)泛互聯(lián)網(wǎng)等各類企業(yè)的數(shù)字化轉(zhuǎn)型和辦公效率提升具有重要意義。2016-2025年中國(guó)整體云服務(wù)市場(chǎng)規(guī)模及增速57.1%32.1%33.2%48.1%39.9%45.4%42.8%40.2%32.8%30.6%

2017-2019年中國(guó)企業(yè)云計(jì)算使用率521 693 1026 1612 2256

126839550681247693280

54.7%58.6%66.1%45.3%41.4%33.9%2017201820192016 2017 2018 2019 2020 2021 2022e2023e2024e2025e整體云服務(wù)市場(chǎng)規(guī)模(億元)整體云服務(wù)市場(chǎng)增速(%)來(lái)源:艾瑞咨詢研究院自主研究推算及繪制。?2022.12iResearchInc.

沒(méi)有云計(jì)算應(yīng)用(%)有云計(jì)算應(yīng)用(%)來(lái)源:中國(guó)信通院來(lái)源:信通院《2020年云計(jì)算發(fā)展白皮書(shū)》,艾瑞咨詢研究院自主研究及繪制。?2022.12iResearchI25智能語(yǔ)音轉(zhuǎn)寫(xiě)SaaS產(chǎn)品競(jìng)爭(zhēng)要素轉(zhuǎn)寫(xiě)準(zhǔn)確度和效率、產(chǎn)品豐富度是核心要素綜合賽道特征,艾瑞咨詢?cè)u(píng)估智能語(yǔ)音轉(zhuǎn)寫(xiě)SaaS產(chǎn)品競(jìng)爭(zhēng)要素包含:轉(zhuǎn)寫(xiě)準(zhǔn)確度與效率、產(chǎn)品豐富度、品牌影響力、價(jià)格優(yōu)勢(shì)、用戶體量與生態(tài)、發(fā)展?jié)摿α鶄€(gè)方面。從客戶選擇產(chǎn)品的角度看,雖然不同客戶類型和應(yīng)用場(chǎng)景的需求會(huì)面臨一定差異,但轉(zhuǎn)寫(xiě)準(zhǔn)確度和效率、產(chǎn)品豐富度是解決用戶問(wèn)題的第一前提;在此基礎(chǔ)上,有價(jià)格優(yōu)勢(shì)、品牌影響力大的玩家更容易受到客戶青睞。此外,用戶體量與生態(tài)實(shí)力強(qiáng)、發(fā)展?jié)摿Υ蟮漠a(chǎn)品市場(chǎng)競(jìng)爭(zhēng)優(yōu)勢(shì)更明顯。智能語(yǔ)音轉(zhuǎn)寫(xiě)SaaS產(chǎn)品競(jìng)爭(zhēng)要素轉(zhuǎn)寫(xiě)準(zhǔn)確度與效率轉(zhuǎn)寫(xiě)準(zhǔn)確度與效率評(píng)價(jià)產(chǎn)品功能水平的直接指標(biāo)。除核心的語(yǔ)音識(shí)別準(zhǔn)確率外,上下文糾正、語(yǔ)氣詞過(guò)濾、角色分離、熱詞設(shè)置等智能化功能可提高轉(zhuǎn)寫(xiě)服務(wù)準(zhǔn)確度品牌影響力L1指該產(chǎn)品支持應(yīng)用場(chǎng)景(會(huì)議、會(huì)展、同傳、字幕L2L3用戶體量與生態(tài)產(chǎn)品豐富度等)、行業(yè)領(lǐng)域(金融、教育、零售、客服等)、等)的覆蓋情況產(chǎn)品形態(tài)(網(wǎng)頁(yè)、APP、API/SDK調(diào)用、智能硬件競(jìng)爭(zhēng)要素品牌影響力指品牌開(kāi)拓市場(chǎng)、占領(lǐng)市場(chǎng)、并獲得利潤(rùn)的能力,核心評(píng)價(jià)維度來(lái)源于廠商端及用戶端對(duì)品牌的直接價(jià)格優(yōu)勢(shì)發(fā)展?jié)摿υu(píng)價(jià)及認(rèn)可指不同收費(fèi)模式下的產(chǎn)品單位價(jià)格;C端消費(fèi)者相價(jià)格優(yōu)勢(shì)對(duì)價(jià)格敏感度高產(chǎn)品豐富度用戶體量與生態(tài)指該品牌產(chǎn)品的內(nèi)/外部調(diào)用量和下游用戶類型廣度(消費(fèi)者、企業(yè)級(jí)、政府客戶等)轉(zhuǎn)寫(xiě)準(zhǔn)確度與效率和產(chǎn)品豐富度為滿足各類用戶需求的核心要素發(fā)展?jié)摿χ冈撈放飘a(chǎn)品的未來(lái)市場(chǎng)空間?;谄浼夹g(shù)實(shí)力、注:根據(jù)行業(yè)調(diào)研廠商表現(xiàn),將競(jìng)爭(zhēng)要素對(duì)應(yīng)進(jìn)行L1/L2/L3級(jí)評(píng)分產(chǎn)品化能力、服務(wù)水平及發(fā)展戰(zhàn)略綜合評(píng)估來(lái)源:艾瑞研究院根據(jù)公開(kāi)資料自主研究繪制。?2022.12iResearchI26智能語(yǔ)音轉(zhuǎn)寫(xiě)SaaS產(chǎn)品競(jìng)爭(zhēng)格局市場(chǎng)頭部聚集效應(yīng)顯著,參與者致力差異化深耕現(xiàn)階段,我國(guó)智能語(yǔ)音轉(zhuǎn)寫(xiě)產(chǎn)品市場(chǎng)較為集中,訊飛聽(tīng)見(jiàn)和搜狗聽(tīng)寫(xiě)的頭部效應(yīng)明顯;但在產(chǎn)品同質(zhì)化壓力下,參與廠商也均積極在轉(zhuǎn)寫(xiě)的各細(xì)分專業(yè)領(lǐng)域、云端及本地化服務(wù)形式、附加產(chǎn)品形態(tài)與產(chǎn)品生態(tài)多角度進(jìn)行差異化深耕。根據(jù)六大競(jìng)爭(zhēng)要素,艾瑞咨詢將市場(chǎng)上提供智能語(yǔ)音轉(zhuǎn)寫(xiě)SaaS服務(wù)的廠商分為三個(gè)梯隊(duì),其中語(yǔ)音技術(shù)廠商訊飛聽(tīng)見(jiàn)和搜狗聽(tīng)寫(xiě)位列第一梯隊(duì)。訊飛聽(tīng)見(jiàn)在轉(zhuǎn)寫(xiě)準(zhǔn)確度尤其是針對(duì)小語(yǔ)種和方言等、產(chǎn)品豐富度、品牌影響力、發(fā)展?jié)摿S度拔得頭籌。智能語(yǔ)音轉(zhuǎn)寫(xiě)SaaS產(chǎn)品競(jìng)爭(zhēng)格局第一梯隊(duì) 廠商在各競(jìng)爭(zhēng)維度優(yōu)勢(shì)明顯第二梯隊(duì)具有一定的品牌影響力,或深耕C端用戶運(yùn)營(yíng)推廣,或依托品牌自有用戶生態(tài),或依托下游開(kāi)發(fā)者生態(tài)推廣相關(guān)業(yè)務(wù)。具備一定生態(tài)優(yōu)勢(shì),但在多語(yǔ)種、方言等場(chǎng)景下的轉(zhuǎn)寫(xiě)準(zhǔn)確率可做進(jìn)一步提升。受限于轉(zhuǎn)寫(xiě)能力、產(chǎn)品豐富度等因素,第三梯隊(duì)客戶市場(chǎng)份額較小。擁有一定價(jià)格優(yōu)長(zhǎng)尾廠商勢(shì),但在其余維度表現(xiàn)多有所不足。來(lái)源:艾瑞研究院根據(jù)公開(kāi)資料自主研究繪制。?2022.12iResearchInc.

轉(zhuǎn)寫(xiě)準(zhǔn)確度與效率品牌影響力 用戶體量與生態(tài)價(jià)格優(yōu)勢(shì) 發(fā)展?jié)摿Ξa(chǎn)品豐富度訊飛聽(tīng)見(jiàn)在轉(zhuǎn)寫(xiě)準(zhǔn)確度、產(chǎn)品豐富度、品牌影響力、發(fā)展?jié)摿S度拔得頭籌。 27智能語(yǔ)音轉(zhuǎn)寫(xiě)本地部署解決方案產(chǎn)品服務(wù)升級(jí),高安全性與定制化滿足大型政企客戶需求為滿足大型企業(yè)及政府客戶對(duì)安全性和定制化的需求,智能語(yǔ)音轉(zhuǎn)寫(xiě)SaaS廠商升級(jí)產(chǎn)品和服務(wù),提供私有化部署形式和軟硬一體的產(chǎn)品解決方案。1)本地部署的純軟件解決方案與SaaS產(chǎn)品的功能類似,但私有化部署的獨(dú)立服務(wù)器形式可保證客戶對(duì)數(shù)據(jù)保密的安全性需求且架構(gòu)自主;同時(shí),語(yǔ)音轉(zhuǎn)寫(xiě)能力提供商可針對(duì)客戶提供的特定語(yǔ)料進(jìn)行模型訓(xùn)練,滿足客戶的定制化轉(zhuǎn)寫(xiě)需求,貼合用戶業(yè)務(wù)場(chǎng)景,計(jì)算和執(zhí)行效率更高。2)為了滿足政企大客戶的會(huì)議室、展會(huì)、傳媒編輯等線下場(chǎng)景的智慧辦公需求,軟硬一體的語(yǔ)音轉(zhuǎn)寫(xiě)解決方案可打包提供定制化拾音功能硬件、多語(yǔ)種語(yǔ)音轉(zhuǎn)寫(xiě)與翻譯能力、軟硬一體化開(kāi)發(fā)接口等;對(duì)于隨身攜帶且有隱私要求的離線轉(zhuǎn)寫(xiě)場(chǎng)景,一體機(jī)形式的語(yǔ)音轉(zhuǎn)寫(xiě)設(shè)備則將硬件拾音、軟件與服務(wù)集成在一起,無(wú)需聯(lián)網(wǎng),即開(kāi)即用。智能語(yǔ)音轉(zhuǎn)寫(xiě)本地部署解決方案特點(diǎn)私有化部署形式辦公專網(wǎng)提供的 固定會(huì)場(chǎng)的私有云 服務(wù)器部署線下軟硬一體產(chǎn)品智慧屏 會(huì)議系統(tǒng) 移動(dòng)辦公的離線單機(jī)版產(chǎn)品來(lái)源:艾瑞研究院根據(jù)公開(kāi)資料自主研究繪制。?2022.12iResearchInc.

產(chǎn)品服務(wù)升級(jí)數(shù)據(jù)保密安全需求架構(gòu)自主定制化語(yǔ)料訓(xùn)練軟硬一體支持離的一站式線轉(zhuǎn)寫(xiě)方案場(chǎng)景 28智能語(yǔ)音轉(zhuǎn)寫(xiě)產(chǎn)業(yè)的飛輪模型API經(jīng)濟(jì)與垂類解決方案共拓產(chǎn)業(yè)廣度與深度平臺(tái)類廠商開(kāi)放平臺(tái)API經(jīng)濟(jì)可拓展智能語(yǔ)音轉(zhuǎn)寫(xiě)產(chǎn)業(yè)的廣度,形成平臺(tái)效應(yīng),利用下游開(kāi)發(fā)者的創(chuàng)新活性帶動(dòng)市場(chǎng)發(fā)展,隨開(kāi)發(fā)者生態(tài)聚集帶來(lái)龐大的下游規(guī)模經(jīng)濟(jì)效益;同時(shí),垂類解決方案則延伸產(chǎn)業(yè)深度,聚焦剛需應(yīng)用與高價(jià)值環(huán)節(jié),延伸出了錄音筆等智能硬件、協(xié)同辦公會(huì)議應(yīng)用、提取長(zhǎng)時(shí)語(yǔ)音信息有效內(nèi)容等多條增量建設(shè)與運(yùn)營(yíng)需求業(yè)務(wù)線。API經(jīng)濟(jì)與垂類解決方案兩者合力,相輔相成,形成智能語(yǔ)音轉(zhuǎn)寫(xiě)產(chǎn)業(yè)既快且穩(wěn)的增長(zhǎng)飛輪。在此基礎(chǔ)上,高生態(tài)活性加硬解決方案實(shí)力的企業(yè)更能突出重圍,搶占市場(chǎng)。API 產(chǎn)業(yè)活力與不設(shè)限空間規(guī)模效益與高毛利:SaaS產(chǎn)品利用率更高、單位成本降低。輕量化的輸出模式可以持續(xù)低成本、短賬期促進(jìn)營(yíng)收增長(zhǎng)平臺(tái)效應(yīng):聚合合作伙伴,擴(kuò)大影響力并實(shí)現(xiàn)語(yǔ)音轉(zhuǎn)寫(xiě)技術(shù)下沉,塑造產(chǎn)業(yè)生態(tài)保持活性:構(gòu)建動(dòng)態(tài)更新的產(chǎn)品服務(wù)池,利用偏C端活性帶動(dòng)B、G端需求,拓寬企業(yè)級(jí)客戶增長(zhǎng)來(lái)源:艾瑞研究院根據(jù)公開(kāi)資料自主研究繪制。

智能語(yǔ)音轉(zhuǎn)寫(xiě)產(chǎn)業(yè)的飛輪模型深度業(yè)務(wù)飛輪廣度

垂類解決方案核心競(jìng)爭(zhēng)力軟硬一體占據(jù)高價(jià)值環(huán)節(jié),形成應(yīng)用流量入口:圍繞語(yǔ)音轉(zhuǎn)寫(xiě)需求場(chǎng)景的核心痛點(diǎn),錄音筆、智慧屏、智慧會(huì)議系統(tǒng)等入口級(jí)智能硬件可延伸出多條增量建設(shè)與運(yùn)營(yíng)需求業(yè)務(wù)線,提供想象空間剛需高頻應(yīng)用增肌造血:為轉(zhuǎn)寫(xiě)技術(shù)找到可打磨的場(chǎng)景,如協(xié)同辦公、電商直播等,結(jié)合場(chǎng)景Know-How反哺技術(shù)研發(fā),形成良性閉環(huán)?2022.12iResearchInc. 29智能語(yǔ)音轉(zhuǎn)寫(xiě)行業(yè)——發(fā)展背景篇 1智能語(yǔ)音轉(zhuǎn)寫(xiě)行業(yè)——市場(chǎng)分析篇 2智能語(yǔ)音轉(zhuǎn)寫(xiě)行業(yè)典型企業(yè)案例 3智能語(yǔ)音轉(zhuǎn)寫(xiě)行業(yè)——發(fā)展趨勢(shì)篇 4530訊飛聽(tīng)見(jiàn)、科大訊飛旗下“AI+辦公”品牌,聚焦語(yǔ)音轉(zhuǎn)寫(xiě)及翻譯市場(chǎng)科大訊飛成立于1999年,是亞太地區(qū)知名的智能語(yǔ)音與人工智能上市企業(yè),訊飛聽(tīng)見(jiàn)是科大訊飛旗下主打“AI+辦公”的子品牌,為客戶提供以語(yǔ)音轉(zhuǎn)文字及多語(yǔ)種翻譯為核心功能的智慧辦公服務(wù)。依托公司深耕多年的自然語(yǔ)言處理、聲紋識(shí)別、語(yǔ)音識(shí)別、翻譯等核心技術(shù),訊飛聽(tīng)見(jiàn)的產(chǎn)品化能力也愈發(fā)成熟,打磨出平臺(tái)服務(wù)、會(huì)展傳媒服務(wù)、智能硬件產(chǎn)品、行業(yè)解決方案四條核心產(chǎn)品線,布局逐步完善,覆蓋廣泛下游應(yīng)用場(chǎng)景,助力C端、B端及G端提升工作效率,實(shí)現(xiàn)高效知識(shí)管理。訊飛聽(tīng)見(jiàn)轉(zhuǎn)寫(xiě)產(chǎn)品線平臺(tái)服務(wù)聚焦服務(wù)辦公領(lǐng)域,在會(huì)議紀(jì)要整理、遠(yuǎn)程視頻會(huì)議、跨國(guó)語(yǔ)言交流等場(chǎng)景,助力力企業(yè)高效完成辦公系統(tǒng)智能化升級(jí)。多終端服務(wù)(PC/Web/APP/小程序) AI智能處理軟硬件協(xié)同 場(chǎng)景化服務(wù) 多領(lǐng)域詞庫(kù)訊飛聽(tīng)見(jiàn)(轉(zhuǎn)寫(xiě)) 訊飛聽(tīng)見(jiàn)翻譯 訊飛聽(tīng)見(jiàn)會(huì)議

會(huì)展傳媒服務(wù)提供“采編播審存”一整套流程的產(chǎn)品;為長(zhǎng)短視頻剪輯工作者提供字幕轉(zhuǎn)寫(xiě)產(chǎn)品;為會(huì)展行業(yè)提供線下一體機(jī)、線上SaaS服務(wù)的同傳服務(wù);基于轉(zhuǎn)寫(xiě)服務(wù)為會(huì)展傳媒行業(yè)打造可持續(xù)的AI應(yīng)用生態(tài)圈。人機(jī)耦合 時(shí)間碼自動(dòng)匹配 多語(yǔ)種字幕訊飛聽(tīng)見(jiàn)同傳 訊飛聽(tīng)見(jiàn)字幕 訊飛聽(tīng)見(jiàn)媒體解決方案智能硬件產(chǎn)品AI加持,軟硬件一體,以轉(zhuǎn)寫(xiě)文字及翻譯為核心功能的智能硬件,無(wú)縫連接訊飛聽(tīng)見(jiàn)網(wǎng)站、App、客戶端,支持多種語(yǔ)言、方言,可有效提升學(xué)生在校學(xué)習(xí)和職場(chǎng)人辦公記錄效率。專業(yè)級(jí)錄音 實(shí)時(shí)同步編輯 免費(fèi)轉(zhuǎn)寫(xiě)服務(wù)

行業(yè)解決方案以語(yǔ)音識(shí)別、機(jī)器翻譯、語(yǔ)義理解、OCR識(shí)別等能力為基礎(chǔ),萃取“非結(jié)構(gòu)化數(shù)據(jù)”,拓展數(shù)據(jù)維度,構(gòu)建知識(shí)管理體系,輔助高效決策。為政府、企業(yè)用戶打造貫通會(huì)前、會(huì)中、會(huì)后的智慧辦公解決方案。軟硬件一體化開(kāi)發(fā)接口 支持公有云和私有化部署錄音筆麥克風(fēng)智慧屏訊飛聽(tīng)見(jiàn)智能會(huì)議系統(tǒng)訊飛聽(tīng)見(jiàn)智慧辦公室解決方案來(lái)源:艾瑞研究院根據(jù)公開(kāi)資料、公司官網(wǎng)自主研究繪制。?2022.12iResearchI31訊飛聽(tīng)見(jiàn)讓辦公更高效,讓生活更簡(jiǎn)單,讓溝通無(wú)障礙作為科大訊飛語(yǔ)音轉(zhuǎn)寫(xiě)及翻譯的重要業(yè)務(wù)承接,訊飛聽(tīng)見(jiàn)在業(yè)界的語(yǔ)音轉(zhuǎn)寫(xiě)準(zhǔn)確率、產(chǎn)品智能化應(yīng)用、多領(lǐng)域場(chǎng)景化應(yīng)用、多語(yǔ)種和方言表現(xiàn)上出色,并整合平臺(tái)和人工譯員等資源搭建語(yǔ)音語(yǔ)言服務(wù)平臺(tái),讓機(jī)器與人工實(shí)現(xiàn)取長(zhǎng)補(bǔ)短的融合,極致發(fā)揮人機(jī)耦合效能。如今,訊飛聽(tīng)見(jiàn)生態(tài)用戶破億,覆蓋用戶已超越5000萬(wàn),并與眾多B端客戶合作打造行業(yè)生態(tài)平臺(tái),共同參與公益活動(dòng),讓聽(tīng)障人士通過(guò)文字去感受世界、與人溝通交流,通過(guò)AI語(yǔ)音賦能產(chǎn)品,建立起與聽(tīng)障人士溝通的橋梁。未來(lái),訊飛聽(tīng)見(jiàn)將以更積極的態(tài)度履行品牌使命:讓辦公更高效,讓生活更簡(jiǎn)單,讓溝通無(wú)障礙。訊飛聽(tīng)見(jiàn)轉(zhuǎn)寫(xiě)業(yè)務(wù)優(yōu)勢(shì)高識(shí)別準(zhǔn)確率、多語(yǔ)種翻譯、穩(wěn)定豐富產(chǎn)品性能轉(zhuǎn)寫(xiě)精準(zhǔn)ü準(zhǔn)確率97.5%,1小時(shí)音頻最快5分鐘出稿。ü支持10種國(guó)家語(yǔ)言轉(zhuǎn)寫(xiě)、12種地方方言、2種少數(shù)民族語(yǔ)。語(yǔ)種豐富ü會(huì)議內(nèi)容實(shí)時(shí)轉(zhuǎn)寫(xiě),邊錄邊轉(zhuǎn);會(huì)議信息快速整理,清晰會(huì)議紀(jì)要明了;關(guān)鍵內(nèi)容實(shí)時(shí)標(biāo)記,一鍵定位。ü智能糾錯(cuò)、語(yǔ)氣詞過(guò)濾智能化ü角色分離:智能區(qū)分說(shuō)話人,標(biāo)記多角色,快速整理稿件場(chǎng)景化ü根據(jù)不同行業(yè)客戶,提供16個(gè)行業(yè)詞庫(kù)隱私安全ü適配不同客戶需求,支持音視頻、文檔、鏈接等多格式ü通過(guò)可信云認(rèn)證,信息加密全程保證全鏈路多終 ü硬軟件一體、行業(yè)定制解決方案定制、私有化部署等。客端產(chǎn)品,客 戶覆蓋職場(chǎng)個(gè)人、政府企業(yè)、文化傳媒等。同時(shí)搭建語(yǔ)音戶類型多元 語(yǔ)言服務(wù)平臺(tái),整合AI語(yǔ)音產(chǎn)品及人工服務(wù)提升人機(jī)耦合服務(wù)效能。來(lái)源:艾瑞研究院根據(jù)公開(kāi)資料、公司官網(wǎng)自主研究繪制。?2022.12iResearchInc.

應(yīng)用實(shí)例行業(yè)生態(tài)伙伴生態(tài)共榮,開(kāi)放API能力接口,服務(wù)生態(tài)合作伙伴。私有化轉(zhuǎn)寫(xiě)翻譯服務(wù)為客戶提供私有化轉(zhuǎn)寫(xiě)翻譯服務(wù)。公益行動(dòng)聽(tīng)見(jiàn)AI的聲音:與中國(guó)聾協(xié)殘疾人藝術(shù)團(tuán)聯(lián)合發(fā)起聽(tīng)障關(guān)懷公益“聽(tīng)見(jiàn)AI的聲音”,累計(jì)為用戶捐贈(zèng)時(shí)長(zhǎng)6000萬(wàn)分鐘。B站無(wú)障礙直播間字幕:觀看英雄聯(lián)盟S11、2022英雄聯(lián)盟MSI和2022英格蘭足總杯活動(dòng)。 32火山引擎服務(wù)于字節(jié)系產(chǎn)品,短視頻字幕生成用戶生態(tài)體量大火山引擎的語(yǔ)音識(shí)別能力基于深度學(xué)習(xí)技術(shù),可將音頻中的語(yǔ)音轉(zhuǎn)成文字,用于識(shí)別多種音頻編碼格式、多種場(chǎng)景和不同長(zhǎng)短的語(yǔ)音,廣泛應(yīng)用于音視頻字幕生成、會(huì)議訪談轉(zhuǎn)寫(xiě)、呼叫中心錄音質(zhì)檢、課堂內(nèi)容分析等場(chǎng)景。其智能字幕生成服務(wù)可用于輔助視頻字幕創(chuàng)作和外掛字幕生成。產(chǎn)品支持多個(gè)語(yǔ)種的語(yǔ)音識(shí)別、歌詞識(shí)別和字幕打軸,可結(jié)合語(yǔ)音停頓和自然語(yǔ)言的語(yǔ)義信息,全自動(dòng)判斷說(shuō)話或唱歌,輸出流暢自然的分句結(jié)果,適配視頻剪輯、網(wǎng)課、視頻會(huì)議等多種場(chǎng)景的智能字幕生成。有效提高視頻內(nèi)容生產(chǎn)者的積極性,降低視頻內(nèi)容處理成本。準(zhǔn)確率服務(wù)穩(wěn)定多領(lǐng)域覆蓋支持語(yǔ)種豐富來(lái)源:艾瑞根據(jù)公開(kāi)資料研究繪制。?2022.12iResearchInc.

火山引擎語(yǔ)音轉(zhuǎn)寫(xiě)服務(wù)特點(diǎn)與主要客戶采用端到端語(yǔ)音識(shí)別框架,與抖音、飛書(shū)、剪映、西瓜視頻等業(yè)務(wù)深度合作,具備實(shí)際業(yè)務(wù)場(chǎng)景打磨的豐富經(jīng)驗(yàn),確保準(zhǔn)確率企業(yè)級(jí)穩(wěn)定服務(wù)保障,專有集群,大流量并發(fā),高效靈活,可快速返回識(shí)別結(jié)果廣泛應(yīng)用于泛娛樂(lè)、辦公、教育、客服場(chǎng)景,支持了汽車(chē)、智能金融、銀行、保險(xiǎn)、證券、運(yùn)營(yíng)商、物流、房地產(chǎn)等眾多垂直領(lǐng)域多語(yǔ)種識(shí)別,支持中英日韓等多國(guó)語(yǔ)言及地區(qū)方言的識(shí)別 33靈云聽(tīng)語(yǔ)靈云平臺(tái)推出的以語(yǔ)音轉(zhuǎn)文字為核心的云服務(wù)平臺(tái)靈云聽(tīng)語(yǔ)是由捷通華聲開(kāi)發(fā)的一款專注語(yǔ)音識(shí)別轉(zhuǎn)寫(xiě)的智能化應(yīng)用。由靈云聽(tīng)語(yǔ)網(wǎng)頁(yè)版和靈云聽(tīng)語(yǔ)App版組成,可分享相同賬號(hào),數(shù)據(jù)聯(lián)通。網(wǎng)頁(yè)版能夠?qū)⒁纛l轉(zhuǎn)寫(xiě)結(jié)果以普通文本或字幕格式導(dǎo)出,支持在線編輯;App版則支持手機(jī)實(shí)時(shí)錄音邊說(shuō)邊轉(zhuǎn)和導(dǎo)入音頻文件轉(zhuǎn)寫(xiě)識(shí)別。靈云聽(tīng)語(yǔ)支持多種音頻格式,使用場(chǎng)景豐富,支持中文、英文、方言識(shí)別轉(zhuǎn)寫(xiě)。中文轉(zhuǎn)寫(xiě)覆蓋13種專業(yè)領(lǐng)域,廣泛用于辦公會(huì)議、錄音整理、訪談演講、課程學(xué)習(xí)、記者采訪、視頻字幕制作等場(chǎng)景。靈云聽(tīng)語(yǔ)語(yǔ)音轉(zhuǎn)寫(xiě)功能介紹多種音頻格式轉(zhuǎn)寫(xiě)服務(wù)覆蓋13種專業(yè)領(lǐng)域mp3/wav/m4a/amr/mp4/flv/mov/avi格式語(yǔ)音識(shí)別速度快實(shí)時(shí)轉(zhuǎn)寫(xiě)響應(yīng)速度快至500毫秒;非實(shí)時(shí)轉(zhuǎn)寫(xiě)通用聊天電話客服教育學(xué)習(xí)金融財(cái)經(jīng)政黨會(huì)議戀愛(ài)心理1小時(shí)音頻文件只需5-10分鐘多語(yǔ)種哲學(xué)思想 廣播電臺(tái) 企業(yè)辦公 旅游景點(diǎn)支持中、英、方言識(shí)別和中、英、數(shù)字混合輸入超大容量網(wǎng)課教學(xué) 醫(yī)療健康 國(guó)學(xué)歷史單條大小不超過(guò)5G,時(shí)長(zhǎng)小于3小時(shí)來(lái)源:艾瑞根據(jù)公開(kāi)資料研究繪制。?2022.12iResearchInc. 34錄音轉(zhuǎn)文字助手支持手機(jī)端和網(wǎng)頁(yè)端服務(wù),主要服務(wù)于C端用戶錄音轉(zhuǎn)文字助手是由上海動(dòng)起信息科技有限公司開(kāi)發(fā),可應(yīng)用于安卓、蘋(píng)果手機(jī)、iPad、網(wǎng)頁(yè)端通用的一款將語(yǔ)音轉(zhuǎn)文字、錄音轉(zhuǎn)文字、音頻文件轉(zhuǎn)文字并翻譯記錄的軟件,適用于會(huì)議,采訪,講座,課堂,出國(guó)旅游,英語(yǔ)學(xué)習(xí)等各種場(chǎng)合。該應(yīng)用依托迅捷語(yǔ)音的核心語(yǔ)音識(shí)別技術(shù),提供視頻轉(zhuǎn)文字、圖片轉(zhuǎn)文字、合成主播等文字轉(zhuǎn)語(yǔ)音應(yīng)用,主要面向各行業(yè)C端用戶。翻譯提供簡(jiǎn)體中文、英文、阿拉伯語(yǔ)、德語(yǔ)、法語(yǔ)、葡萄牙語(yǔ)、西班牙語(yǔ)、意大利語(yǔ)、韓語(yǔ)的互譯服務(wù),支持中英文實(shí)時(shí)對(duì)話翻譯

錄音轉(zhuǎn)文字助手業(yè)務(wù)布局與轉(zhuǎn)寫(xiě)專業(yè)領(lǐng)域文字轉(zhuǎn)語(yǔ)音高辨識(shí)度的語(yǔ)音合成功能,模擬真人發(fā)轉(zhuǎn)寫(xiě)專業(yè)領(lǐng)域聲,讓文字信息變得繪“聲”繪色。如廣告叫賣(mài)、專題宣傳、課件培訓(xùn)、方言配音、英語(yǔ)配音等??梢宰远x主播參數(shù)的設(shè)置,如音量、語(yǔ)速、語(yǔ)調(diào),來(lái)調(diào)通用聊天會(huì)議辦公新聞媒體節(jié)達(dá)到更適合使用場(chǎng)景的發(fā)音錄音轉(zhuǎn)文字快速轉(zhuǎn)換文字,方便進(jìn)行拷貝和編輯等后續(xù)的工作。適用于轉(zhuǎn)寫(xiě)會(huì)議記錄、電情感寫(xiě)作IT科技教育培訓(xùn)影對(duì)白、新聞媒體、情感寫(xiě)作等多個(gè)情景,提高辦公效率,專注生產(chǎn)力的提升。亦提供人工精轉(zhuǎn)服務(wù)來(lái)源:艾瑞根據(jù)公開(kāi)資料研究繪制。?2022.12iResearchInc. 35智能語(yǔ)音轉(zhuǎn)寫(xiě)行業(yè)——發(fā)展背景篇 1智能語(yǔ)音轉(zhuǎn)寫(xiě)行業(yè)——市場(chǎng)分析篇 2智能語(yǔ)音轉(zhuǎn)寫(xiě)行業(yè)典型企業(yè)案例 3智能語(yǔ)音轉(zhuǎn)寫(xiě)行業(yè)——發(fā)展趨勢(shì)篇 436技術(shù)趨勢(shì)應(yīng)用價(jià)值提升仍受技術(shù)掣肘,轉(zhuǎn)寫(xiě)場(chǎng)景有望進(jìn)一步泛化當(dāng)下語(yǔ)音識(shí)別技術(shù)的精度和速度仍取決于實(shí)際應(yīng)用環(huán)境,在常見(jiàn)語(yǔ)種、標(biāo)準(zhǔn)口音、安靜環(huán)境下的語(yǔ)音識(shí)別情況已達(dá)到了可規(guī)模化應(yīng)用狀態(tài)。但現(xiàn)實(shí)應(yīng)用場(chǎng)景隨機(jī)性極高,面對(duì)“混合語(yǔ)種”“嘈雜環(huán)境”下的“多人”“交互”“重疊”等多重因素交織的復(fù)雜語(yǔ)音場(chǎng)景,語(yǔ)音技術(shù)尚未能很好地處理這些問(wèn)題。如今,語(yǔ)音轉(zhuǎn)寫(xiě)應(yīng)用多限制在辦公會(huì)議、視頻直播等部分較為理想環(huán)境下的固定場(chǎng)景,下一代語(yǔ)音識(shí)別技術(shù)的突破創(chuàng)新有望實(shí)現(xiàn)轉(zhuǎn)寫(xiě)場(chǎng)景泛化升級(jí),進(jìn)一步抬升語(yǔ)音技術(shù)的應(yīng)用價(jià)值與潛力空間。 智能語(yǔ)音轉(zhuǎn)寫(xiě)的技術(shù)難點(diǎn)方言語(yǔ)種 環(huán)境噪音 多人聲道眾多漢語(yǔ)方言識(shí)別除中英應(yīng)用廣泛外的小眾語(yǔ)種識(shí)別多語(yǔ)種混合識(shí)別(例:中英粵)如何解決方言及小語(yǔ)種的識(shí)別覆蓋范圍?盡可能收集方言及小語(yǔ)種的數(shù)據(jù)集語(yǔ)料進(jìn)行語(yǔ)言模型訓(xùn)練解決低資源問(wèn)題,通過(guò)少量數(shù)據(jù)資源解決方言,小語(yǔ)種識(shí)別問(wèn)題如何解決多語(yǔ)種識(shí)別問(wèn)題?通用建模:將不同語(yǔ)種的建模單元映射成同一套建模單元體系多語(yǔ)種混合模型:不同語(yǔ)種共享一個(gè)隱層神經(jīng)網(wǎng)絡(luò),各自有獨(dú)立的一個(gè)輸出分類層來(lái)源:艾瑞研究院根據(jù)公開(kāi)資料與專家訪談自主研究繪制。?2022.12iResearchInc.

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論