




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、2022年汽車行業(yè)之語音交互車端應(yīng)用系列研究1.語音交互車端應(yīng)用綜述語音交互賦能車載智能終端,成為智能座艙生態(tài)構(gòu)建的核心功能目前,語音交互功能作為汽車座艙智能化的標(biāo)志性代表,與車內(nèi)多種應(yīng)用相結(jié)合,成為座艙生態(tài)構(gòu)建的核心功能。 2011年中國首個智能汽車語音助理概念出現(xiàn),可實現(xiàn)命令詞語音識別的同時,也標(biāo)志著智能語音交互應(yīng)用于汽車產(chǎn)業(yè)的開始。 隨著語音的智能化發(fā)展,語音交互在車端的應(yīng)用已經(jīng)度過萌生期與探索期,正處于快速發(fā)展的黃金期。語音交互鏈條涉及學(xué)科廣泛,ASR、NLP與TTS成為車端應(yīng)用關(guān)鍵語音交互所涉及的流程繁瑣,涉及到從語言學(xué)到聲學(xué)理論等多方面內(nèi)容,同時在車端的使用需對特殊駕乘場景進行相應(yīng)
2、適配。 在語音交互在車端應(yīng)用過程中,ASR(包含信號輸入、降噪以及音素選取等流程)、NLP(包含NLU與NLG,涉及詞性標(biāo)注與文本信息處理)、 TTS(包含語音的后端拼接合成,同時也是語音擬人化核心環(huán)節(jié))成為三個關(guān)鍵環(huán)節(jié),同樣也是當(dāng)前行業(yè)發(fā)展仍需深耕的單點技術(shù)模塊。行業(yè)、技術(shù)與市場等多方因素驅(qū)動,語音交互車端應(yīng)用正處發(fā)展黃金期據(jù)億歐智庫預(yù)測在高級別自動駕駛功能落地前,駕駛員在駕駛過程中依然無法做到完全“解放雙手”。在當(dāng)前的“人機共駕”階段,語音交互 仍然是車內(nèi)最直接、最人性化、最安全的交互方式。 隨著語音交互技術(shù)的成熟,語音識別準(zhǔn)確率大幅提升,已為語音交互功能上車提供了技術(shù)驗證與支持,因此智能
3、AI科技企業(yè)開始紛紛加碼語音 交互在駕乘場景當(dāng)中的應(yīng)用與落地。 汽車用戶對于語音交互的需求與興趣高漲,驅(qū)動主機廠在語音交互功能上的智能化與差異化發(fā)展。語音交互車端應(yīng)用產(chǎn)業(yè)鏈錯綜復(fù)雜,供需界限趨于模糊中國語音交互車端應(yīng)用產(chǎn)業(yè)鏈可分為上游:數(shù)據(jù)/語料/標(biāo)注供應(yīng)商、語音芯片/模塊供應(yīng)商、云服務(wù)及架構(gòu)供應(yīng)商以及車企;中游:語音處理引 擎及應(yīng)用供應(yīng)商、平臺服務(wù)與整合供應(yīng)商;以及下游車企。 隨著語音交品產(chǎn)品智能化與差異化的發(fā)展,不同供應(yīng)商之間,產(chǎn)品與業(yè)務(wù)也逐漸產(chǎn)生交集,傳統(tǒng)自上而下的單一供應(yīng)關(guān)系也逐漸轉(zhuǎn)變?yōu)楹献髋c 共建關(guān)系。車企作為產(chǎn)業(yè)鏈下游與需求方,在自研發(fā)展過程中,同樣擔(dān)當(dāng)了供給方的角色。中國語音交互
4、車端應(yīng)用產(chǎn)業(yè)圖譜智能語音處理引擎及應(yīng)用供應(yīng)商位于產(chǎn)業(yè)鏈中游,作為上游的需求方,業(yè)務(wù)范圍逐漸向上延展;作為下游的供應(yīng)方,合作模式逐漸向下深入。 隨著產(chǎn)業(yè)鏈中游企業(yè)的業(yè)務(wù)發(fā)展向上延展與向下深入,產(chǎn)業(yè)鏈上中下游的邊界趨于模糊,產(chǎn)業(yè)競爭結(jié)構(gòu)正在發(fā)生重組。2.語音交互車端應(yīng)用市場現(xiàn)狀與典型案例語音交互車端應(yīng)用市場持續(xù)增長,語音交互功能已成汽車座艙標(biāo)配語音交互車端應(yīng)用市場正在呈現(xiàn)出多元化的發(fā)展趨勢,本地+云端、ASR、NLP、TTS、多元化內(nèi)容及服務(wù)生態(tài)都在持續(xù)快速升級。經(jīng)億歐智庫 測算,2021年中國語音交互車端應(yīng)用的市場規(guī)模為22.2億元,2022年預(yù)計可以到達25.1億元,2019年-2022年復(fù)合
5、增長率達到20.8%。 2021年中國新發(fā)布乘用車當(dāng)中,語音交互功能在座艙內(nèi)的滲透率已經(jīng)位于第4位,高達86%。顯然,語音交互功能已經(jīng)成為中國乘用汽車座艙 內(nèi)的標(biāo)配功能。主機廠、智能AI科技企業(yè)與互聯(lián)網(wǎng)科技企業(yè)合作助推市場發(fā)展隨著中國語音交互車端應(yīng)用市場規(guī)模的增大以及車內(nèi)語音交互功能的滲透率提升,越來越多的供應(yīng)商紛紛瞄準(zhǔn)了這一存在巨大潛力的市場。 中國語音交互車端應(yīng)用市場參與主體根據(jù)企業(yè)特征可以劃分為三類:產(chǎn)業(yè)下游選擇自研或半自研發(fā)展路線的主機廠,如“蔚小理”等;細分種 類繁多的智能AI科技企業(yè),這當(dāng)中專注語音交互的AI處理引擎供應(yīng)商與平臺服務(wù)商為主要參與主體,如科大訊飛,思必馳、博泰車聯(lián)網(wǎng)等
6、;具 有生態(tài)優(yōu)勢的互聯(lián)網(wǎng)科技企業(yè),如華為、騰訊、阿里、百度等。主機廠篇新勢力注重產(chǎn)品智能化與差異化的可持續(xù)發(fā)展,傳統(tǒng)車企追求方案性價比對于語音交互功能的理解與發(fā)展模式,造車新勢力與傳統(tǒng)車企有各自不同的考量因素與決策方向。 對于造車新勢力而言語音交互產(chǎn)品是其打造品牌差異化的重要利器,自研框架可以幫助主機廠更靈活地定制各種不同的功能,擁有不受制于供 應(yīng)商的開放能力,實現(xiàn)長久可持續(xù)發(fā)展;對于傳統(tǒng)車企而言,語音交互產(chǎn)品的差異化與智能化并非是其吸引用戶的關(guān)鍵因素,因此采用相對高 性價比,低投入的通用方案是其所青睞的發(fā)展方向。頭部造車新勢力傾向自研路線,產(chǎn)品智能化較傳統(tǒng)車企存在一定優(yōu)勢造車新勢力將語音交互
7、功能作為其產(chǎn)品智能化與差異化的核心體現(xiàn),因此通常會選擇自研搭建智能語音技術(shù)框架,以提高智能語音助手的功能 迭代與優(yōu)化的頻率以及便捷性。從當(dāng)前各車企語音交互功能的智能化配置來看,造車新勢力的語音交互功能的智能化水平依然存在一定優(yōu)勢。 傳統(tǒng)主機廠通常選擇外部合作的發(fā)展模式,但頭部的傳統(tǒng)主機廠也開始逐漸發(fā)力,全雙工、多音區(qū)覆蓋等核心功能也已搭載上車。小鵬首創(chuàng)全系統(tǒng)功能覆蓋、連續(xù)對話等多功能,優(yōu)秀智能化表現(xiàn)成其標(biāo)簽小鵬在產(chǎn)品設(shè)計上,基于全車揚聲器分布,推出的全系統(tǒng)功能覆蓋、連續(xù)對話等多種行業(yè)首創(chuàng)功能為其取得行業(yè)領(lǐng)先地位,符合其極客定位。 對于語音交互功能的更新迭代也通過“OTA+云端”的高頻迭代方式,
8、實現(xiàn)用戶無感情況下的語音助手優(yōu)化。智能語音交互助手小P更像是用戶專屬的助理與朋友,通過定制裝扮、多種音色選擇與定制化語音暗號建立小P與客戶的獨有聯(lián)系。之后小鵬將 繼續(xù)優(yōu)化提升語音交互的基礎(chǔ)能力與語音包與應(yīng)用場景的豐富度,同時也將座艙內(nèi)部分語音相關(guān)的軟件應(yīng)用通過“軟件收費”的方式進行開放。蔚來賦予NOMI具有情感的擬人化形象,助其成為“蔚來的靈魂”蔚來智能語音交互助手NOMI,源于蔚來對于語音交互體驗的理解“Know me”,其集成了語音交互系統(tǒng)和智能情感引擎,被賦予了具有感 情的擬人化形象,使蔚來的汽車產(chǎn)品從機器演變成了具有生命的駕乘伙伴 。蔚來的NOMI智能語音交互助手的語音技術(shù)是在科大訊飛
9、的支持基礎(chǔ)上進行了個性化設(shè)計與改造。NOMI聽音辨位、免打擾獨立音區(qū)交互等功 能,可幫助其后排乘客進行語音交互的體驗。理想智能語音交互產(chǎn)品“理想同學(xué)”另辟蹊徑,產(chǎn)品定位契合車型定位理想智能語音交互助手“理想同學(xué)”的產(chǎn)品定位完美契合理想ONE中高端家庭用車的車型定位,以全車語音覆蓋、座艙全成員平等交互權(quán)利等 特點,滿足家庭出行場景的語音交互需求。 理想同學(xué)基于其產(chǎn)品用戶畫像,深耕4音區(qū)以及開拓多音區(qū)覆蓋,使車內(nèi)所有人員均可通過語音進行人機交互,同時也將從整車交互的角度進行 場景化的思考,貼合家庭出行用戶使用習(xí)慣。傳統(tǒng)車企亦有亮點表現(xiàn),聚合力與適配力成為其打造產(chǎn)品力的關(guān)鍵因素不同于新勢力的自研發(fā)展
10、路線與產(chǎn)品個性化定位,傳統(tǒng)車企通常選擇合作的方式發(fā)展語音交互相關(guān)業(yè)務(wù)。 目前,部分較為開放的傳統(tǒng)車企已經(jīng)摒棄整包的一體化解決方案,而是選擇接受不同供應(yīng)商的服務(wù)。傳統(tǒng)車企需要將各個領(lǐng)域最優(yōu)秀的技術(shù)整 合在一起,完成個性化的語音產(chǎn)品設(shè)計,更好地賦能其提升跨垂類生態(tài)打通的靈活度。在此過程中,車企的強大的聚合能力與適配力成為核心 競爭力。智能AI科技企業(yè)篇行業(yè)巨頭憑技術(shù)優(yōu)勢已俘獲眾多客戶,新秀企業(yè)持性價比與定制化奮起直追AI科技類企業(yè)數(shù)量眾多且競爭激烈,有已經(jīng)深耕車載語音交互多年的行業(yè)巨頭,也有伴隨著汽車智能化發(fā)展浪潮涌現(xiàn)出來的行業(yè)新秀。 于科大訊飛、思必馳、云知聲等行業(yè)巨頭而言,其客戶涵蓋范圍廣泛,
11、產(chǎn)品技術(shù)水平與業(yè)務(wù)涵蓋范圍是其可以占據(jù)高市占率的核心優(yōu)勢,但對 于眾多客戶而言,無法全部提供高定制化的解決方案。而對于語音交互車端應(yīng)用市場的行業(yè)新秀,產(chǎn)品的價格優(yōu)勢與極具定制化的解決方案成 為吸引客戶的關(guān)鍵因素。智能AI語音行業(yè)巨頭以技術(shù)服務(wù)立足,客戶需求加速其多元化發(fā)展以科大訊飛為首的AI智能語音行業(yè)巨頭依托自身單點功能模塊的技術(shù)優(yōu)勢在語音交互車端應(yīng)用行業(yè)中占據(jù)優(yōu)勢,同時在用戶需求、客戶需求、 行業(yè)發(fā)展以及技術(shù)發(fā)展的驅(qū)動下逐漸從單一的智能語音技術(shù)服務(wù)商轉(zhuǎn)型為全方位人工智能技術(shù)服務(wù)商。目前科大訊飛與思必馳已累積多家車企客戶,而云知聲則主要通過與車載應(yīng)用開發(fā)商以及車企孵化的Tier0.5進行合作
12、,間接布局語音交互車端 應(yīng)用的市場。行業(yè)巨頭技術(shù)差距逐漸縮小,定制化服務(wù)與性價比亦是企業(yè)關(guān)注焦點科大訊飛、思必馳與云知聲三家企業(yè)作為國產(chǎn)AI智能語音科技公司的優(yōu)秀代表,各自均有不同維度的優(yōu)勢。 在技術(shù)層面,通過MOS評分的方式進行多維度對比;在降噪處理、語音自然度、相似度、準(zhǔn)確率、可懂度、種類以及可離線程度等技術(shù)維度, 科大訊飛依然存在不同程度的優(yōu)勢。其中,降噪處理、語音相似度、準(zhǔn)確率以及可懂度,三家企業(yè)已無明顯的技術(shù)差距。 在價格與定制化服務(wù)層面,通過行業(yè)訪談與公開資料分析,可見思必馳在價格層面具有一定優(yōu)勢,而云知聲則通過優(yōu)秀的定制化服務(wù)能力打造 業(yè)內(nèi)口碑??拼笥嶏w算法與硬件深度融入,數(shù)據(jù)與
13、技術(shù)成為其立足根本大訊飛自2011年發(fā)布第一代智能汽車語音助理至今,以其AI技術(shù)、軟件質(zhì)量、數(shù)據(jù)積累以及定制化服務(wù)能力等各方面優(yōu)勢取得了當(dāng)前中國語 音交互車端應(yīng)用行業(yè)的領(lǐng)先位置。 科大訊飛未來將持續(xù)深耕軟硬件結(jié)合的發(fā)展模式,充分發(fā)揮其AI優(yōu)勢融合特殊芯片,控制成本,為低配車型提供高性價比的解決方案。同時利 用自身快速集成與開發(fā)的能力優(yōu)勢以滿足客戶快速更新需求。新秀企業(yè)來勢洶洶,性價比優(yōu)勢與多元化發(fā)展模式為破局思路車內(nèi)智能語音交互隨著自動駕駛功能的發(fā)展逐漸成為剛需,行業(yè)已經(jīng)進入發(fā)展黃金時期。眾多車載AI智能語音新秀企業(yè)入局,其中不乏主機廠 孵化的車載語音科技公司,以及將車載場景應(yīng)用作為新業(yè)務(wù)領(lǐng)域
14、拓展的AI智能語音科技公司。 相較于科大訊飛這類在行業(yè)深耕多年的老玩家,新秀企業(yè)以單點功能的極致技術(shù)、性價比更高的解決方案以及更具創(chuàng)新的合作模式,在行業(yè)內(nèi) 展露鋒芒。平臺服務(wù)供應(yīng)商為主機廠提供解決方案,單點功能模塊的集成適配成主流無論是選擇自研技術(shù)框架的造車新勢力,還是通過外部合作提升語音交互體驗的傳統(tǒng)主機廠,都希望可以集各家之所長,將行業(yè)內(nèi)最領(lǐng)先的單 點功能模塊搭載于自家語音交互產(chǎn)品當(dāng)中,適配各個不同的操作系統(tǒng)??梢酝ㄟ^語音來實現(xiàn)全鏈條打通的基礎(chǔ)平臺服務(wù)商為其提供了解題思路。 對于傳統(tǒng)主機廠而言,一個完整的研發(fā)體系與一個具有可配置能力的語音平臺,可以為其提供一個更加開放、更加多樣化以及更加定
15、制化的語 音交互解決方案,軟件能力不足的劣勢也可以通過這類平臺服務(wù)與整合供應(yīng)商的產(chǎn)品進行彌補?;ヂ?lián)網(wǎng)科技企業(yè)篇數(shù)據(jù)積累與應(yīng)用生態(tài)賦能語音交互,互聯(lián)網(wǎng)企業(yè)平臺之戰(zhàn)已開始相較于智能AI語音公司與主機廠,以BAT為首的互聯(lián)網(wǎng)科技企業(yè)擁有更多用戶數(shù)據(jù)與流量,更加了解用戶習(xí)慣,同時憑借其完善的生態(tài)應(yīng)用、 齊全的鏈條服務(wù)打入語音交互在車端的應(yīng)用市場。 自2015年阿里與上汽聯(lián)手孵化了車載平臺斑馬網(wǎng)絡(luò)之后,百度與騰訊已陸續(xù)進行了車載智能語音業(yè)務(wù)的相關(guān)布局。車載智能語音的競爭,一方 面是由AI智能語音科技公司為參與主體的更強的大數(shù)據(jù)處理和學(xué)習(xí)能力的競爭,另一方面,隨著BAT的入局,平臺之戰(zhàn)也已經(jīng)開始。斑馬具備
16、產(chǎn)品代差優(yōu)勢,自研+多供應(yīng)商結(jié)構(gòu)提供優(yōu)質(zhì)服務(wù)及豐富創(chuàng)新斑馬成立于2015年,業(yè)務(wù)布局較早。2016年開始發(fā)力語音交互產(chǎn)品,前期借力阿里達摩院IDST語音全線資源,自建技術(shù)框架,接入阿里部分 語音能力,2018年后為維持斑馬語音持續(xù)迭代能力,引入思必馳、科大訊飛等供應(yīng)商。 前期斑馬語義交互產(chǎn)品更新以云端+OTA為主,雖然當(dāng)前語音產(chǎn)品更新與整車OTA同步進行,但斑馬語音交互產(chǎn)品與其他互聯(lián)網(wǎng)科技企業(yè)已形成 代差優(yōu)勢,并通過T+1框架實現(xiàn)云端豐富且快速的語音功能創(chuàng)新。DuerOS語音解決方案+鴻鵠語音芯片,百度“軟+硬”布局語音交互百度DuerOS智能車載解決方案,是DuerOS針對前裝車機、車載導(dǎo)航
17、儀、智能后視鏡、行車記錄儀等車載設(shè)備打造的智能語音解決方案,針對 車端語音交互解決方案上識別不準(zhǔn)確、回復(fù)不智能、操作不方便等問題進行解決。百度同時打造的鴻鵠語音芯片是專門為車內(nèi)語音交互場景設(shè)計的超低功耗遠場語音交互芯片,具有遠場陣列信號實時處理、高精度超低誤報語 音喚醒、離線語音識別等核心能力。騰訊以智能平臺語音能力為基礎(chǔ),微信成為其交互車端應(yīng)用市場“殺手锏”騰訊語音交互車端應(yīng)用業(yè)務(wù)隨起步較晚,但基于其智能平臺的語音能力以及車載微信的強大吸引力與捆綁銷售的模式,依然成為車企選擇合作 的對象。目前,微信車載版在汽車出廠前已完成適配,而未適配車型暫不支持單獨下載安裝。針對語音交互產(chǎn)品,騰訊已基本具
18、備自研能力,目前僅部分業(yè)務(wù)模塊選擇與科大訊飛、思必馳等供應(yīng)商合作。未來騰訊也將繼續(xù)深耕自研發(fā)展 路線,將提高基礎(chǔ)能力體驗為發(fā)展核心,基于用戶ID,逐漸提升語料泛化能力與打造虛擬化語音形象。市場總結(jié)主機廠與供應(yīng)商發(fā)展模式持續(xù)多樣化,良好契合度成為合作開展機會點語音業(yè)務(wù)目前對于功能的更新與迭代要求比較高,主機廠與供應(yīng)商的發(fā)展模式更加開放,因此傳統(tǒng)的車企與供應(yīng)商單一項目制供應(yīng)關(guān)系不適用 于當(dāng)前的語音交互業(yè)務(wù)。取而代之的新型合作模式需要供應(yīng)商與車企之間達成長期戰(zhàn)略合作。 在當(dāng)前業(yè)務(wù)合作過程中,主機廠銷量不足使其很難獲得較大的價格優(yōu)惠,而供應(yīng)商定制化服務(wù)能力不足也已成為普遍痛點。 因此,對于供應(yīng)商而言,
19、目前正處于擴充市場份額的最佳時段。供應(yīng)商在提升自身底層技術(shù)的同時,需要針對不同量級客戶提供定制化且具有 性價比的解決方案,力爭與主機廠形成良好的合作契合度,從而達成長久的戰(zhàn)略合作關(guān)系。3.語音交互車端應(yīng)用發(fā)展趨勢預(yù)測趨勢一:多模交互、主動交互、情感化交互將成車載交互2.0典型特征當(dāng)前用戶已經(jīng)可以通過語音做垂類領(lǐng)域信息查詢以及基礎(chǔ)車輛控制等功能交互,但仍有諸多問題尚未解決。未來人工智能、大數(shù)據(jù)以及云平臺 的發(fā)展將推動多模交互、生物識別以及高級語音交互的實現(xiàn),車載智能交互將升級至2.0版本。 車載智能交互2.0的演變過程中,高級語音交互隨之而來。隨著虛擬語音助手的普及,車內(nèi)語音交互也將與其他模態(tài)進行融合,為用戶提供更加 形象化、情感化以及主動性的人機交互體驗。趨勢二:聲紋識別+視覺交互將提供抑制冗余,避免交互安全隱患未來汽車將成為可移動的巨型手機,人機交互將由車內(nèi)逐漸向車外延伸,主機廠在追求極致智能化體驗
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 個人借款延期協(xié)議二零二五年
- 二零二五企事業(yè)單位保安聘用合同
- 影視劇導(dǎo)演聘用合同范文
- 車輛安全協(xié)議書模板
- 醫(yī)療質(zhì)量管理培訓(xùn)課件
- 醫(yī)學(xué)基礎(chǔ)知識臨床應(yīng)用試題及答案
- qq管理制度可復(fù)制
- 郵政信息安全管理制度
- 門診預(yù)約診療管理制度
- 超市冷鏈設(shè)備管理制度
- 鎮(zhèn)咳藥和祛痰藥
- 食品營養(yǎng)與健康職業(yè)規(guī)劃
- 《學(xué)風(fēng)建設(shè)主題班會》課件
- 字母認主協(xié)議書(2篇)
- 醫(yī)院保潔員培訓(xùn)內(nèi)容
- 心理護理的溝通與技巧
- 學(xué)校產(chǎn)教融合實訓(xùn)基地項目可行性研究報告
- 每日消防巡查記錄表
- 《汽車常見維護與修理項目實訓(xùn)教程》-教案
- 2024年河北高中學(xué)業(yè)水平合格性考試歷史試題真題(含答案)
- 心血管內(nèi)科介入管理制度、崗位職責(zé)及工作流程
評論
0/150
提交評論