云知聲-語音解決方案_第1頁
云知聲-語音解決方案_第2頁
云知聲-語音解決方案_第3頁
云知聲-語音解決方案_第4頁
云知聲-語音解決方案_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

云知聲智能語音交互應(yīng)用

321云知聲公司簡介聲紋識別技術(shù)介紹語音識別技術(shù)介紹語音識別技術(shù)介紹1.技術(shù)領(lǐng)先2.持續(xù)學(xué)習(xí)3.私有部署國內(nèi)首批公共語音云服務(wù)提供商(2012年9月)國內(nèi)首家基于深度神經(jīng)網(wǎng)絡(luò)(DNN)的語音云服務(wù)(2013年1月)業(yè)界最高的語音識別準(zhǔn)確率(>96%)業(yè)界最快的語音識別響應(yīng)速度(<0.15倍實時)業(yè)界最經(jīng)濟高效的服務(wù)支持能力(單臺服務(wù)器支持>80路并發(fā)轉(zhuǎn)寫)領(lǐng)先而極具特點的語音技術(shù)4語音合成具有極高自然度與可懂度的中英文語音合成技術(shù)。超過30個領(lǐng)域的自然語言理解技術(shù),讓機器理解人說的話。語義理解(NLU)語音識別與轉(zhuǎn)寫國際領(lǐng)先的中文語音識別與轉(zhuǎn)寫技術(shù),包括基于服務(wù)器的在線識別以及基于終端設(shè)備的離線識別。完全自有知識產(chǎn)權(quán)完善的技術(shù)圖譜5抗噪特征提取精準(zhǔn)數(shù)據(jù)建模高效識別引擎獨創(chuàng)的語音增強、信道及說話人規(guī)整技術(shù),有效抑制環(huán)境噪聲干擾,極大地提高了語音識別在各種復(fù)雜環(huán)境下的準(zhǔn)確率。高效的數(shù)據(jù)利用效率:為達到相同識別率,只需要使用業(yè)界平均水平的1/3的訓(xùn)練數(shù)據(jù)量。業(yè)內(nèi)最高效的識別引擎,在具備高精度識別性能前提下,識別速度是同類產(chǎn)品的三倍以上。三大技術(shù)創(chuàng)新針對移動互聯(lián)環(huán)境下語音識別技術(shù)所面臨的問題,不斷進行技術(shù)改進,用最少的訓(xùn)練樣本達到業(yè)內(nèi)最佳的識別精度以及最高效的識別速度(領(lǐng)先對手三倍)。6部署方式私有云公有云PC端移動端一套私有云支持多種客戶端應(yīng)用聲紋識別技術(shù)1.聲紋識別介紹2.支持多個平臺3.參與測評語音檢測噪聲抑制特征提取聲紋模型聲紋匹配聲紋注冊聲紋確認(rèn)/辨認(rèn)相似度得分通過人不同的聲紋鑒別人的身份,實現(xiàn)賬號登錄聲紋識別技術(shù)對比文本無關(guān)文本相關(guān)語音內(nèi)容注冊、識別語音內(nèi)容不受限制注冊、識別語音內(nèi)容相同語音長度為保證性能,一般要求注冊不少于30s,測試不少于10s較短,2s~5s即可應(yīng)用場景遠(yuǎn)程后臺監(jiān)控,海量數(shù)據(jù)搜索聲紋密碼聲紋識別按照文本內(nèi)容是否受限制,分為兩類:聲紋識別分類支持平臺NIST全球話者識別評測美國國家標(biāo)準(zhǔn)技術(shù)署(NIST)舉辦著多項計算機領(lǐng)域的最高水平評測項目,幾乎每一項都代表著該領(lǐng)域的世界頂尖水平。聲紋識別評測(SpeakerRecognitionEvaluation,SRE),是NIST正在進行的評測項目中歷史最悠久,參加單位最多,重要性最高的項目之一。是全球影響力最大的、最權(quán)威的聲紋識別技術(shù)評測,是對全球相關(guān)研究機構(gòu)學(xué)術(shù)及技術(shù)水平的一次公開公平的檢驗。歷屆參賽單位摘要幾十家國內(nèi)外著名高校、研究所、公司,如麻省理工學(xué)院(MIT)、卡耐基梅隴大學(xué)(CMU)、斯坦福(Stanford)、IBM、微軟、摩托羅拉、PerSay,清華、中科院聲學(xué)所、中國科大、LPT(意大利Loquendo公司)、CRIM、Brno(布爾諾科技大學(xué))等。團隊歷屆成績一覽NIST聲紋識別評測始于1996年,我們團隊自2002年起(國內(nèi)最早)第一次參加NIST評測開始,一直積極參加聲紋識別評測,與國內(nèi)外頂尖的高校、科研機構(gòu)、公司交流學(xué)習(xí)。比賽成績一直在國內(nèi)保持第一,國際上也處于領(lǐng)先水平。2002、2008、2010年和2012年,獲多項全球第一。年份成績2002第一次參加就獲得第一(金星獎)20042項第一、4項第二20052項第一、2項第二2008總名次第一2010總名次第一2012總名次第一NISTSRE08縱軸指標(biāo)越低越好我們團隊MITPersay斯坦福中科院自動化所IBM清華大學(xué)NIST10參賽單位數(shù)量和質(zhì)量均創(chuàng)歷史之最。國內(nèi)外報名單位達五十多家,如斯坦福、麻省理工學(xué)院、IBM、香港中文大學(xué)、意大利都靈理工大學(xué)、科大訊飛、清華、中科院聲學(xué)所、卡耐基梅隴大學(xué)等。所有參賽單位共提交了109個系統(tǒng)。歷屆評測活動中數(shù)據(jù)規(guī)模最大、信道交叉種類最多,難度最高。斯坦福MIT中科院聲學(xué)所CRIM清華大學(xué)香港中文大學(xué)我們團隊NISTSRE10

單位名稱子任務(wù)1子任務(wù)2子任務(wù)3子任務(wù)4子任務(wù)5子任務(wù)6子任務(wù)7子任務(wù)8我們團隊第一名第一名第一名第2名第4名第6名第一名第一名斯坦福97511128意大利都靈理工大學(xué)26652833MIT電腦及人工智能實驗室23133323971517美國馬里蘭大學(xué)1611131320152522中科院聲學(xué)所363782910142221香港中文大學(xué)313317731262015IBM研究中心34322357163840清華大學(xué)電子工程系3741463637233535浙江大學(xué)計算機學(xué)院4444404442414141云知聲聲紋識別最新性能相比2010年系統(tǒng)加入最新的噪聲抑制和VAD算法加入最新的模型構(gòu)建及失配補償技術(shù)iVector+lengthNormalization+Variance-SpectraNormalization+PLDANIST2010core-extenddet5(tel)NISTSRE12官方結(jié)果斯坦福我們團隊cogent清華3浙大中科院聲學(xué)所Nuance+LPT清華1訊飛騰訊清華2IBM香港理工清華深圳研究院云知聲公司介紹1.成長最快的語音企業(yè)2.完整的產(chǎn)品體系

3.卓越的技術(shù)研發(fā)和創(chuàng)新能力專注于語音交互所有技術(shù)、產(chǎn)品與服務(wù)均圍繞著語音識別與語音交互,是最專業(yè)的語音交互技術(shù)服務(wù)提供商。依托于移動互聯(lián)網(wǎng),了解用戶通過智能語音云對用戶極為了解,包括用戶的口音、性別、說話習(xí)慣、使用環(huán)境等。等。打破壟斷、高速發(fā)展云知聲成立不到兩年,被譽為行業(yè)鯰魚,打破壟斷格局,高速發(fā)展,合作伙伴超過6000家。最專業(yè)的語音交互服務(wù)提供商云知聲成立于2012年6月29日??偛课挥诒本?,在上海、深圳設(shè)有分公司和辦事處。目前云知聲已推出了一系列語音識別服務(wù)中間件和語音識別服務(wù)云平臺,廣泛應(yīng)用在移動互聯(lián)網(wǎng)、智能家電、可穿戴設(shè)備、車載導(dǎo)航、醫(yī)療、教育、呼叫中心等領(lǐng)域,為企業(yè)和用戶提供專業(yè)的語音識別服務(wù)。21云知聲人是一支多元化的團隊,年輕富有活力?;A(chǔ)研發(fā)工程師80%擁有博士學(xué)位,多人具有超過十年的研發(fā)和應(yīng)用經(jīng)驗。產(chǎn)品和市場運營人員來自國內(nèi)外知名互聯(lián)網(wǎng)企業(yè)。公司成立不到500天,完成1億人民幣的A輪融資。云知聲語音云已有超8000家合作伙伴,覆蓋互聯(lián)網(wǎng)、智能家電、車載導(dǎo)航、智能穿戴、在線教育、智能客服、智能芯片等眾多領(lǐng)域。領(lǐng)先的識別性能、穩(wěn)定的識別服務(wù)、便捷的技術(shù)支持、快速增長的合作伙伴。云知聲和您一起共贏。實力雄厚,發(fā)展迅速多元化團隊1億8000家22專業(yè)所有技術(shù)、產(chǎn)品與服務(wù)均圍繞著語音識別與語音交互,是最專業(yè)的語音交互技術(shù)服務(wù)提供商創(chuàng)新開放共贏依托于移動互聯(lián)網(wǎng),模式創(chuàng)新不限領(lǐng)域、不限形態(tài)、不限商業(yè)模式和合作伙伴一起,攜手共贏23超大用戶容量支持億級用戶規(guī)模億級平臺健壯穩(wěn)定>99.99%服務(wù)可用性>99.99%快速響應(yīng)3G/WIFI下平均響應(yīng)100ms<100ms語音識別占用極低流量<2KB/s<2KB/s語音平臺性能卓越通用汽車以上展示僅為部分成功案例

傳統(tǒng)企業(yè)智能終端移動互聯(lián)網(wǎng)

移動

應(yīng)用基于語音云的示例應(yīng)用——云知聲語音輸入法應(yīng)用場景:移動互聯(lián)網(wǎng)-智能語音輸入軟件功能特點:語音識別準(zhǔn):平均準(zhǔn)確率超過95%;離線語音識別:信號不好或無網(wǎng)絡(luò)時用戶可自由切換到離線識別,有較高的識別率保證;支持多語種:可識別普通話、英語、粵語三種語言;識別反應(yīng)快:Wi-Fi或3G下幾乎實時返回識別結(jié)果;語音輸入快:每分鐘輕松輸入200-300字,非語音輸入方式望塵莫及;不怕有口音:完美識別標(biāo)準(zhǔn)普通話及有口音的普通話;超省流量:輸入100字只需要20-40kB流量,1M流量可輸入2500字;自動加標(biāo)點:智能引擎根據(jù)用戶輸入內(nèi)容為用戶添加必要的標(biāo)點符號;掃碼即刻下載使用26

移動

應(yīng)用聯(lián)想樂云記事應(yīng)用場景:移動互聯(lián)網(wǎng)-智能云筆記軟件功能描述:樂云記事是聯(lián)想推出的萬能記事本。結(jié)合文字、拍照、錄音等,全方位記錄您的生活、工作或?qū)W習(xí)。語音自動識別成文字,讓手機聽懂你,化身小助理。記錄安全保存云端,手機、電腦一樣看。應(yīng)用特點:云知聲為樂云記事提供智能語音解決方案。顛覆以往云記錄應(yīng)用的錄音功能,錄音的同時即可轉(zhuǎn)為文字,語義識別,識別用戶想做的事,自動設(shè)為代辦事項,并進行提醒。掃碼即刻下載使用27

移動

應(yīng)用杏樹林-病歷夾應(yīng)用場景:智能醫(yī)療、電子病歷功能描述:能有效幫助醫(yī)生快速記錄病歷,把醫(yī)生朋友從“病歷?!敝薪夥懦鰜?,有更多的時間和精力用于問診和學(xué)習(xí)節(jié)省寶貴的人力成本,提高生產(chǎn)力。應(yīng)用特點:云知聲研發(fā)的國內(nèi)醫(yī)學(xué)領(lǐng)域首個語音識別引擎針對醫(yī)學(xué)數(shù)據(jù)庫(數(shù)百萬的醫(yī)學(xué)專有名詞、數(shù)千小時的語料積累、極其復(fù)雜的中英文混合表述方式)做了大量模型優(yōu)化對醫(yī)學(xué)專業(yè)內(nèi)容的一次性識別率達到93%,同時輔以云端語義校正技術(shù),整體識別率接近100%掃碼即刻下載使用28

智能

電視樂視超級電視應(yīng)用場景:智能電視、電視盒子,顛覆你的客廳功能描述:通過超級遙控器的語音功能,讓你無需動手也能遙控電視。海量視頻,拋開復(fù)雜拼音輸入,所說即所得。更多功能隨心語控,輕松換臺、調(diào)節(jié)音量、看節(jié)目單、了解天氣、查看股票,只動嘴、無需動手。應(yīng)用特點:云知聲和你一起擁抱智能化、信息化、智慧化的家電時代顛覆了傳統(tǒng)操作體驗,真正把互聯(lián)網(wǎng)和智能語音“植入”進電視里完美支持iPhone,Android手機與電視連接,任何空閑時間、任何地點都可以追劇。29

智能

電視樂視語音助手應(yīng)用場景:智能電視、電視盒子,顛覆你的客廳功能描述:電視也能玩Siri!智能語音輸入,無需動手也能操控超級電視。電視上也能通過語音發(fā)微博、查股票、搜影視、調(diào)音量、看節(jié)目、查天氣。應(yīng)用特點:對電視進行常用的操作,無論上網(wǎng)與否都能實現(xiàn)語音控制。30智能車載通用汽車應(yīng)用場景:智能車載功能描述:NGI車載平臺基于WIFI熱點向用戶提供互聯(lián)網(wǎng)服務(wù)。應(yīng)用特點:云知聲為NGI車載平臺所有智能應(yīng)用提供語音交互支持提供語音識別及語音合成兩套方案基于WebService提供服務(wù),系統(tǒng)集成及其簡單提供靈活及高效率的語音壓縮及傳輸方案31智能車載奔騰ARS車載智能終端應(yīng)用場景:智能車載功能描述:導(dǎo)航相關(guān):“我要去陸家嘴”,“我要找最近的加油站”生活信息服務(wù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論