中國(guó)智能語(yǔ)音交互產(chǎn)品分析_第1頁(yè)
中國(guó)智能語(yǔ)音交互產(chǎn)品分析_第2頁(yè)
中國(guó)智能語(yǔ)音交互產(chǎn)品分析_第3頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、晚上和同事聊了會(huì)天,感覺(jué)精神挺好的,寫下這篇文章記錄自己的一些思想 目前語(yǔ)音交互被市場(chǎng)炒的火熱,大小公司做此類產(chǎn)品的層出不窮,首先我覺(jué)得要感謝 siri 給 大家做了這么好的平臺(tái)建設(shè), 其實(shí)縱觀計(jì)算機(jī)領(lǐng)域, 語(yǔ)音交互這一塊是起起伏伏, 總是隔幾 年就會(huì)被炒火一次,可是火不了一段時(shí)間又消沉了。 siri 的到來(lái),貌似給大家的感覺(jué)是語(yǔ)音 時(shí)代已經(jīng)到來(lái)了,而且很快會(huì)才成為人們的用戶行為習(xí)慣了??墒遣恢来蠹矣袥](méi)有真正想過(guò)siri ?它的優(yōu)勢(shì)、技術(shù)核心是什么?以下是我自己的一些理解:從前臺(tái)和后臺(tái)來(lái)分析 siri,前臺(tái)分為UI界面以及語(yǔ)音設(shè)別。Siri采用Nuanee的語(yǔ)音設(shè)別和語(yǔ) 義合成技術(shù), 類似中

2、國(guó)的科大訊飛。 這個(gè)東西需要一批牛人積累多年才能生產(chǎn)出來(lái), 什么信 號(hào)處理、模式識(shí)別、概率統(tǒng)計(jì)、信息論、數(shù)據(jù)挖掘、人體聽(tīng)覺(jué)機(jī)理、人工智能等等計(jì)算機(jī)、 數(shù)學(xué)、統(tǒng)計(jì)學(xué)、生物領(lǐng)域 nb 的技術(shù)都得用上,這個(gè)沒(méi)有什么好說(shuō)的了。后臺(tái)即為語(yǔ)義識(shí)別 技術(shù),這一塊其實(shí)是技術(shù)的核心點(diǎn),我不知道這些技術(shù)全是SRI自己研究出來(lái)的,還是借鑒了其他搜索類公司的技術(shù)。但是不論如何,這一塊都是一個(gè)核心地方。其實(shí),這一塊的技術(shù)就是幾大搜索類公司的核心技術(shù)。一是以 google 和百度為代表的網(wǎng)頁(yè)搜索技術(shù),二是以 wolfarm alpha 為代表的知識(shí)計(jì)算技術(shù),三是 wikipedia 為代表的人工知識(shí)庫(kù)技術(shù)。網(wǎng)頁(yè)搜索 通過(guò)

3、網(wǎng)絡(luò)機(jī)器人獲取每個(gè)科訪問(wèn)網(wǎng)站的內(nèi)容, 這些數(shù)據(jù)被分解成一個(gè)索引, 這樣便可以根據(jù) 內(nèi)容來(lái)查找頁(yè)面, 用戶輸入一個(gè)查詢, 查找索引找到相關(guān)內(nèi)容的頁(yè)面, 返回的為相關(guān)內(nèi)容的 列表; 知識(shí)計(jì)算技術(shù), 是將所有可以獲得信息建立成一個(gè)有組織的數(shù)據(jù)庫(kù),然后再利用算法進(jìn)行處理,最終構(gòu)造成類似與 google 這樣的搜索工具。其實(shí)說(shuō)白了就和百度前幾年一直鼓 吹的框計(jì)算一樣, 只要把東西放到框內(nèi), 什么東西都可以給你解決。 例如你在百度輸入天氣, 它會(huì)顯示你所在城市的天氣情況, 而不是以往常的網(wǎng)頁(yè)形式展現(xiàn)。 知識(shí)計(jì)算技術(shù)給出的答案 更加精確,更加的唯一性;人工知識(shí)庫(kù)技術(shù),以維基百科為例,它采用詞條和主題為單位,

4、 利用人工的力量收集知識(shí)。 因此這樣的知識(shí)結(jié)構(gòu)化程度高, 更加準(zhǔn)確并且人性化, 可同時(shí)它 的知識(shí)體系會(huì)受到限制。 Siri 結(jié)合三項(xiàng)搜索類技術(shù),根據(jù)不同的需要,利用相應(yīng)的技術(shù)給出 答案。 其實(shí)網(wǎng)上經(jīng)常大家說(shuō)的人工智能、 上下文識(shí)別、自動(dòng)學(xué)習(xí)技術(shù), 這些都包含在這三項(xiàng) 搜索技術(shù)里面了, 仔細(xì)想想這些搜索是否會(huì)記憶人的行為模式、 是否會(huì)上下文識(shí)別語(yǔ)義、 是 否會(huì)人機(jī)智能交互。忘了, Siri 還有一個(gè)技術(shù)就是知識(shí)推薦技術(shù),類似于大眾點(diǎn)評(píng)、攜程這 樣的網(wǎng)站,查詢好吃的、機(jī)票之類的,會(huì)給出一個(gè)推薦結(jié)果。由于國(guó)外的很多類似軟件api是開(kāi)放的,所以 siri 在知識(shí)推薦這一塊等于利用這些開(kāi)放的 api 云

5、服務(wù)了。Siri 的優(yōu)勢(shì)我個(gè)人覺(jué)得有兩方面,一是語(yǔ)音交互,實(shí)現(xiàn)語(yǔ)音控制功能,這是人體本能機(jī)理的發(fā)展趨勢(shì),人類的控制欲很強(qiáng),肢體控制 聲音控制 腦電波控制。二是搜索方式, 想想如果用 google ,你搜索的步驟,在 google 輸入問(wèn)題 給出一推結(jié)果 一個(gè)個(gè)篩 選自己需要的結(jié)果 得出答案。而 siri 只有兩步,輸入問(wèn)題 得到結(jié)果。說(shuō)了這么一大段技術(shù)分析的話,只是為了更好的去思考國(guó)內(nèi)這些智能語(yǔ)音交互產(chǎn)品的未來(lái)。 據(jù)我所知,目前做這一塊的有訊飛語(yǔ)點(diǎn)、智能360、快說(shuō)、口袋語(yǔ)音、我問(wèn)問(wèn)、蟲洞助手、小 i 機(jī)器人、 009、開(kāi)心熊寶、小唐龍、云助理,還有小米手機(jī)自帶的語(yǔ)音助手,以及一系 列模仿 s

6、iri 的山寨類軟件。其中這些產(chǎn)品分為五類,1、訊飛語(yǔ)點(diǎn)、智能 360、快說(shuō)、口袋語(yǔ)音、我問(wèn)問(wèn)、蟲洞助手 2、小 i 機(jī)器人 3、009、開(kāi)心熊寶、小唐龍4、云助理 5、手機(jī)集成的語(yǔ)音助手以及山寨 siri。我針對(duì)每一類談一談自己的看法。第一類首先它的未來(lái)是死的, 除非有本質(zhì)性的改革。 從技術(shù)上來(lái)看, 目前這些產(chǎn)品采用的語(yǔ) 音識(shí)別和語(yǔ)義合成技術(shù)為訊飛、 谷歌、盛大等提供, 如果哪天訊飛要按照裝機(jī)量收費(fèi)了, 而 產(chǎn)品卻沒(méi)有盈利, 這些產(chǎn)品必然會(huì)成為訊飛語(yǔ)點(diǎn)的手下敗將, 可矛盾的是訊飛根本沒(méi)有精力 去不斷優(yōu)化訊飛語(yǔ)點(diǎn)(從訊飛語(yǔ)點(diǎn)的產(chǎn)品更新過(guò)程就可以看出來(lái)) ,畢竟訊飛的主要目的不 是在這一塊, 訊

7、飛語(yǔ)點(diǎn)只是讓別人知道訊飛有這么個(gè)東西而已。 語(yǔ)音技術(shù)暫且不談, 就上面 說(shuō)到的 siri 利用的三種搜索技術(shù),著實(shí)會(huì)讓這些產(chǎn)品望塵莫及。沒(méi)有一批計(jì)算機(jī)領(lǐng)域的頂尖 專家,在這一塊是很難有突破的。因此,這些產(chǎn)品的語(yǔ)義識(shí)別根本沒(méi)法能夠得到質(zhì)的突變, 只會(huì)隨著語(yǔ)料的不斷增加而越來(lái)越亂。 從產(chǎn)品上來(lái)看, 用戶的粘度不夠, 用戶過(guò)了新鮮期很 有可能會(huì)卸載掉。作為一款移動(dòng)應(yīng)用,如果沒(méi)有利用移動(dòng)、云、社交三個(gè)要素,死的可能性 極大。第二類是小 i 機(jī)器人,我很看好這個(gè)產(chǎn)品, 當(dāng)然我指的不是手機(jī)客戶端的那個(gè)小 i 機(jī)器人了。 小 i 機(jī)器人在語(yǔ)義識(shí)別這一塊在國(guó)內(nèi)是領(lǐng)先,我不知道小 i 是不是有很多專家,但是人家

8、多 年的經(jīng)驗(yàn)積累絕對(duì)是有很強(qiáng)大的技術(shù)背景。小 i 在產(chǎn)品展現(xiàn)方式上很簡(jiǎn)單,沒(méi)有特別的設(shè)計(jì) 和思路, 但是小 i 的市場(chǎng)思路確是特別的清晰。 小 i 機(jī)器人應(yīng)用在微博、 移動(dòng)、政府、 銀行、 運(yùn)營(yíng)商等等領(lǐng)域,作為智能機(jī)器人的形象來(lái)推廣??上攵?i 在語(yǔ)義識(shí)別技術(shù)上面的技 術(shù)積累有多雄厚。雖然比不上siri,但是它選擇的契機(jī)特別好,專注于各行業(yè)領(lǐng)域,找準(zhǔn)需要智能機(jī)器人的機(jī)會(huì),從而巧妙的相結(jié)合。不僅僅能滿足用戶需求,還有盈利??墒且灿袀€(gè) 問(wèn)題,如果后期等到國(guó)內(nèi)行業(yè)應(yīng)用類的 api 開(kāi)放了,再加上百度、谷歌等公司的介入,那么 小i還有盈利的空間嗎?第三類,是娛樂(lè)類的智能語(yǔ)音產(chǎn)品。009、開(kāi)心熊寶

9、、小唐龍,三者類似,以?shī)蕵?lè)化的形式展現(xiàn)產(chǎn)品,同時(shí)加入語(yǔ)音交互。給用戶的印象是,智能寵物。這樣的產(chǎn)品如果走線上的話, 結(jié)果很可能也會(huì)死, 因?yàn)橛脩舻恼扯炔桓?。游戲和?yīng)用結(jié)合起來(lái), 導(dǎo)致娛樂(lè)性不強(qiáng),應(yīng)用性 不明顯,搞成游戲不游戲、應(yīng)用不應(yīng)用的兩不像。 (但是我想提一下開(kāi)心熊寶,由于它的用 戶專注于小朋友, 目標(biāo)用戶明確, 更加專業(yè)化, 所以有別于其他兩款軟件是很有可能會(huì)朝好 的方向發(fā)展的) ??墒侨绻鼈冏呔€下的話,有可能會(huì)有生存的機(jī)會(huì)。發(fā)展智能寵物,走實(shí) 體路線。但是這一塊的技術(shù)門檻也比較高,還得看公司的實(shí)力和規(guī)劃了。第四類,云助理也是一款有意思的產(chǎn)品。 我理解的是它想做成,服務(wù)在云端,推送給個(gè)

10、人的 私人助理軟件(不知道他們內(nèi)部是怎樣考慮的) 。將語(yǔ)義識(shí)別放到云端,給用戶展現(xiàn)的只是 一個(gè)簡(jiǎn)單的助理形象本體,通過(guò)助理的幫忙完成一系列功能。其實(shí)它的私人助理思路和 009的狗、 開(kāi)心熊寶的小熊, 小唐龍的中國(guó)龍是差不多的,這一點(diǎn)并不新穎。我比較看重的是它 提到的云服務(wù)概念。 目前,他們肯定做不到構(gòu)建語(yǔ)義識(shí)別云,但是有這個(gè)理念是好的。 如果真正能構(gòu)成語(yǔ)義識(shí)別云,再將各行業(yè) api 集成在一起,那么無(wú)論什么終端載體都可以接受這 些信息, 那樣必然是未來(lái)的一個(gè)趨勢(shì)。 只是, 我擔(dān)心的是這樣的工程好像不是一家小公司或 者說(shuō)幾家公司可以做出來(lái)的。第五類,不說(shuō)了,大家都懂的。其實(shí)每家公司都不好做,但是每家公司都覺(jué)得很有機(jī)會(huì)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論