基于云的機(jī)器人問(wèn)答系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).docx_第1頁(yè)
基于云的機(jī)器人問(wèn)答系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).docx_第2頁(yè)
基于云的機(jī)器人問(wèn)答系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).docx_第3頁(yè)
基于云的機(jī)器人問(wèn)答系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).docx_第4頁(yè)
基于云的機(jī)器人問(wèn)答系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).docx_第5頁(yè)
已閱讀5頁(yè),還剩10頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第五屆“挑戰(zhàn)杯,中國(guó)聯(lián)通安徽省大學(xué)生課外學(xué)術(shù)科技作品競(jìng)賽研究報(bào)告基于云的機(jī)器人問(wèn)答系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)薛建2013年4月目錄一、序言11. 1研究背景 1 1.1.1人機(jī)交互技術(shù) 11.1.2自然語(yǔ)言識(shí)別技術(shù) 2 1.2國(guó)內(nèi)外研究現(xiàn)狀分析 3二、系統(tǒng)設(shè)計(jì)4 2 1設(shè)計(jì)思路 42 1. 1機(jī)器人隱0 5 2 1. 2訊飛語(yǔ)音云 5 2.1.3百度問(wèn)答服務(wù)云 6 2.2詳細(xì)設(shè)計(jì) 7 2.2 1機(jī)器人隱0模塊 7 2.2.2訊飛語(yǔ)音云模塊 9 2.2.3百度問(wèn)答服務(wù)云模塊 10三、系統(tǒng)性能分析12四、應(yīng)用前景與展望未來(lái)13五、參考文獻(xiàn)14一、序言隨著機(jī)器人技術(shù)和人工智能研究的發(fā)展,越來(lái)越多的智能機(jī)器人進(jìn)入到人們的 日常生活當(dāng)中,但是目前人與機(jī)器人之間的交互仍然主要是通過(guò)按鈕、開(kāi)關(guān)等命令 方式,這種交互方式顯得很生硬,不夠人性化。為了使得人與機(jī)器人的交互方式更 加方便、自然、和諧,基于自然語(yǔ)義識(shí)別的人機(jī)交互系統(tǒng)的研究顯得十分重要,這 也是近年來(lái)人機(jī)交互技術(shù)的研究重點(diǎn)?;谠朴?jì)算的機(jī)器人問(wèn)答系統(tǒng)使用了訊飛語(yǔ) 音云和百度知道問(wèn)答服務(wù)云,實(shí)現(xiàn)了用戶向機(jī)器人提出問(wèn)題,機(jī)器人經(jīng)過(guò)短暫“思 考”回答出相應(yīng)的答案并且在說(shuō)話的同時(shí)做出相應(yīng)行為的功能,該系統(tǒng)實(shí)現(xiàn)了一定 程度的自然語(yǔ)義的識(shí)別,提供了一種更加人性化的人機(jī)交互方式。基于云的機(jī)器人問(wèn)答系統(tǒng)運(yùn)用當(dāng)前主流的云技術(shù),將機(jī)器人技術(shù)、語(yǔ)音識(shí)別技 術(shù)和網(wǎng)絡(luò)查詢技術(shù)結(jié)合在一起,建立一套機(jī)器人問(wèn)答服務(wù)系統(tǒng),提供了一種更加人 性化的基于自然語(yǔ)言的人機(jī)交互方式。云技術(shù)的使用,提高了語(yǔ)音識(shí)別的效率和問(wèn) 題答案的準(zhǔn)確率,為系統(tǒng)的可行性提供了保證。1.1研究背景1.1.1人機(jī)交互技術(shù)人機(jī)交互技術(shù)是指通過(guò)計(jì)算機(jī)輸入、輸出設(shè)備,以有效的方式實(shí)現(xiàn)人與計(jì)算機(jī) 對(duì)話、交換信息的技術(shù)。人們可以借助鍵盤、鼠標(biāo)、操作桿、位置跟蹤器、數(shù)據(jù)手 套等設(shè)備,用手、腳、聲音、姿態(tài)和身體的動(dòng)作、視線甚至腦電波等向計(jì)算機(jī)傳遞 信息;計(jì)算機(jī)通過(guò)打印機(jī),繪圖儀、頭盔式顯示器、音頻等輸出設(shè)備或顯示設(shè)備給 人提供信息。目前,人機(jī)交互技術(shù)正處于多通道、多媒體的智能人機(jī)交互階段,已經(jīng)取得了 不少研究成果,不少產(chǎn)品已經(jīng)問(wèn)世。側(cè)重多媒體技術(shù)的有:觸摸式顯示屏實(shí)現(xiàn)的“桌 面”計(jì)算機(jī),能夠隨意折疊的柔性顯示屏制造的電子書(shū),從電影院搬進(jìn)客廳指日可 待的30顯示器,使用紅綠藍(lán)光激光二極管的視網(wǎng)膜成像顯示器;側(cè)重多通道技術(shù) 的有:“漢王筆”手寫(xiě)漢字識(shí)別系統(tǒng),結(jié)合在微軟的了處16?0操作系統(tǒng)中數(shù)字墨 水技術(shù),廣泛應(yīng)用于0打1。60?的中文版等辦公、應(yīng)用軟件中的181八匕0106 連續(xù)中文語(yǔ)音識(shí)別系統(tǒng),輸入設(shè)備為攝像機(jī)、圖像采集卡的手勢(shì)識(shí)別技術(shù),以 1?只0肥手機(jī)為代表的可支持更復(fù)雜的姿勢(shì)識(shí)別的多觸點(diǎn)式觸摸屏技術(shù),以及 1?只0肥中基于傳感器的捕捉用戶意圖的隱式輸入技術(shù)。人機(jī)交互技術(shù)領(lǐng)域熱點(diǎn)技術(shù)的應(yīng)用潛力已經(jīng)開(kāi)始展現(xiàn),比如智能手機(jī)配備的地 理空間跟蹤技術(shù),應(yīng)用于可穿戴式計(jì)算機(jī)、隱身技術(shù)、浸入式游戲等的動(dòng)作識(shí)別技 術(shù),應(yīng)用于虛擬現(xiàn)實(shí)、遙控機(jī)器人及遠(yuǎn)程醫(yī)療等的觸覺(jué)交互技術(shù),應(yīng)用于呼叫路由、 家庭自動(dòng)化及語(yǔ)音撥號(hào)等場(chǎng)合的語(yǔ)音識(shí)別技術(shù),對(duì)于有語(yǔ)言障礙的人士的無(wú)聲語(yǔ)音 識(shí)別,應(yīng)用于廣告、網(wǎng)站、產(chǎn)品目錄、雜志效用測(cè)試的眼動(dòng)跟蹤技術(shù),針對(duì)有語(yǔ)言 和行動(dòng)障礙人開(kāi)發(fā)的“意念輪椅”采用的基于腦電波的人機(jī)界面技術(shù)等。熱點(diǎn)技術(shù)的應(yīng)用開(kāi)發(fā)是機(jī)遇也是挑戰(zhàn)?;谝曈X(jué)的手勢(shì)識(shí)別率低,實(shí)時(shí)性差, 需要研究各種算法來(lái)改善識(shí)別的精度和速度;眼睛虹膜、掌紋、筆跡、步態(tài)、語(yǔ)音、 唇讀、人臉、0嫩等人類特征的研發(fā)應(yīng)用也正在受到關(guān)注;自然語(yǔ)言理解目前在語(yǔ) 言模型、語(yǔ)料庫(kù)等方面取得了很大的進(jìn)展,基于自然語(yǔ)言理解的人機(jī)交互方式也是 目前研究的熱點(diǎn);另外,與“云計(jì)算”等相關(guān)技術(shù)的融合與促進(jìn)也需要繼續(xù)探索。人機(jī)交互技術(shù)與計(jì)算機(jī)始終相伴發(fā)展,匕6?的運(yùn)算能力日趨強(qiáng)大,網(wǎng)絡(luò)和 通信技術(shù)的快速發(fā)展,顯示技術(shù)的重大突破都將為人機(jī)交互提供新的起點(diǎn)與高度。 也許有一天,你的房間的墻壁和窗戶都是基于技術(shù)的巨型顯示器,無(wú)需遙控 器和控制器,游戲機(jī)或電視機(jī)就能“感應(yīng)”到你目光的變化、捕捉到你的手勢(shì)和動(dòng) 作、聽(tīng)懂你語(yǔ)音的命令,用你的頭、手、足、軀干就可以控制游戲中的角色。互聯(lián) 網(wǎng)正在向“云端”計(jì)算時(shí)代發(fā)展,人機(jī)交互的發(fā)展仍將延續(xù)由以計(jì)算機(jī)為中心的復(fù) 雜交互向以人為中心的簡(jiǎn)單、自然交互轉(zhuǎn)移的理念,理想的人機(jī)交互模式就是“用 戶自由。1.1.2自然語(yǔ)言識(shí)別技術(shù)自然語(yǔ)言識(shí)別,即實(shí)現(xiàn)人機(jī)間自然語(yǔ)言通信,或?qū)崿F(xiàn)自然語(yǔ)言理解和自然語(yǔ)言 生成,這是十分困難的。造成困難的根本原因是自然語(yǔ)言文本和對(duì)話的各個(gè)層次上 廣泛存在的各種各樣的歧義性或多義性。使機(jī)器識(shí)別語(yǔ)言是人類早已有之的科技幻想,并且早有實(shí)踐足跡。早在1920 年,美國(guó)一家公司所出品的名為“此也0如X”玩具狗便可以“聽(tīng)從”主人的話而 執(zhí)行走或者停的任務(wù)。不過(guò)在這之后相當(dāng)長(zhǎng)的時(shí)間里。這項(xiàng)科技的進(jìn)展僅限于如何 更多、更精確地識(shí)別各種口音,進(jìn)而執(zhí)行諸如文字顯示等十分簡(jiǎn)單的任務(wù)。1952 年,貝爾實(shí)驗(yàn)室的0狀18等人成功研究出了世界上第一個(gè)能識(shí)別10個(gè)英文數(shù)字發(fā) 音的實(shí)驗(yàn)系統(tǒng)。大規(guī)模的語(yǔ)音識(shí)別研究是在進(jìn)入了上個(gè)世紀(jì)70年代以后,在孤立詞和小詞匯 量句子的識(shí)別方面取得了實(shí)質(zhì)性的進(jìn)展。進(jìn)入80年代以后,研究的重點(diǎn)逐漸轉(zhuǎn)向大詞匯量、非特定人連續(xù)語(yǔ)音識(shí)別。 此時(shí)語(yǔ)音識(shí)別的研究思路也發(fā)生了重大變化,即由傳統(tǒng)的基于標(biāo)準(zhǔn)模板匹配的技術(shù) 思路開(kāi)始轉(zhuǎn)向基于統(tǒng)計(jì)模型(目)的技術(shù)思路。此外,再次提出了將神經(jīng)網(wǎng)絡(luò)技術(shù) 引入語(yǔ)音識(shí)別問(wèn)題的技術(shù)思路,亦即開(kāi)始了跨學(xué)科的人工智能研究道路。進(jìn)入90年代以后,語(yǔ)音識(shí)別的研究并沒(méi)有什么重大突破。但是,在語(yǔ)音識(shí)別 技術(shù)的應(yīng)用及產(chǎn)品化方面出現(xiàn)了很大的進(jìn)展,諸如聽(tīng)寫(xiě)機(jī)等基于語(yǔ)音的信息輸入設(shè)21備此時(shí)大量出現(xiàn)。由僅限于定義為輸入法功能的語(yǔ)音識(shí)別,向包含后臺(tái)數(shù)據(jù)分析的 語(yǔ)義識(shí)別轉(zhuǎn)型的關(guān)鍵推動(dòng)力量,是美國(guó)的0仙?八作仙68680 ?0608八陰此丫)計(jì)劃。顯然,語(yǔ)義識(shí)別技術(shù)蘊(yùn)含著著人機(jī)互動(dòng)的遠(yuǎn)大前景,也因 此擁有各方足夠高的評(píng)價(jià)和期許。但它幾十年來(lái)卻缺乏足夠的表現(xiàn)。自然語(yǔ)義識(shí)別技術(shù)目前在語(yǔ)言模型、語(yǔ)料庫(kù)等方面取得了一些進(jìn)展。語(yǔ)言文字 是人類之間用來(lái)傳播信息的主要載體,怎樣讓機(jī)器理解這些由人類自然語(yǔ)言組成的 信息,是擺在人們面前的一個(gè)難題。這個(gè)難題又可以分為“自然語(yǔ)言處理”和“自 然語(yǔ)言理解”兩個(gè)部分,“自然語(yǔ)言處理”是基礎(chǔ)技術(shù),我們的最終目的也必定是 為了更好地實(shí)現(xiàn)“自然語(yǔ)言理解”。自然語(yǔ)言的處理是一個(gè)十分龐大的工程,自然語(yǔ)言的語(yǔ)法通常都是十分復(fù)雜 的,相對(duì)于英語(yǔ)來(lái)說(shuō),漢語(yǔ)語(yǔ)法就更加復(fù)雜,因此目前還沒(méi)有什么方法能夠有效的 消除自然語(yǔ)義識(shí)別時(shí)的“歧義問(wèn)題”?,F(xiàn)階段,自然語(yǔ)言的處理主要有以下幾種主 要方法:1.基于關(guān)鍵字匹配的方法;2以句法-語(yǔ)義分析為主的方法;3基于大規(guī)模語(yǔ)料庫(kù)的自然語(yǔ)言處理的方法。這幾種方法雖然都有各自的一些特點(diǎn),但是效果都不是十分理想,也都存在著 弊端?;陉P(guān)鍵字匹配的方法是一種近似匹配技術(shù),主要的缺點(diǎn)是分析技術(shù)不精確, 會(huì)導(dǎo)致很多的錯(cuò)誤。以語(yǔ)法-語(yǔ)義分析為主的方法,由于自然語(yǔ)言語(yǔ)法的復(fù)雜性、 語(yǔ)義的歧義性,分析起來(lái)非常復(fù)雜,而且無(wú)法做到準(zhǔn)確、全面。而基于大規(guī)模語(yǔ)料 庫(kù)的自然語(yǔ)言處理,則是一個(gè)過(guò)于龐大的工程,不適合于工程應(yīng)用。1.2國(guó)內(nèi)外研究現(xiàn)狀分析在10月2日的蘋(píng)果產(chǎn)品發(fā)布會(huì)上,1?06 48的技術(shù)升級(jí)幅度可謂令業(yè)界失望。 然而,被蘋(píng)果定義為“私人語(yǔ)音助理”來(lái)做壓軸功能發(fā)布的義匕應(yīng)用,仍然是抓 足了人們的眼球。在發(fā)布會(huì)上,蘋(píng)果宣稱5匕1可以支持自然語(yǔ)言輸入與識(shí)別,用戶可“命令” 手機(jī)讀短信、詢問(wèn)天氣、設(shè)置鬧鐘等,并且可以搜尋餐廳、電影院等生活信息,甚 至是直接訂位、訂票;另外其與8結(jié)合服務(wù)的能力也相當(dāng)強(qiáng)悍,能夠依據(jù)用戶默 認(rèn)的居家地址或是所在位置來(lái)判斷、過(guò)濾搜尋的結(jié)果。811被蘋(píng)果這樣的企業(yè)推出進(jìn)行商用,已經(jīng)意味著“語(yǔ)音識(shí)別”這一已經(jīng)不 算新鮮的科技,進(jìn)一步實(shí)現(xiàn)了人工智能化,進(jìn)而向“語(yǔ)義識(shí)別”又邁出了一大步, 同時(shí)意味著第一款基于它的改變大眾生活的消費(fèi)級(jí)產(chǎn)品已經(jīng)誕生。在國(guó)內(nèi),科大訊飛通過(guò)在語(yǔ)音核心技術(shù)領(lǐng)域的長(zhǎng)期積累,不但在中文語(yǔ)音技術(shù) 上保持領(lǐng)先地位,并且在英文語(yǔ)音技術(shù)上也達(dá)到國(guó)際領(lǐng)先水平。訊飛語(yǔ)音云是全球 首個(gè)能同時(shí)提供語(yǔ)音合成、語(yǔ)音搜索、語(yǔ)音聽(tīng)寫(xiě)的移動(dòng)互聯(lián)網(wǎng)智能交互平臺(tái)。作為3移動(dòng)互聯(lián)網(wǎng)基礎(chǔ)能力設(shè)施,訊飛語(yǔ)音云基于“云計(jì)算”技術(shù)基礎(chǔ)將上述業(yè)界領(lǐng)先的 智能語(yǔ)音技術(shù)向各開(kāi)發(fā)廠商和用戶同時(shí)開(kāi)放。移動(dòng)互聯(lián)網(wǎng)應(yīng)用開(kāi)發(fā)伙伴可以像使用 水、電那樣“即開(kāi)即用、按需取用”,在很短時(shí)間內(nèi)構(gòu)建出“能聽(tīng)會(huì)說(shuō)”的特色移 動(dòng)互聯(lián)網(wǎng)應(yīng)用,從而使移動(dòng)互聯(lián)網(wǎng)語(yǔ)音創(chuàng)新開(kāi)發(fā)的門檻顯著降低、開(kāi)發(fā)周期顯著縮 短,將有利于移動(dòng)互聯(lián)網(wǎng)應(yīng)用的不斷創(chuàng)新和豐富。二、系統(tǒng)設(shè)計(jì) 2.1設(shè)計(jì)思路人機(jī)交互技術(shù)的未來(lái)發(fā)展趨勢(shì),就是基于自然語(yǔ)義識(shí)別的人機(jī)交互技術(shù),我們 的目標(biāo)是使得計(jì)算機(jī)或者機(jī)器人能夠聽(tīng)懂人類的語(yǔ)言,能夠執(zhí)行人類語(yǔ)言語(yǔ)義中所 包含的命令,并能用人類語(yǔ)言與人類進(jìn)行交流。系統(tǒng)設(shè)計(jì)的基本思路是:利用機(jī)器人的話筒采集用戶提出的問(wèn)題的語(yǔ)音數(shù)據(jù), 調(diào)用訊飛語(yǔ)音云的語(yǔ)音識(shí)別技術(shù)將采集到的語(yǔ)音數(shù)據(jù)識(shí)別成文字?jǐn)?shù)據(jù),獲得文字問(wèn) 題,然后將文字問(wèn)題在百度問(wèn)答系統(tǒng)中進(jìn)行查詢并獲得問(wèn)題的答案,最后調(diào)用機(jī)器 人語(yǔ)音合成模塊將文字答案合成成為語(yǔ)音答案并回答給用戶,同時(shí)配合一些說(shuō)話時(shí) 候的動(dòng)作,顯得更加生動(dòng)。系統(tǒng)主要包含三個(gè)模塊:嫩0機(jī)器人模塊、訊飛語(yǔ)音云 模塊和百度問(wèn)答服務(wù)云模塊。系統(tǒng)的工作流程圖如圖一所示:圖一:系統(tǒng)工作流程圖2.1.1機(jī)器人嫩0嫩0機(jī)器人是一款人工智能機(jī)器人,身高為23寸,約60厘米,它是由法國(guó) 八1己6“以 100108公司生產(chǎn)的。嫩0擁有著討人喜歡的外形,并具備有一定程度 的人工智能和情感智商,在學(xué)術(shù)領(lǐng)域里,嫩0是目前世界上運(yùn)用最廣泛的類人機(jī)器 人。圖二:似0機(jī)器人實(shí)物圖 嫩0的硬件是采用最新科技設(shè)計(jì)制造的,這保證了嫩0動(dòng)作的流暢性,同時(shí)嫩0 還配備了多種傳感器,比如攝像頭、聲納、陀螺儀等等。嫩0使用的是八10 6606 的嵌入式處理器,嫩0支持在多種平臺(tái)上(“皿X、11仏0*8或08等操作系統(tǒng) 下)編程并且擁有一個(gè)開(kāi)放式的編程構(gòu)架,使得不同的軟件模塊可以更好的相互作 用。不論使用者的專業(yè)水平如何,都能夠通過(guò)圖形化編程平臺(tái)來(lái)為嫩0編寫(xiě)程序, 實(shí)現(xiàn)各種復(fù)雜的功能,進(jìn)行各個(gè)領(lǐng)域的研究。2.1.2訊飛語(yǔ)音云基于自然語(yǔ)言的人機(jī)交互技術(shù)的基礎(chǔ)是自然語(yǔ)義識(shí)別技術(shù),而自然語(yǔ)義識(shí)別技 術(shù)的前提是語(yǔ)音的識(shí)別技術(shù)。語(yǔ)音作為人們獲取和溝通信息最方便、最有效的手段, 智能語(yǔ)音交互技術(shù)對(duì)于未來(lái)人機(jī)交互技術(shù)的發(fā)展具有不可替代的作用,已經(jīng)被業(yè)界 公認(rèn)為移動(dòng)互聯(lián)網(wǎng)時(shí)代的關(guān)鍵技術(shù)之一,蘊(yùn)藏著巨大的市場(chǎng)前景,并有重要的戰(zhàn)略意義。科大訊飛通過(guò)在語(yǔ)音核心技術(shù)領(lǐng)域的長(zhǎng)期積累,不但在中文語(yǔ)音技術(shù)上保持領(lǐng) 先地位,并且在英文語(yǔ)音技術(shù)上也達(dá)到國(guó)際領(lǐng)先水平。訊飛語(yǔ)音云是全球首個(gè)能同 時(shí)提供語(yǔ)音合成、語(yǔ)音搜索、語(yǔ)音聽(tīng)寫(xiě)的移動(dòng)互聯(lián)網(wǎng)智能交互平臺(tái)。作為移動(dòng)互聯(lián) 網(wǎng)基礎(chǔ)能力設(shè)施,訊飛語(yǔ)音云基于“云計(jì)算”技術(shù)基礎(chǔ)將上述業(yè)界領(lǐng)先的智能語(yǔ)音 技術(shù)向各開(kāi)發(fā)廠商和用戶同時(shí)開(kāi)放。移動(dòng)互聯(lián)網(wǎng)應(yīng)用開(kāi)發(fā)伙伴可以像使用水、電那 樣“即開(kāi)即用、按需取用”,在很短時(shí)間內(nèi)構(gòu)建出“能聽(tīng)會(huì)說(shuō)”的特色移動(dòng)互聯(lián)網(wǎng) 應(yīng)用,從而使移動(dòng)互聯(lián)網(wǎng)語(yǔ)音創(chuàng)新開(kāi)發(fā)的門檻顯著降低、開(kāi)發(fā)周期顯著縮短,將有 利于移動(dòng)互聯(lián)網(wǎng)應(yīng)用的不斷創(chuàng)新和豐富。2.1.3百度問(wèn)答服務(wù)云I社6四6七是計(jì)算機(jī)出現(xiàn)以來(lái)甚至是人類有史以來(lái)最偉大的創(chuàng)舉,它改變了全球 通訊和信息資源共享的方式,把各種各樣的資源從經(jīng)濟(jì)、科技、教育到體育、藝術(shù) 聯(lián)系在一起,構(gòu)成了一個(gè)巨大的網(wǎng)絡(luò)資源庫(kù)?,F(xiàn)在,網(wǎng)絡(luò)已經(jīng)發(fā)展成為一個(gè)全球的、巨大的、分布和共享的信息空間。人們 越來(lái)越依賴于網(wǎng)絡(luò)來(lái)獲取信息。我們可以隨時(shí)從網(wǎng)絡(luò)上查找所需要的信息,網(wǎng)絡(luò)作 為一個(gè)龐大的資源庫(kù),其包含了人類現(xiàn)有的方方面面的知識(shí)。基于大規(guī)模語(yǔ)料庫(kù)的自然語(yǔ)言處理方法是自然語(yǔ)義識(shí)別技術(shù)的方法之一,其難 點(diǎn)在于大規(guī)模語(yǔ)料庫(kù)的建立,前面提到網(wǎng)絡(luò)上有著各種資源、各種知識(shí),因此我們 可以想到將網(wǎng)絡(luò)作為我們的大規(guī)模語(yǔ)料庫(kù)。對(duì)網(wǎng)絡(luò)語(yǔ)料庫(kù)的使用,我們可以使用谷 歌、百度等搜索引擎進(jìn)行搜索,而百度問(wèn)答服務(wù)系統(tǒng)則為我們提供了更為方便的使 用。圖三為百度知道網(wǎng)站頁(yè)面的截圖。圖三:百度知道網(wǎng)站截圖 百度知道是百度旗下的一款問(wèn)答平臺(tái),它由用戶提出問(wèn)題,再由別的具備該問(wèn) 題知識(shí)的用戶進(jìn)行回答,并從眾多回答者中評(píng)選出最佳答案。由于互聯(lián)網(wǎng)的巨大性、網(wǎng)絡(luò)資源的豐富性,百度問(wèn)答已經(jīng)匯集了無(wú)數(shù)個(gè)問(wèn)題以及這些問(wèn)題較為準(zhǔn)確的答 案,這些問(wèn)題涉及了各個(gè)方面,小到生活點(diǎn)滴,大到科學(xué)、哲理。既然百度問(wèn)答服 務(wù)云如此強(qiáng)大,我們自然可以想到將它近似的作為語(yǔ)義識(shí)別時(shí)所用到的巨大規(guī)模的 語(yǔ)料庫(kù)。趣答網(wǎng)是類似百度問(wèn)答的一個(gè)網(wǎng)站,它也提供了網(wǎng)絡(luò)問(wèn)答服務(wù)。該網(wǎng)站是由清 華大學(xué)計(jì)算機(jī)系人工智能實(shí)驗(yàn)室的智能信息獲取組設(shè)計(jì)和維護(hù)的。網(wǎng)站運(yùn)用互聯(lián)網(wǎng) 信息獲取技術(shù)的理論和方法,包括情感分析(評(píng)論與觀點(diǎn)挖掘自動(dòng)問(wèn)答技術(shù)、 多文檔摘要技術(shù),實(shí)現(xiàn)了對(duì)用戶提出的問(wèn)題,給出直接合理的答案,該網(wǎng)站也可以 作為我們系統(tǒng)的問(wèn)答服務(wù)云。2.2詳細(xì)設(shè)計(jì)前面介紹了嫩0問(wèn)答服務(wù)系統(tǒng)的相關(guān)背景知識(shí),而整個(gè)系統(tǒng)就是對(duì)這些知識(shí)的 一個(gè)綜合集成。嫩0問(wèn)答服務(wù)系統(tǒng)主要分為三個(gè)模塊:嫩0模塊、訊飛語(yǔ)音云模塊 和百度問(wèn)答模塊。該系統(tǒng)在前端方面,即面向用戶、與用戶交互的技術(shù),主要是語(yǔ)音識(shí)別以及語(yǔ) 音合成的技術(shù)。語(yǔ)音識(shí)別技術(shù)是把用戶的口語(yǔ)轉(zhuǎn)化成文字,其中需要強(qiáng)大的語(yǔ)音知 識(shí)庫(kù),因此需要用到所謂的“云計(jì)算”技術(shù),即使用訊飛語(yǔ)音云。而語(yǔ)音合成則是 把返回的文字結(jié)果轉(zhuǎn)化成語(yǔ)音輸出,這個(gè)技術(shù)理論上本地就可以完成,比如直接調(diào) 用嫩0模塊的說(shuō)話子模塊,當(dāng)然,在云端完成也可以,比如使用訊飛語(yǔ)音云的語(yǔ)音 合成模塊。在后臺(tái)技術(shù)方面,主要是處理用戶的問(wèn)題,調(diào)用百度問(wèn)答服務(wù)云模塊獲 取問(wèn)題的答案,并返回最匹配的結(jié)果。2.2.1機(jī)器人嫩0模塊嫩0模塊的基礎(chǔ)是嫩00,嫩00是運(yùn)行在應(yīng)0上的主程序的名稱,它控制著 嫩0,嫩00的架構(gòu)也就是對(duì)嫩0進(jìn)行編程時(shí)所要用到的編程架構(gòu)。這個(gè)框架允許 不同的模塊(動(dòng)作模塊、音頻模塊、視頻模塊)之間進(jìn)行通信,提供了函數(shù)和信息 的共享機(jī)制。嫩00支持交叉編程平臺(tái),我們可以在110界8、11皿X或者1狀操作系統(tǒng)下對(duì) 他進(jìn)行編程。嫩00也支持多種編程語(yǔ)言,我們可以使用這些語(yǔ)言調(diào)用嫩00的功 能模塊,但是我們只能用語(yǔ)言和訪0語(yǔ)言來(lái)編寫(xiě)在用戶自定義的在嫩00 上運(yùn)行的模塊,嫩00為這兩種語(yǔ)目提供了完備的八?I。嫩00對(duì)0+十語(yǔ)目的支持是 最好的,我們用編寫(xiě)實(shí)時(shí)的代碼,的代碼可以快速的在嫩0上運(yùn)行。相比 較之下,訪0。語(yǔ)言的執(zhí)行效率就低很多。圖四展示了嫩0機(jī)器人編程模塊的結(jié) 構(gòu)。7圖四:似0機(jī)器人的編程結(jié)構(gòu)圖為了使代碼的編譯變得更加簡(jiǎn)便,嫩0的編程建議使用0仙1“工具,它的作 用是管理工程中的依賴關(guān)系并且支持交叉編譯。4仙1“也是一個(gè)支持交叉平臺(tái)的 工具,支持評(píng)10*8、11皿X和操作系統(tǒng)。918114是基于著名的01成6編譯 系統(tǒng)開(kāi)發(fā)來(lái)的,因此它允許你使用你電腦上已有的集成開(kāi)發(fā)環(huán)境,比如叩。、1成6、 或者是18皿1 5七舊10。搭建好上述嫩0的編程平臺(tái)后,就可以開(kāi)始編寫(xiě)嫩0模塊。嫩0模塊的主要功 能是獲取聲音和說(shuō)出語(yǔ)音答案。對(duì)于獲取聲音部分,主要用到以下模塊和函數(shù):1.從50皿亞X廿狀丨01模塊:該模塊提供了基本的聲音處理的函數(shù),任何處理 音頻的模塊需要新建一個(gè)模塊繼承自該模塊。2丨86比116社?;66;6此68 0函數(shù):該函數(shù)的作用是設(shè)置從嫩0的話筒里獲得 的聲音片段的格式,包括采樣頻率、聲道設(shè)置等等。3 #00688 0函數(shù):這事一個(gè)回調(diào)函數(shù),該函數(shù)的功能是對(duì)聲音緩沖區(qū)進(jìn)行處 理,每當(dāng)獲得了一塊緩沖區(qū)的聲音數(shù)據(jù)后,系統(tǒng)就會(huì)自動(dòng)就調(diào)用該函數(shù)對(duì) 聲音數(shù)據(jù)進(jìn)行處理。為了實(shí)現(xiàn)我們想要的功能,我們需要重載這個(gè)回調(diào)函 數(shù)。4 8仏代06丨610=0函數(shù)、8丨0沖6丨610=0函數(shù):這兩個(gè)函數(shù)的作用分別是 開(kāi)始和停止聲音片段的獲取。對(duì)于說(shuō)出語(yǔ)音答案部分,主要用到以下模塊和函數(shù):1.八16X00166也?0X7 0接口:該接口的功能是封裝對(duì)嫩0機(jī)器人說(shuō)話功能 的控制。2 86讓冊(cè)8皿陰0函數(shù):該函數(shù)的功能是設(shè)置嫩0機(jī)器人說(shuō)話所支持的語(yǔ)言。133 8#0函數(shù):該函數(shù)的功能是使得嫩0機(jī)器人說(shuō)出答案。其中需要注意的地方是嫩00的說(shuō)話模塊支持的文字編碼方式是機(jī)?-8,而 評(píng)1仏0*8下卩82010默認(rèn)的文字編碼方式是X,所以在使用8奶0函數(shù)前,需要將 文字的編碼方式進(jìn)行一次轉(zhuǎn)換,11忖-8和X的轉(zhuǎn)換方法是通過(guò)皿100如編碼來(lái)轉(zhuǎn)換。嫩0機(jī)器人模塊的另一個(gè)功能是實(shí)現(xiàn)機(jī)器人在說(shuō)話的同時(shí),做出相應(yīng)的動(dòng)作, 模擬人類之間交流時(shí)的一些肢體動(dòng)作,使得問(wèn)答過(guò)程顯得更加人性化、更加生動(dòng)。 X八0機(jī)器人的開(kāi)發(fā)平臺(tái)提供了一個(gè)可視化的動(dòng)作編輯工具06狀即1卜6,該工具使 得開(kāi)發(fā)者可以更加方便的設(shè)計(jì)和調(diào)試機(jī)器人的動(dòng)作,軟件的界面如下圖所示:01 0*4 6001 切 901*111 鉍成0。1*0“ 8000(1 1.祝.辦 0048 844 140919090091X010*1844丹0# 00110111140600159(4 7*191 VI 了蒙籌飯麯魯圖五:06狀叩化軟件截圖2.2.2訊飛語(yǔ)音云模塊訊飛語(yǔ)音云模塊的主要功能是將獲取到的聲音上傳到云端服務(wù)器,進(jìn)行識(shí)別, 并將識(shí)別到的文字結(jié)果抓取到本地。在訊飛語(yǔ)音云編程平臺(tái)中關(guān)于語(yǔ)音識(shí)別提供如下函數(shù)調(diào)用:1.以部匕“0:對(duì)IX在識(shí)別過(guò)程中用到的全局配置項(xiàng)參數(shù)進(jìn)行初始化,如服 務(wù)器地址、訪問(wèn)超時(shí)設(shè)置等。2丨以部868810沛68化0:用來(lái)開(kāi)始一路I部會(huì)話,并在參數(shù)中指定本路I部會(huì) 話用到的語(yǔ)法列表,本次會(huì)話所用的參數(shù)等。3.011&皿虹八&1社6 0 :本函數(shù)用來(lái)激活一個(gè)指定的語(yǔ)法,語(yǔ)法類型可以 是仍和一種合法的語(yǔ)法。圖六:訊飛語(yǔ)音云平臺(tái)網(wǎng)絡(luò)結(jié)構(gòu) 4.015狀舊1011*6 0 :寫(xiě)入本次獲取到的音頻,音頻可以一次性寫(xiě)入,也可以 多次調(diào)用此接口分批寫(xiě)入。5-以部化找68匕0 :獲取識(shí)別到的結(jié)果。6丨以部868810沾0:結(jié)束一路I部會(huì)話。7丨以部化切虹肅0 :查詢IX記錄下來(lái)的一些信息如數(shù)據(jù)上傳或下載的數(shù)據(jù)量等。8.01部?1=10 :對(duì)180的18尺部分進(jìn)行逆初始化。對(duì)于整個(gè)機(jī)器人問(wèn)答系統(tǒng),訊飛語(yǔ)音云初始化和逆初始化操作只需要進(jìn)行一 次,而每次回答一個(gè)問(wèn)題的時(shí),首先要開(kāi)始一段會(huì)話,獲得會(huì)話1么然后就要進(jìn) 入上傳聲音數(shù)據(jù)和獲取識(shí)別結(jié)果的一個(gè)循環(huán),循環(huán)的內(nèi)容:當(dāng)一個(gè)聲音緩沖區(qū)滿了 就上傳獲取到的語(yǔ)音數(shù)據(jù)并檢測(cè)云端是否有識(shí)別結(jié)果,如果有就抓取識(shí)別結(jié)果。直 到檢測(cè)到語(yǔ)音后端點(diǎn)(即說(shuō)完話)時(shí)候循環(huán)才停止,最后再檢測(cè)一下云端是否有未 取下來(lái)的識(shí)別結(jié)果,如果有則抓取下來(lái)。2.2.3百度問(wèn)答服務(wù)云模塊百度問(wèn)答服務(wù)云模塊的主要功能是將文字問(wèn)題在網(wǎng)絡(luò)中進(jìn)行搜索,獲得相應(yīng)的 答案,并抓取下來(lái)。百度問(wèn)答的搜索包括兩個(gè)過(guò)程:1.搜索問(wèn)題:通過(guò)搜索得到若干個(gè)包含該問(wèn)題答案的網(wǎng)頁(yè)的鏈接,這些鏈接 是按照其頁(yè)面所包含的答案的相關(guān)性進(jìn)行排列的,第一個(gè)鏈接的相關(guān)性最 大,我們獲取該鏈接地址;2抓取答案:打開(kāi)第一個(gè)過(guò)程中獲得的鏈接地址,獲取所提問(wèn)題答案所在的 頁(yè)面內(nèi)容,該頁(yè)面會(huì)有一個(gè)滿意答案,這個(gè)答案就是我們要抓取的內(nèi)容。 下面用一個(gè)實(shí)例來(lái)詳細(xì)描述這個(gè)模塊的流程,例如我們想要獲取“安徽有哪些 好玩的地方? ”這個(gè)問(wèn)題的答案,系統(tǒng)的運(yùn)行流程如下所示:第一步、將訊飛語(yǔ)音云模塊識(shí)別到的文字問(wèn)題進(jìn)行編碼并添加到百度知道的網(wǎng) 址后面,這樣便獲得百度知道搜索該問(wèn)題的網(wǎng)頁(yè)地址。比如“安徽有哪些好玩的 地方”的機(jī)1-8編碼是“80828805030004040098030026850485088780”,百度知 道的 搜索網(wǎng) 頁(yè)地址 前綴是 “匕七如:2卜1也0.1如.0/863;卜?即二0610如0;和”,因此將“安徽有哪些 好玩的地方”的編碼加在百度搜索地址后面便得到該問(wèn)題的搜索地址:“匕七七:/?;匕土己80.8土己1000乂86已;0匕?10=0&;打二10凌口打二0凌亡;二86已;0匕&16二呂6垃凌界0;己二80828805030004040098030026850485088780”。為了獲取網(wǎng)頁(yè)的源代碼,我們需要調(diào)用11=1加七接口。11=1他七是微軟開(kāi)發(fā)的 一個(gè)庫(kù),可以完成仏如、如客戶端的工作,讓程序員從復(fù)雜的協(xié)議中節(jié)省大量精 力。獲得上述頁(yè)面的源代碼后,對(duì)網(wǎng)頁(yè)源代碼進(jìn)行解析,可以獲取該問(wèn)題相關(guān)性最 高的答案所在頁(yè)面的網(wǎng)址。第二步、再次調(diào)用11=1=61接口抓取第一步獲得的問(wèn)題答案所在頁(yè)面的源代碼, 對(duì)該源代碼進(jìn)行解析,獲取到相應(yīng)的問(wèn)題的答案。需要注意的是,有的網(wǎng)頁(yè)的源代 碼的編碼格式是機(jī)?-8,所以在解析時(shí)要先進(jìn)行編碼的轉(zhuǎn)換,轉(zhuǎn)換成#仏0舊下默 認(rèn)的X編碼方式,然后再進(jìn)行處理,否則會(huì)顯示亂碼。:地 1 過(guò)玩 案好 答些 取哪I 1 答安 101蒙度新 搜一步、獲得問(wèn)題搜索頁(yè)面的網(wǎng)頁(yè)地址:&0 11511(111-0I1/3651%11?VI01%(1=x5x6x89/5x8x8I)x26x90x89x25x93xx24x8x98227x8249x67x9 只 284乂 25x9(80x26x96x89步得到間題答案所在頁(yè)面網(wǎng)址:七0 2 111(10 丨 11611(111 0011/(111631: 100/187424375 丨知七111I靜雛特明渡 得山1;?4 世 I 那山包樂(lè)4辦6湖湖8 置!11 11點(diǎn)趣山5第興蓬戈1 辦晶王點(diǎn)址景晶籠洞地I袁神是江I麗表管!|江I特明渡;山崖|;?4 世. 丫山包樂(lè)8圖七:百度問(wèn)答服務(wù)模塊的執(zhí)行過(guò)程 用評(píng)1=161接口完成一個(gè)仏如下載需要以下步驟: 1丨1社6;6丨0口60使用11=16丨的程序進(jìn)行必要的初始化工作; 2丨1社6;6比0=6巧0關(guān)聯(lián)目標(biāo)地址或者域名以及服務(wù)1口;3丨價(jià)如0口6故6叫68丨0關(guān)聯(lián)要下載的內(nèi)容名字;4價(jià)如56。服6叫68七0將價(jià)如0口6故6叫68丨的返回值發(fā)送給目標(biāo)服務(wù)器;5丨價(jià)如如6171社0 0查詢返回值,不參與網(wǎng)絡(luò)操作,可以查詢服務(wù)器的返回信 息,比如目標(biāo)文件的大小,該文件是否存在等等;6.1=161=6找63證116 0很普通的讀函數(shù),就是下載文件;7.1=161=6比1086他仏16 0釋放資源。對(duì)于將百度問(wèn)答服務(wù)云作為語(yǔ)義識(shí)別的語(yǔ)料庫(kù),有一點(diǎn)不足在于,針對(duì)于機(jī)器 人所提的問(wèn)題,百度問(wèn)答上沒(méi)有相應(yīng)的答案,比如“你是誰(shuí)”、“你叫什么名字”等 問(wèn)題,由于這些問(wèn)題有限,因此我們可以通過(guò)建立小型本地語(yǔ)料庫(kù)的方式來(lái)解決。 這樣本地語(yǔ)料庫(kù)和訊飛語(yǔ)音云結(jié)合使用,會(huì)得到更好的效果。三、系統(tǒng)性能分析我們測(cè)試了系統(tǒng)的性能,主要從訊飛語(yǔ)音識(shí)別成功率、獲取到答案的相關(guān)率兩 方面。我們隨機(jī)找來(lái)十個(gè)人,每個(gè)人隨機(jī)提問(wèn)十個(gè)問(wèn)題,要求盡量使用普通話。實(shí) 驗(yàn)結(jié)果如表一所示:表一、系統(tǒng)性能試驗(yàn)結(jié)果性能方面語(yǔ)音識(shí)別答案相關(guān)成功率0.910.95對(duì)于這樣的結(jié)果,我們是感到滿意的,當(dāng)然這是在網(wǎng)絡(luò)順暢、提問(wèn)人普通話較 為標(biāo)準(zhǔn)、以及所提問(wèn)題比較合理的基礎(chǔ)上的結(jié)果,如果提問(wèn)題的人普通話不標(biāo)準(zhǔn), 或者語(yǔ)速過(guò)快,比如讓小孩來(lái)提問(wèn)題,訊飛語(yǔ)音云的識(shí)別效率會(huì)大大降低。之前我們使用過(guò)趣答網(wǎng)站作為問(wèn)答服務(wù)云的網(wǎng)站,趣答網(wǎng)站是清華大學(xué)研發(fā)的 在線搜索問(wèn)題答案的網(wǎng)站,但是其問(wèn)題覆蓋面不夠廣泛,許多比較偏的問(wèn)題無(wú)法獲 得答案,我們也將趣答網(wǎng)站和百度知道網(wǎng)站進(jìn)行了對(duì)比,隨機(jī)獲取一百個(gè)問(wèn)題,分 別在兩個(gè)網(wǎng)站上搜索答案,實(shí)驗(yàn)結(jié)果是如表二所示:表二、問(wèn)答云性能比較問(wèn)答服務(wù)云趣答網(wǎng)站百度知道成功率0.700.97相關(guān)性0.970.95通過(guò)實(shí)驗(yàn)結(jié)果我們看出趣答網(wǎng)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論