版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
《自然語言處理導(dǎo)論》第13章問答系統(tǒng)問答系統(tǒng):一個能回答任意自然語言形式問題的自動機(jī)。輸入:任何自然語言形式的問題輸出:一個簡潔的答案或者可能答案的列表輸入:新中國是多久成立的?輸出:1949年10月1日。1.基于符號的表示方法問句:哪些軟件是由美國加利福尼亞州成立的公司開發(fā)的。軟件開發(fā)公司問句短語檢測主要所用技術(shù):分詞最簡單方法:N-gram匹配蜘蛛俠蜘蛛俠自然語言句子知識圖譜知識圖譜最常用方法:Bi-LSTM+CRF后期的神經(jīng)網(wǎng)絡(luò)漢語分詞編碼嵌入后,計算兩個向量之間的余弦相似度1.OneHot獨熱碼紅色[0,0,0,0,0,0,0,…..,1,0,0,0,0]2.詞袋模型3.Word2vec、Skip-Thought4.各神經(jīng)網(wǎng)絡(luò)模型1.基于符號的表示方法問句:哪些軟件是由美國加利福尼亞州成立的公司開發(fā)的。軟件開發(fā)公司問句軟件開發(fā)者公司知識圖譜余弦相似度、Ngram問句知識圖譜But!2.基于分布式的表示方法知識圖譜圖數(shù)據(jù)嵌入1.DeepWalk(KDD2014)2.Node2vec(KDD2015)3.LINE(WWW2015)4.圖卷積神經(jīng)網(wǎng)絡(luò)ShenYing,DengYang,YangMin,LiYaliang,DuNan,FanWei,LeiKai.Knowledge-awareAttentiveNeuralNetworkforRankingQuestionAnswerPairs.InThe41stInternationalACMSIGIRConferenceonResearch&DevelopmentinInformationRetrieval(SIGIR2018).SIGIR:AnnArbor,Michigan,USA,July8-12,2018.pp.901-904.ACM.嵌入層融合層隱含層Softmax層問題答案嵌入層問題:詞向量、知識向量答案:詞向量、知識向量技術(shù)點:文本嵌入技術(shù)點:知識圖譜圖數(shù)據(jù)嵌入嵌入層問題的文本向量答案的文本向量BiLSTMBiLSTM嵌入層問題的知識圖譜向量答案的知識圖譜向量CNNCNN融合層隱含層Softmax層問題答案問答系統(tǒng)評價指標(biāo)-MRR平均倒數(shù)排名假設(shè)有兩個主題,主題①有4個相關(guān)網(wǎng)頁,主題②有5個相關(guān)網(wǎng)頁。某系統(tǒng)對于主題①檢索出4個相關(guān)網(wǎng)頁,其rank分別為1,2,4,7對于主題②檢索出3個相關(guān)網(wǎng)頁,其rank分別為1,3,5對于主題1,平均準(zhǔn)確率為(1/1+2/2+3/4+4/7)/4=0.83對于主題2,平均準(zhǔn)確率為(1/1+2/3+3/5+0+0)/5=0.45則
MAP=(0.83+0.45)/2=0.64MAP是反映系統(tǒng)在全部相關(guān)文檔上性能的單值指標(biāo)。系統(tǒng)檢索出來的相關(guān)文檔越靠前,MAP就越高。如果系統(tǒng)沒有返回相關(guān)文檔,則準(zhǔn)確率默認(rèn)為0。MeanAveragePrecision平均精度問答系統(tǒng)評價指標(biāo)-MAP
MAP和MRR值越高,問答效果越好知識圖譜內(nèi)容越完備,問答效果越好知識圖譜嵌入詞嵌入編碼層BiLSTMCNN拼接DengYang,XieYuexiang,LiYaliang,YangMin,DuNan,FanWei,LeiKai,ShenYing*.Multi-TaskLearningwithMulti-ViewAttentionforAnswerSelectionandKnowledgeBaseQuestionAnswering.InTheThirty-ThirdAAAIConferenceonArtificialIntelligence(AAAI-19).Honolulu,Hawaii,USA,January27–February1,2019.33,pp.6318-6325.ACM.共享表示學(xué)習(xí)層BiLSTMKBQA和AS之間,共享相互的文本向量和知識圖譜向量特定任務(wù)分類器KBQA簡單版本單選題KBQA多模態(tài)任務(wù)模態(tài)(modal)是事情經(jīng)歷和發(fā)生的方式,我們生活在一個由多種模態(tài)(Multimodal)信息構(gòu)成的世界,包括視覺信息、聽覺信息、文本信息、嗅覺信息等等,當(dāng)研究的問題或者數(shù)據(jù)集包含多種這樣的模態(tài)信息時我們稱之為多模態(tài)問題,研究多模態(tài)問題是推動人工智能更好的了解和認(rèn)知我們周圍世界的關(guān)鍵。多模態(tài)任務(wù)多模態(tài)研究中,通常遵循以下步驟:首先需要考慮對于單個模態(tài)的信息的獲取與處理,緊接著需要研究如何實現(xiàn)模態(tài)間信息的融合,聯(lián)合表示,共同學(xué)習(xí)等,最后將得到的信息再對于不同的任務(wù)進(jìn)行后續(xù)的處理。多模態(tài)問答系統(tǒng)當(dāng)前,智能問答系統(tǒng)的研究仍舊集中在文本信息的交互上,問題和答案的呈現(xiàn)模式都是文本信息。然而,隨著互聯(lián)網(wǎng)及移動互聯(lián)網(wǎng)的快速發(fā)展,多媒體信息量的急劇增長,對于智能問答系統(tǒng)在信息的多模態(tài)、直觀性和豐富性上提出了更高的要求,基于文本的智能問答新系統(tǒng)無法滿足目前多媒體問答的需求。傳統(tǒng)基于文本智能問答系統(tǒng)主要存在以下問題:1)無法滿足用戶對多模態(tài)信息的查詢,只能以單一的文本信息進(jìn)行交互;2)問答系統(tǒng)的答案的呈現(xiàn)模式為文本模式,展示方式不夠直觀形象,缺乏多媒體形式的展示;3)缺乏多模態(tài)處理的流程和模式,不能滿足智能問答系統(tǒng)的可擴(kuò)展性多模態(tài)問答系統(tǒng)問答系統(tǒng)對于智能化的需求越來越明顯,尤其是在智能問答系統(tǒng)中多模態(tài)信息的查詢和直觀展示。多模態(tài)的智能問答系統(tǒng),可以允許用戶進(jìn)行多媒體信息的查詢,包括圖片、音頻、視頻、圖片加文本和視頻加本文等信息,從而滿足用戶多媒體輸入的需求,提高用戶信息查詢的豐富性。同時,它也支持答案的多媒體形式的展示,利用豐富的媒體形式,對用戶提出的問題給出一個準(zhǔn)確和形象的答案。視覺問答系統(tǒng)視覺問答(visualquestionanswering,簡稱為VQA)是典型的多模態(tài)問答系統(tǒng)之一,也是整個多模態(tài)領(lǐng)域的經(jīng)典任務(wù)之一。一個VQA系統(tǒng)以一張圖片和一個關(guān)于這張圖片的形式自由、開放式的自然語言問題作為輸入,以生成一條自然語言答案作為輸出。簡單來說,VQA就是給定的圖片進(jìn)行問答。視覺問答系統(tǒng)需要四個部分完成:視覺/文本理解,多模態(tài)特征交互,答案檢索,答案生成。StackedAttentionNetworksforImageQuestionAnswering視覺理解文本理解多模態(tài)特征交互答案檢索與答案生成視覺問答系統(tǒng)數(shù)據(jù)集VQAv1是使用最廣泛的數(shù)據(jù)集之一,它包含來自COCO的204,721幅真實圖像數(shù)據(jù)集(用于訓(xùn)練的123287幅圖像和用于測試的81434幅圖像)。它涵蓋了614,163個自由形式的問題和7984119個問題答案,允許是/否、多項選擇和開放式問題。VQAv2是VQAv1數(shù)據(jù)集的增強(qiáng)版本,它包含204721幅圖像,這些圖像來自
COCO數(shù)據(jù)集。它在訓(xùn)練集、驗證集和測試集上有443757,214354和447793個問題注釋。VQAv2共有1105904個由人類注釋的自由形式問答對,是VQAv1的兩倍,并且為每個問題提供一個補(bǔ)充圖像,以便同一問題可以與兩個相似的圖像組合產(chǎn)生不同的答案。與VQAv1相比,VQAv2減少了數(shù)據(jù)集的偏差和不平衡以上改進(jìn)。KB-VQA是第一個需要外部知識庫的VQA數(shù)據(jù)集,其中包括來自COCO的700幅圖像數(shù)據(jù)集和2402個問答對(每張圖片3-4個問題)。KB-VQA有23個問題模板,每個問題由五名研究者根據(jù)其中一個合適的模板提出。提議者給不同的標(biāo)簽不同知識水平的問題。回答“知識庫”級別的問題需要使用知識庫比如DBpedia。KB-VQA中的“KB-knowledge”級問題遠(yuǎn)遠(yuǎn)多于同時期的其他VQA
數(shù)據(jù)集。多輪對話系統(tǒng)近年來,對話系統(tǒng)以其巨大的潛力和誘人的商業(yè)價值吸引了越來越多的關(guān)注。目前,對話系統(tǒng)在各個領(lǐng)域越來越引起人們的重視,也取得了迅速的發(fā)展,各大公司相繼推出了自己的智能對話應(yīng)用,如蘋果公司的Siri,微軟公司的Cortana,百度公司的度秘等。多輪對話是指根據(jù)上下文內(nèi)容,進(jìn)行連續(xù)的,以達(dá)到解決某一類特定任務(wù)為目的的對話,是對話系統(tǒng)中的一個重要組成部分。相對于單輪對話,多輪對話的模式通常表現(xiàn)為有問有答的形式。在對話過程中,機(jī)器人也會發(fā)起詢問,而且在多輪對話中,機(jī)器人還會涉及“決策”的過程,與單輪對話相比會顯得更加的智能,應(yīng)用場景也更加的豐富多樣。通常來說,多輪對話與一件事情的處理相對應(yīng)。多輪對話系統(tǒng)傳統(tǒng)的多輪對話系統(tǒng)通常由三個模塊組成:口語理解模塊(SpokenLanguageUnderstanding,SLU,包括語音
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 44808.2-2024人類工效學(xué)無障礙設(shè)計第2部分:考慮顏色視覺隨年齡變化的顏色組合方法
- Ginisortamab-Mouse-IgG1-生命科學(xué)試劑-MCE-5731
- CDDP-PEG-Cy3-生命科學(xué)試劑-MCE-6481
- 20-Hydroxylucidenic-acid-E2-生命科學(xué)試劑-MCE-8519
- 2-Dodecylfuran-生命科學(xué)試劑-MCE-5142
- 二零二五年度綠色建筑物業(yè)費減免執(zhí)行合同
- 二零二五年度校園教師聘用與管理合作協(xié)議
- 二零二五年度股權(quán)贈與合同:公司股東權(quán)益轉(zhuǎn)移與公司股權(quán)結(jié)構(gòu)調(diào)整
- 2025年度籃球運動員與俱樂部傷病賠償合同
- 2025年度影視基地裝修半包工程合同
- 2025年生物安全年度工作計劃
- 通用電子嘉賓禮薄
- 武裝押運操作規(guī)程完整
- 混合動力汽車構(gòu)造與檢修(高職新能源汽車專業(yè))PPT完整全套教學(xué)課件
- 薪酬專員崗位月度KPI績效考核表
- 技能大賽題庫(空分)
- 污水處理廠設(shè)備的操作規(guī)程(完整版)
- GB/T 28419-2012風(fēng)沙源區(qū)草原沙化遙感監(jiān)測技術(shù)導(dǎo)則
- GB/T 22077-2008架空導(dǎo)線蠕變試驗方法
- DDI領(lǐng)導(dǎo)力-高績效輔導(dǎo)課件
- 水泥罐安裝與拆除專項施工方案
評論
0/150
提交評論