![人工智能基礎自然語言理解_第1頁](http://file4.renrendoc.com/view/923d8c3ccfd3d2c5171d32f0cdf4582b/923d8c3ccfd3d2c5171d32f0cdf4582b1.gif)
![人工智能基礎自然語言理解_第2頁](http://file4.renrendoc.com/view/923d8c3ccfd3d2c5171d32f0cdf4582b/923d8c3ccfd3d2c5171d32f0cdf4582b2.gif)
![人工智能基礎自然語言理解_第3頁](http://file4.renrendoc.com/view/923d8c3ccfd3d2c5171d32f0cdf4582b/923d8c3ccfd3d2c5171d32f0cdf4582b3.gif)
![人工智能基礎自然語言理解_第4頁](http://file4.renrendoc.com/view/923d8c3ccfd3d2c5171d32f0cdf4582b/923d8c3ccfd3d2c5171d32f0cdf4582b4.gif)
![人工智能基礎自然語言理解_第5頁](http://file4.renrendoc.com/view/923d8c3ccfd3d2c5171d32f0cdf4582b/923d8c3ccfd3d2c5171d32f0cdf4582b5.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
目錄第一章緒論第二章知識表示
第三章搜索技術第四章推理技術第五章機器學習
第六章專家系統
第七章自動規(guī)劃系統第八章自然語言理解第九章智能控制第十章人工智能程序設計第一頁,共二十五頁。8.1語言及其理解的一般問題8.1.1語言和語言理解
1.語言的構成
語言是人類進行通信的自然媒介,它包括口語、書面語以及動作語(如啞語和旗語)等。
語言使用于傳遞信息的表示方法、約定和規(guī)則的集合。語言由語句組成,每個語句又由單詞組成;組成語句和語言時,應遵循一定的語法與語義規(guī)則。語言由語音、詞匯和語法構成。語言的基本屬性:語音和文字第二頁,共二十五頁。8.1語言及其理解的一般問題8.1.1語言和語言理解
語言是音義結合的詞匯和語法體系,是實現思維活動的物質形式。語言是以詞為基本單位的,詞匯又受到語法的支配才可構成有意義的和可理解的句子,句子按一定的形式再構成篇章等。語法是語言的組織規(guī)律。語法規(guī)則制約著如何把詞素構成詞,詞構成詞組和句子。語言正是在這種嚴密的制約關系中構成的。用詞素構成詞的規(guī)則叫構詞規(guī)則。語法中的另一部分就是句法。句法也可分成兩部分:詞組構造法和造句法。詞組構造法是詞搭配成詞組的規(guī)則。造句法則是用詞或詞組造句的規(guī)則。第三頁,共二十五頁。8.1語言及其理解的一般問題8.1.1語言和語言理解
另一方面,語言是音義結合的,每個詞匯有其語音形式。自然語言中所涉及的音素并不多,一種語言一般只有幾十個音素。由一個發(fā)音動作所構成的最小的語音單位就是音素。
語言詞匯語法詞熟語詞素詞法句法構形法構詞法造句法詞組構造法第四頁,共二十五頁。8.1語言及其理解的一般問題8.1.1語言和語言理解
2.語言的理解微觀:語言理解是指從自然語言到機器(計算機系統)內部之間的一種映射。宏觀:語言理解是指機器能夠執(zhí)行人類所期望的某些語言功能。這些功能包括:
(1)回答有關提問;(2)提取材料摘要;
(3)不同詞語敘述;
(4)不同語言翻譯。第五頁,共二十五頁。8.1語言及其理解的一般問題8.1.1語言和語言理解對自然語言的理解卻是一個十分艱難的任務。自然語言不僅有語義、語法和語音問題,而且還存在模糊性等問題。自然語言理解的困難是由下列3個因素引起的:(1)目標表示的復雜性;
(2)映射類型的多樣性;
(3)源表達中各元素間交互程度的差異性。自然語言理解是語言學、邏輯學、生理學、心理學、計算機科學和數學等相關學科發(fā)展和結合而形成的一門交叉學科;它能夠理解口頭語言或書面語言。第六頁,共二十五頁。8.1語言及其理解的一般問題8.1.1語言和語言理解語言理解包括下列幾個方面的內容:(1)能夠理解句子的正確詞序規(guī)則和概念,又能理解不含規(guī)則的句子。(2)
知道詞的確切含義、形式、詞類及構詞法。(3)了解詞的語義分類以及詞的多義性和歧義性。(4)指定和不定特性及所有(隸屬)特性。(5)問題領域的結構知識和時間概念。(6)語言的語氣信息和韻律表現。(7)有關語言表達形式的文學知識。(8)論域的背景知識。第七頁,共二十五頁。8.1語言及其理解的一般問題8.1.2自然語言理解研究的進展和發(fā)展趨勢1.研究進展機器翻譯是自然語言理解最早的研究領域。
(1)萌芽時期(20世紀40年代~60年代中期)1949年俄-英和英-俄文字的機器翻譯1956年N.Chomsky形式語言和轉換生成語法理論1966年美國科學院報告,否定性結論
(2)復蘇發(fā)展時期(20世紀60年代后期~80年代中期)
關鍵詞匹配技術;句法-語義分析技術。MIT的SIR系統、ELIZA系統第八頁,共二十五頁。8.1語言及其理解的一般問題8.1.2自然語言理解研究的進展和發(fā)展趨勢句法方面理論研究成果:約束管轄理論、擴充轉移網絡、詞匯功能語法、功能合一語法、廣義短語結構語法、句法分析算法、…
語義分析方面:格語法、語義網絡、優(yōu)選語義學、蒙塔格語法、…進入80年代之后,自然語言理解的應用研究廣泛開展,機器學習研究又十分活躍,并出現了許多具有較高水平的實用化系統。這些系統是自然語言理解研究的重要成果,表明自然語言理解在理論上和應用上取得了突破性進展。
第九頁,共二十五頁。8.1語言及其理解的一般問題8.1.2自然語言理解研究的進展和發(fā)展趨勢
(3)繁榮發(fā)展時期(20世紀80年代后期至今)
基于語料庫的統計方法:從真實預料中獲取語言知識
基于統計模型的自然語言處理系統
理性主義與經驗主義的結合
口語理解和生成
我國自然語言理解研究第十頁,共二十五頁。8.1語言及其理解的一般問題8.1.2自然語言理解研究的進展和發(fā)展趨勢2.發(fā)展趨勢(1)基于句法-語義規(guī)則的理性主義方法和以模型和統計為基礎的經驗主義互相結合、共同發(fā)展。
(2)語料庫語言學使大規(guī)模真實文本的處理成為自然語言處理的主要戰(zhàn)略目標。
(3)統計數學方法日益受到重視,機器學習的方法獲取語言知識。
(4)詞匯知識庫繼語料庫之后成為一個新的受到普遍關注的研究問題。
第十一頁,共二十五頁。8.1語言及其理解的一般問題8.1.3自然語言理解過程的層次
語言的分析和理解過程是一個層次化的過程?,F代語言學家把這一過程分為3個層次:詞法分析、句法分析和語義分析。如果接收到的是語音流,那么在上述3個層次之前還應當加入一個語音分析層。雖然這種層次之間并非是完全隔離的,但是這種層次化的劃分的確有助于更好地體現語言本身的構成。1.語音分析語音分析則是根據音位規(guī)則,從語音流中區(qū)分出一個個獨立的音素,再根據音位形態(tài)規(guī)則找出一個個音節(jié)及其對應的詞素或詞。第十二頁,共二十五頁。8.1語言及其理解的一般問題8.1.3自然語言理解過程的層次2.詞法分析詞法分析的主要目的是找出詞匯的各個詞素,從中獲得語言學信息。3.句法分析句法分析是對句子和短語的結構進行分析。自動句法分析的方法很多,有短語結構語法、格語法、擴充轉移網絡、功能語法等等。句法分析的最大單位就是一個句子。分析的目的就是找出詞、短語等的相互關系以及各自在句子中的作用等,并以一種層次結構來加以表達。第十三頁,共二十五頁。8.1語言及其理解的一般問題8.1.3自然語言理解過程的層次4.語義分析語義分析就是通過分析找出詞義、結構意義及其結合意義,從而確定語言所表達的真正含義或概念。在語言自動理解中,語義愈來愈成為一個重要的研究內容。第十四頁,共二十五頁。8.2詞法分析英語等拼音文字:分詞簡單,詞素提取難中文:詞素提取易(每個字就是一個詞素),分詞難中文分詞兩大難題:。(1)歧義識別歧義是指同樣的一句話,可能有兩種或者更多的切分方法。(2)新詞識別
中科院詞法分析系統ICTCLAS,準確率可達95%
第十五頁,共二十五頁。8.3句法分析句法模式匹配和轉移網絡
句法模式匹配就是采用句法模式來對語言的句子進行匹配從而進行句法分析。但是自然語言是非常多樣化的,因而需要有許多模式。這些模式可用狀態(tài)轉移圖來表示,這種用狀態(tài)轉移圖來表示的表達方式稱之為轉移網絡(TN,transitionnetwork)。第十六頁,共二十五頁。8.3句法分析擴充轉移網絡擴充轉移網絡ATN是由伍茲(Woods)在1970年提出的。ATN是由一組網絡所構成的,每個網絡都有一個網絡名,每條弧上的條件擴展為條件加上操作。這種條件和操作采用寄存器的方法來實現,在分析樹的各個成分結構上都放上寄存器,用來存放句法功能和句法特征,條件和操作將對它們不斷地進行訪問和設置。
第十七頁,共二十五頁。8.3句法分析詞匯功能語法的結構
詞匯功能語法(LFG)是由卡普蘭和布魯斯南(Bresnan)在1982年提出的,它是一種功能語法,但是更加強調詞匯的作用。LFG用一種結構來表達特征、功能、詞匯和成分的順序。
第十八頁,共二十五頁。8.4語義分析語義分析:獲得語言所表達的意義。
第一步是要確定每個詞在句子中所表達的詞義,這涉及到詞義和句法結構上的歧義問題;第二步是要根據已有的背景知識來確定語義。
方法:語義的邏輯分析法、語義分析文法第十九頁,共二十五頁。8.5句子理解簡單句理解的內容
簡單句理解兩方面的工作:
(1)理解語句中的每一個詞。
(2)以這些詞為基礎組成可以表達整個語句意義的結構。復合句的理解
句子之間的相互關系:(1)相同的事物;(2)事物的一部分;(3)行動的一部分;(4)與行動有關的事物;(5)因果關系;(6)計劃次序。第二十頁,共二十五頁。8.6語料庫語言學語料庫的研究:自然語言文本的采集、存儲、檢索、統計、詞性和句法標注、句法語義分析、…定義:
Aijmer1991“根據篇章材料對語言的研究稱為語料庫語言學”
McEnery1996“基于現實生活中語言應用實例進行語言研究稱為語料庫語言學”Crystal1991“以語料為語言描寫的起點或者以語料為驗證有關語言假說的方法稱為語料庫語言學”語料庫:第二十一頁,共二十五頁。8.7機器翻譯機器翻譯的過程:原文輸入原文分析:查詞典、語法分析譯文綜合:調整詞序、修辭、從譯文詞典中取詞
譯文輸出第二十二頁,共二十五頁。8.8語音識別預處理特征提取模式識別訓練模式庫語音輸入語音識別結果第二十三頁,共二十五頁。8.9應用舉例問題思考思考答案訊飛語音云問答服務云訊飛語音云思考聲音聲音文字答案問題文字123國家大學生創(chuàng)新實驗項目第二十四頁,共二十五頁。內容總結目錄。語言使用于傳遞信息的表示方法、約定和規(guī)則的集合。語言正是在這種嚴密的制約關系中構成的。詞組構造法是詞搭配成詞組的規(guī)則。自然語
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 護理督查工作匯報
- 師德師風宣講活動簡報(18篇)
- 初級會計實務-2021年5月16日上午初級會計職稱考試《初級會計實務》真題
- 初級會計經濟法基礎-初級會計《經濟法基礎》??荚嚲?17
- 增強現實環(huán)境下前列腺穿刺手術導航技術研究
- 動液面深度測量儀中聲波信號處理方法研究
- 航空葉片輔助自動測量方法研究
- 二零二五年度教育機構教師代理任聘服務規(guī)范文本3篇
- 二零二五年度二手車交易平臺會員制買賣合同范本4篇
- 二零二五年度虛擬現實技術應用個人技術服務協議4篇
- 搞笑小品劇本《大城小事》臺詞完整版
- 《健康體檢知識》課件
- 《大模型原理與技術》全套教學課件
- 2023年護理人員分層培訓、考核計劃表
- 生產計劃主管述職報告
- GB/T 44769-2024能源互聯網數據平臺技術規(guī)范
- 2025年四川省新高考八省適應性聯考模擬演練(二)地理試卷(含答案詳解)
- 【經典文獻】《矛盾論》全文
- 部編版語文五年級下冊 第一單元 專項訓練課外閱讀(含答案)
- Vue3系統入門與項目實戰(zhàn)
- 2024年寧夏回族自治區(qū)中考英語試題含解析
評論
0/150
提交評論