《人工智能》(何澤奇)491-6教案 第17課 自然語言處理_第1頁
《人工智能》(何澤奇)491-6教案 第17課 自然語言處理_第2頁
《人工智能》(何澤奇)491-6教案 第17課 自然語言處理_第3頁
《人工智能》(何澤奇)491-6教案 第17課 自然語言處理_第4頁
《人工智能》(何澤奇)491-6教案 第17課 自然語言處理_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

PAGE10PAGE10PAGE9PAGE9課題自然語言處理課時(shí)2課時(shí)(90min)教學(xué)目標(biāo)知識技能目標(biāo):(1)熟悉自然語言處理的基本概念和基本框架(2)理解自然語言處理的過程劃分(3)掌握自然語言處理的基本流程思政育人目標(biāo):熟悉技術(shù)應(yīng)用新領(lǐng)域,開闊視野,激發(fā)創(chuàng)新思維,培養(yǎng)鉆研精神關(guān)心國家大事,抓住機(jī)遇,展現(xiàn)新作為,增強(qiáng)愛黨、愛國情感了解國家政策,增強(qiáng)合理使用人工智能技術(shù)的意識,加強(qiáng)法律意識,樹立正確的價(jià)值觀教學(xué)重難點(diǎn)教學(xué)重點(diǎn):自然語言處理的基本框架教學(xué)難點(diǎn):掌握自然語言處理的基本流程教學(xué)方法講授法、討論法、問答法教學(xué)用具計(jì)算機(jī)、投影儀、多媒體課件、教材教學(xué)設(shè)計(jì)→→→傳授新知(30min)→→傳授新知(40min)→課堂練習(xí)(7min)→課堂小結(jié)(3min)→作業(yè)布置(2min)教學(xué)過程主要教學(xué)內(nèi)容及步驟設(shè)計(jì)意圖課前任務(wù)【教師】布置課前任務(wù),和學(xué)生負(fù)責(zé)人取得聯(lián)系,讓其提醒同學(xué)通過文旌課堂APP或其他學(xué)習(xí)軟件,完成課前任務(wù)人類每天都要進(jìn)行大量的交流,兩個(gè)人進(jìn)行互相交流的前提是互相能聽懂對方的意思,搜索一下人工智能怎樣對人類的語言進(jìn)行識別處理,了解一下圖靈測試?!緦W(xué)生】完成課前任務(wù)通過課前任務(wù),使學(xué)生了解本次課程的重點(diǎn),增加學(xué)生的學(xué)習(xí)興趣考勤

(2min)【教師】通過文旌課堂APP讓學(xué)生簽到【學(xué)生】簽到,班干部交假條培養(yǎng)學(xué)生的組織紀(jì)律性,掌握學(xué)生的出勤情況問題導(dǎo)入(3min)【教師】提出以下問題,并邀請學(xué)生回答叫一聲手機(jī)智能助手就能夠得到回復(fù),并且有些手機(jī)語音助手還能夠和人類聊天,思考一下手機(jī)的智能助手為什么能和人類進(jìn)行交流呢?【學(xué)生】討論、舉手回答【教師】通過學(xué)生的回答引入要講的知識,并板書:自然語言處理本節(jié)課主要介紹自然語言處理的相關(guān)知識?!緦W(xué)生】聆聽通過問題導(dǎo)入的方法,引導(dǎo)學(xué)生主動思考,激發(fā)學(xué)生的學(xué)習(xí)興趣傳授新知

(30min)9.1自然語言處理概述9.1.1自然語言處理的基本概念【教師】提問:什么是自然語言處理?【學(xué)生】討論、舉手回答【教師】總結(jié)語言是思維的載體,是交際的主要媒介,包括口語、書面語和形體語(如啞語)等。自然語言是指人們生活中使用的語言,如漢語、英語、德語等。自然語言處理(naturallanguageprocessing,NLP)自然語言處理是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個(gè)重要方向,它主要包括自然語言理解和自然語言生成兩方面內(nèi)容。自然語言理解又稱為計(jì)算語言學(xué),是指將自然語言轉(zhuǎn)化成易于計(jì)算機(jī)程序理解和處理的形式。自然語言生成則是將存儲于計(jì)算機(jī)中的數(shù)據(jù)轉(zhuǎn)化為人們能夠理解的自然語言?!窘處煛恐v解自信中國相關(guān)內(nèi)容9.1.2自然語言處理的發(fā)展歷程【教師】安排學(xué)生掃描二維碼“自然語言處理的應(yīng)用——搜狗汪仔”,了解案例【學(xué)生】掃碼觀看、了解案例【教師】用PPT展示“自然語言處理的發(fā)展歷程”圖片,進(jìn)行介紹自然語言處理的發(fā)展歷程可分為5個(gè)時(shí)期,如圖所示?!緦W(xué)生】聆聽、理解9.1.3自然語言處理的研究方向自然語言處理的研究和應(yīng)用是人工智能領(lǐng)域的一項(xiàng)重大突破,必

并對人們的生活產(chǎn)生深遠(yuǎn)的影響。隨著計(jì)算機(jī)技術(shù)和硬件設(shè)備的大幅度提升,自然語言處理的研究方向也越來越廣闊?!窘處煛坑肞PT展示“自然語言處理的研究方向”表格,列舉了自然語言處理的部分研究方向,進(jìn)行知識講解此外,還有自然語言生成、問答系統(tǒng)、語言教學(xué)等也都是自然語言處理的研究方向?!緦W(xué)生】聆聽、理解9.1.4自然語言處理的基本框架【教師】用PPT展示“自然語言處理的基本框架”圖片,進(jìn)行講解說明自然語言處理不是一個(gè)獨(dú)立的技術(shù),它受到大數(shù)據(jù)、云計(jì)算、機(jī)器學(xué)習(xí)等多方面理論的支撐。自然語言處理的基本框架可用圖表示。【學(xué)生】聆聽、理解9.2自然語言處理的過程劃分自然語言是由字成詞,由詞成句,由句成段的一個(gè)層次化過程。因此,完整的自然語言處理也是一個(gè)層次化的過程?!窘處煛坑肞PT展示“自然語言處理的過程”圖片,講解自然語言處理的過程許多現(xiàn)代語言學(xué)家將這個(gè)過程劃分為5個(gè)層次,如圖9-3所示?!緦W(xué)生】聆聽、理解9.2.1語音分析語音分析是根據(jù)音位規(guī)則,從語音流中區(qū)分出獨(dú)立的音素,再根據(jù)音位形態(tài)規(guī)則找出音節(jié)及其對應(yīng)的詞素或詞語的過程?!窘處煛刻嵝眩阂羲厥亲钚∏铱瑟?dú)立的聲音單元。語音以聲波的形式傳送,語音分析系統(tǒng)接收聲波(模擬信號),并從中抽取頻率、能量等特征,之后,將這些特征映射為音素(單個(gè)聲音單元),最后將音素序列轉(zhuǎn)換成單詞序列。語音的產(chǎn)生是將單詞映射為音素序列,然后傳送給語音合成器,單詞的聲音通過說話者(機(jī)器人或語音助手等)從語音合成器發(fā)出。9.2.2詞法分析【教師】講解詞法分析相關(guān)知識詞法分析是從句子中切分出單詞,找出詞語的各個(gè)詞素,從中獲得單詞的語言學(xué)信息并確定單詞的詞義。不同的語言(如英語、漢語等)對詞法分析的要求是不同的。在英語中,由于單詞之間是以空格自然分割開的,因此,很容易從句子中切分出單詞。但是,英語單詞有詞性、時(shí)態(tài)、數(shù)量和派生等變化,無疑是增加了找出詞素的復(fù)雜性。要想找出詞素,通常需要對詞尾或詞頭進(jìn)行分析。例如,importable可以是im-port-able或import-able,其中im、port和able都是詞素。詞法分析可以從詞素中獲得許多有用的語言學(xué)信息,這些信息有助于進(jìn)行句法分析。例如,英語中構(gòu)成詞尾的詞素s通常表示復(fù)數(shù)或第三人稱單數(shù)。在漢語中,每個(gè)字都代表一個(gè)詞素,因此找出詞素是非常容易的,但是要切分出詞是困難的。切分詞不僅需要構(gòu)造詞的知識,還需要解決切分歧義的問題。例如,“我們研究所有東西”可切分為“我們—研究所—有—東西”或“我們—研究—所有—東西”,兩者之間存在切分歧義問題。9.2.3句法分析【教師】講解句法分析相關(guān)知識句法分析是對句子或短語結(jié)構(gòu)進(jìn)行分析,其目的是確定構(gòu)成句子的詞、短語等之間的相互關(guān)系,以及它們在句子中的作用等,并將這些關(guān)系以一種層次結(jié)構(gòu)表達(dá),最后對句法結(jié)構(gòu)進(jìn)行規(guī)范化。句法分析的最大單位是一個(gè)句子。文法是用于描述句子語法結(jié)構(gòu)的形式規(guī)則,任何一種語言都有它自己的文法。最常見的文法類型有4種,即無約束短語結(jié)構(gòu)文法(0型文法)、上下文有關(guān)文法(1型文法)、上下文無關(guān)文法(2型文法)和正則文法(3型文法)?!窘處煛刻嵝眩何姆ㄐ吞栐礁咚芗s束越多,生成能力就越弱,能生成的語言集也越小,描述能力就越弱。9.2.4語義分析【教師】講解語義分析相關(guān)知識語義分析是通過找出詞義、結(jié)構(gòu)意義及不同詞結(jié)合的意義,確定語言所表達(dá)的真正含義或意思。常用的語義分析方法有語義文法和格文法。語義文法是將文法知識和語義知識組合起來,并以統(tǒng)一方式定義的文法規(guī)則集。它可以排除無意義的句子,且能夠忽略對語義沒有影響的句法問題,還具有較高的效率。但同樣也存在一定的不足,即在實(shí)際應(yīng)用中需要大量的文法規(guī)則,因此,只適用于受到嚴(yán)格限制的領(lǐng)域。格文法允許以動詞為中心構(gòu)造分子結(jié)構(gòu),其目的是找出動詞和名詞(與動詞都處于結(jié)構(gòu)關(guān)系中)的語義關(guān)系。格文法是一種有效的語義分析方法,有助于刪除句法分析的歧義性,且易于使用。9.2.5語用分析【教師】講解語用分析相關(guān)知識語用分析就是研究語言所在的外界環(huán)境對語言使用產(chǎn)生的影響。例如,人在恐慌時(shí)的表達(dá)方式與平時(shí)生活中的表達(dá)方式具有很大的差異性,這是由環(huán)境變化引起的。語用分析是自然語言處理中更高層次的研究?!緦W(xué)生】聆聽、記錄、理解通過教師的講解和課堂互動,使學(xué)生了解自然語言處理概念課堂思政,使學(xué)生熟悉技術(shù)應(yīng)用新領(lǐng)域,開闊學(xué)生視野,加強(qiáng)學(xué)生的國家榮譽(yù)感新知導(dǎo)入(3min)【教師】講解新的知識自然語言是由字成詞,由詞成句,由句成段的一個(gè)層次化過程。因此,完整的自然語言處理也是一個(gè)層次化的過程?!緦W(xué)生】聆聽【教師】導(dǎo)入新的知識點(diǎn):自然語言處理的過程劃分通過導(dǎo)入環(huán)節(jié),激發(fā)學(xué)生的學(xué)習(xí)興趣傳授新知(40min)9.3自然語言處理的基本流程【教師】講解自然語言處理的基本流程雖然自然語言處理技術(shù)可應(yīng)用于多個(gè)不同的領(lǐng)域,但其基本流程大致相同?!窘處煛坑肞PT展示“自然語言處理的基本流程”圖片,進(jìn)行舉例說明基于語料庫的自然語言處理技術(shù)的基本流程可用圖9-4表示?!緦W(xué)生】聆聽、理解9.3.1獲取語料語料是指語言材料,它是構(gòu)成語料庫的基本單元。通常,人們會簡單地用文本表示語料,并把文本中的上下文關(guān)系作為現(xiàn)實(shí)世界中語言的上下文關(guān)系的替代品。通常將一個(gè)文本集合稱為語料庫,將多個(gè)這樣的文本集合稱為語料庫集合。語料的獲取途徑有兩種,即整理語料和抓取語料。整理語料是指在已有語料的基礎(chǔ)上,對很多業(yè)務(wù)部門、公司等單位積累的大量紙質(zhì)或者電子文本資料稍加整合,并把紙質(zhì)的文本全部電子化就可以作為語料庫。抓取語料是指在沒有語料的情況下,可通過網(wǎng)絡(luò)下載國內(nèi)外公開的語料庫或利用爬蟲技術(shù)抓取網(wǎng)絡(luò)的公開數(shù)據(jù)構(gòu)建語料庫。9.3.2語料預(yù)處理語料預(yù)處理是自然語言處理流程中的關(guān)鍵步驟,語料預(yù)處理的好壞直接影響到自然語言處理技術(shù)的性能。語料預(yù)處理的基本過程可用圖9-5描述?!窘處煛坑肞PT展示“自然語言處理的基本流程”圖片,進(jìn)行舉例說明語料預(yù)處理的基本過程可用圖9-5描述?!緦W(xué)生】聆聽、理解1.?dāng)?shù)據(jù)清洗數(shù)據(jù)清洗是對數(shù)據(jù)進(jìn)行重新審查和校驗(yàn)的過程,目的在于刪除重復(fù)信息、糾正存在的錯(cuò)誤,并保證數(shù)據(jù)一致性。在這里,數(shù)據(jù)清洗主要是在語料中找到感興趣的內(nèi)容,將不感興趣和視為噪音的內(nèi)容清洗刪除。例如,對原始文本提取標(biāo)題、摘要、正文等信息,而對爬取的網(wǎng)頁內(nèi)容,去除廣告、標(biāo)簽、HTML、JS等代碼和注釋等。常用的數(shù)據(jù)清洗方法有人工去重、標(biāo)記、降噪和對齊等,規(guī)則提取內(nèi)容、正則表達(dá)式匹配、根據(jù)詞性和命名實(shí)體提取等,編寫腳本或代碼批處理等。2.分詞分詞是指將短文本和長文本處理為最小單位粒度(詞或詞語)的過程。常見的分詞方法有基于字符串匹配的分詞方法、基于理解的分詞方法、基于統(tǒng)計(jì)的分詞方法和基于規(guī)則的分詞方法等。其中,每種方法下面對應(yīng)許多具體的算法?!窘處煛恐攸c(diǎn)強(qiáng)調(diào)如下問題當(dāng)前,中文分詞算法的主要難點(diǎn)有歧義識別和新詞識別。例如,“羽毛球拍賣完了”可以切分為“羽毛—球拍—賣—完—了”,也可切分成“羽毛球—拍賣—完—了”,如果不依賴上下文其他的句子,很難知道該如何理解該句子?!緦W(xué)生】聆聽、記錄、理解3.詞性標(biāo)注詞性標(biāo)注就是給每個(gè)詞或者詞語打詞類標(biāo)簽,如形容詞、動詞、名詞等。它有助于讓文本在后面的處理中融入更多有用的語言信息。詞性標(biāo)注是一個(gè)經(jīng)典的序列標(biāo)注問題,不過對于某些基于自然語言處理的問題,詞性標(biāo)注不是必需的。例如,常見的文本分類問題不需要關(guān)心詞性問題。但是,類似情感分析、知識推理等問題,詞性標(biāo)注卻是必不可少的。常見的詞性標(biāo)注方法有基于最大熵的詞性標(biāo)注、基于統(tǒng)計(jì)最大概率輸出的詞性標(biāo)注和基于HMM(隱馬爾可夫模型)的詞性標(biāo)注等。4.去停用詞停用詞一般指對文本特征沒有任何貢獻(xiàn)的字或詞,如標(biāo)點(diǎn)符號、語氣、人稱等。但是,在實(shí)際的操作中要根據(jù)具體的場景決定將哪些停用詞去掉。例如,在情感分析中,由于語氣詞、感嘆號等對表示語氣程度、感情色彩有一定的貢獻(xiàn)和意義,故應(yīng)該保留它們。9.3.3特征工程語料預(yù)處理結(jié)束后,首先要考慮的問題是如何將分詞之后的字和詞語表示成可供計(jì)算機(jī)計(jì)算的類型。因此,須將字和詞語的字符串形式轉(zhuǎn)化成向量形式。常用的表示模型有詞袋模型和詞向量。詞袋模型(bagofwords,BOW)不考慮詞語在句子中的原本順序,直接將每一個(gè)詞語或符號統(tǒng)一放置在一個(gè)集合(如list)中,然后按照計(jì)數(shù)的方式對詞語或符號出現(xiàn)的次數(shù)進(jìn)行統(tǒng)計(jì)。詞向量是將字和詞語轉(zhuǎn)換成矩陣向量的計(jì)算模型。目前,常用的詞表示方法有One-Hot、Word2Vec、Doc2Vec、WordRank和FastText等。9.3.4特征選擇在實(shí)際問題中,為了構(gòu)造好的特征向量,要選擇合適的、表達(dá)能力強(qiáng)的特征。特征選擇是一個(gè)很有挑戰(zhàn)的過程,更多地依賴于經(jīng)驗(yàn)和專業(yè)知識。目前,有很多現(xiàn)成的算法可以進(jìn)行特征選擇,如DF、MI、IG、CHI、WLLR、WFO等?!窘處煛刻嵝眩何谋咎卣饕话愣际窃~語,還具有語義信息,使用特征選擇能夠找出一個(gè)特征子集,且仍然可以保留其語義信息;但通過特征提取找到的特征子空間,將會丟失部分語義信息。因此,在自然語言處理中常使用特征選擇方法構(gòu)造特征向量。9.3.5模型訓(xùn)練特征向量已選好,接下來對模型進(jìn)行訓(xùn)練。針對不同的應(yīng)用需求,要使用不同的模型。傳統(tǒng)的機(jī)器學(xué)習(xí)模型有KNN、SVM、K-means和決策樹等;深度學(xué)習(xí)模型有CNN、RNN、TextCNN和LSTM等。9.3.6模型評估模型訓(xùn)練好之后,需要對模型進(jìn)行評估,目的是使模型對語料具有較好的泛化能力。常用的評價(jià)指標(biāo)有錯(cuò)誤率、準(zhǔn)確率、精確度、召回率、F1衡量、ROC曲線和AUC曲線等。9.3.7模型上線應(yīng)用模型評估合格之后,模型上線,進(jìn)入應(yīng)用階段。目前主流的應(yīng)用方式有提供服務(wù)的方式和將模型持久化的方式。提供服務(wù)的方式是在線下訓(xùn)練模型,然后將模型做線上部署,發(fā)布成接口服務(wù),供業(yè)務(wù)系統(tǒng)使用。將模型持久化的方式是在線訓(xùn)練模型,訓(xùn)練完成之后把模型pickle持久化,在線服務(wù)接口模板通過讀取pickle實(shí)現(xiàn)改變接口服務(wù)。9.3.8模型重構(gòu)模型重構(gòu)在自然語言處理中并不是必需的,而是當(dāng)模型應(yīng)用到其他領(lǐng)域效果不好時(shí)或需要增加其他業(yè)務(wù)需求時(shí),才需要對模型的整體進(jìn)行重構(gòu)。根據(jù)業(yè)務(wù)的不同側(cè)重點(diǎn)對自然語言處理流程中的每一步進(jìn)行調(diào)整,并重新訓(xùn)練模型上線。9.4案例分析:情感分析在信息時(shí)代,人們接觸和獲取的信息遠(yuǎn)遠(yuǎn)超過了他們自己的需要,且他們不完全具備處理大量信息的能力,這導(dǎo)致信息過載的現(xiàn)象出現(xiàn)。因此,計(jì)算機(jī)自動歸納文檔和自主理解信息含義的能力就顯得尤為重要。情感分析作為自然語言處理中常見的應(yīng)用,可以從大量的文檔數(shù)據(jù)中獲取、識別并歸納有用的信息,而且它還可以理解這些信息中更深層次的含義。在實(shí)際應(yīng)用中,企業(yè)常通過情感分析了解消費(fèi)者對產(chǎn)品的反饋情況,從而改善產(chǎn)品質(zhì)量。例如,從送達(dá)時(shí)間、送餐員態(tài)度、菜品口感、菜品豐富度等多個(gè)維度對某平臺的外賣評價(jià)進(jìn)行情感分析,掌握用戶的情感指數(shù),并根據(jù)分析結(jié)果改進(jìn)外賣服務(wù)。由此可見,通過對用戶評價(jià)的情感分析,可以挖掘產(chǎn)品在各個(gè)維度的優(yōu)劣,從而有針對性地改進(jìn)產(chǎn)品。情感分析的實(shí)現(xiàn)方法有兩種,即基于情感詞典的方法和基于深度學(xué)習(xí)的方法。9.4.1基于情感詞典的方法基于情感詞典的方法是傳統(tǒng)的情感分析方法,其執(zhí)行過程可用圖9-6描述。首先,輸入文本(短語或句子等);然后,對文本數(shù)據(jù)進(jìn)行預(yù)處理,包括數(shù)據(jù)清洗、分詞、詞性標(biāo)注和去停用詞等;接著,將獲得的分詞載入已經(jīng)構(gòu)建好的情感詞典中;最后,利用判斷規(guī)則確定文本分詞后的詞語屬于情感詞典中的哪一類,從而實(shí)現(xiàn)情感分類?!窘處煛坑肞PT展示“基于情感詞典的情感分析”和“情感詞典”圖片,進(jìn)行知識講解1.情感詞典情感詞典在整個(gè)情感分析中至關(guān)重要,其主要包含4種詞語表,即積極情感詞語表,消極情感詞語表、否定詞語表和程度副詞表,如圖9-7所示。【學(xué)生】聆聽、理解【教師】提醒:構(gòu)建情感詞典的方法有很多,可以自己利用語料進(jìn)行訓(xùn)練獲得情感詞典,也可以使用目前已有的開源情感詞典,如知網(wǎng)情感詞典、BosonNLP情感詞典等。2.情感詞典文本匹配算法【教師】用PPT展示“情感分析框架圖”圖片,進(jìn)行知識講解基于情感詞典的情感分析實(shí)現(xiàn)方法中,采用文本匹配算法確定文本分詞后的詞語所屬情感類型。采用該算法對文本進(jìn)行情感分析的整體框架可用圖9-8描述?!緦W(xué)生】聆聽、理解(1)采用結(jié)巴分詞(一種分詞方法)對輸入文本進(jìn)行分詞,獲取向量詞組。(2)對每個(gè)詞語進(jìn)行詞性判別,如果詞語命中詞典,則進(jìn)行相應(yīng)權(quán)重的處理。【教師】提醒:積極詞語權(quán)重為加法,消極詞語權(quán)重為減法,否定詞權(quán)重取相反數(shù),程度副詞權(quán)重和其修飾的詞語權(quán)重相乘。(3)輸出最終權(quán)重值。利用權(quán)重值區(qū)分詞語的情感類型?!窘處煛颗e例說明:例如,對文本“我特別喜歡北京,因?yàn)楸本┯泻芏喾浅V墓糯z跡”進(jìn)行情感分析,其分析過程如下。(1)以“,”為分隔將該文本劃分為兩個(gè)分句,即“我特別喜歡北京”和“因?yàn)楸本┯泻芏喾浅V墓糯z跡”。(2)分別對它們進(jìn)行分詞,可得“我—特別—喜歡—北京”和“因?yàn)椤本小芏唷浅!摹糯z跡”。(3)分析詞性類別,計(jì)算最終權(quán)重值。分句“我—特別—喜歡—北京”中含有1個(gè)積極詞語“喜歡”,其前面的詞語“特別”屬于程度副詞(設(shè)權(quán)重為5),無消極詞語,則該分句的權(quán)重值為。分句“因?yàn)椤本小芏唷浅!摹糯z跡”含有1個(gè)積極詞語“著名的”,其前面的詞語“非?!睂儆诔潭雀痹~(設(shè)權(quán)重為4),同樣不含消極詞語,則該分句的權(quán)重值為。綜上所述,該文本的最終權(quán)重值為,其表達(dá)的情感屬于正面情感。9.4.2基于深度學(xué)習(xí)的方法【教師】用PPT展示“基于深度學(xué)習(xí)的情感分析”圖片,進(jìn)行舉例說明隨著計(jì)算硬件設(shè)備的提升,基于深度學(xué)習(xí)的情感分類方法應(yīng)運(yùn)而生,其實(shí)現(xiàn)過程可用圖9-9描述?!緦W(xué)生】聆聽、理解(1)輸入文本進(jìn)行情感分析。(2)對文本進(jìn)行數(shù)據(jù)清洗、分詞、詞性標(biāo)注和去停用詞等預(yù)處理。(3)對預(yù)處理后的詞語進(jìn)行詞向量編碼。(4)利用LSTM網(wǎng)絡(luò)(長短期記憶網(wǎng)絡(luò))進(jìn)行特征提取?!窘處煛刻嵝眩篖STM網(wǎng)絡(luò)是一種時(shí)間循環(huán)神經(jīng)網(wǎng)絡(luò),是為了解決一般的RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))存在的長期依賴問題而設(shè)計(jì)出來的。它是一種深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),普遍用于自主語音識別。(5)通過全連接層和softmax輸出每個(gè)分類的概率,從而得到情感分類?!窘處煛刻嵝眩喝B接層的每一個(gè)結(jié)點(diǎn)都與上一層的所有結(jié)點(diǎn)相連,用來把前面提取到的特征綜合起來。由于其全相連的特性,一般全連接層的參數(shù)是最多的。softmax是深度學(xué)習(xí)中常用且比較重要的函數(shù),其作用是將多個(gè)神經(jīng)元的輸出,映射到(0,1)區(qū)間內(nèi),可以理解為概率,從而來實(shí)現(xiàn)多分類。【教師】講解居安思危的相關(guān)內(nèi)容在人工智能產(chǎn)業(yè)逐漸擴(kuò)大的同時(shí),其發(fā)展的不確定性也帶來了新的挑戰(zhàn)。例如,情感運(yùn)算和自然語言處理更易于操縱人類感情和提取敏感信息,可能會給社會和經(jīng)濟(jì)秩序帶來沖擊。針對人工智能發(fā)展帶來的挑戰(zhàn),我們要加強(qiáng)人工智能發(fā)展的潛在風(fēng)險(xiǎn)研判和防范,維護(hù)人民利益和國家安全,確保人工智能安全、可靠、可控。要整合多學(xué)科力量,加強(qiáng)人工智能相關(guān)法律、倫理、社會問題研究,建立健全保障人工智能健康發(fā)展的法律法規(guī)、制度體系、倫理道德?!緦W(xué)生】聆聽、記錄、理解通過老師

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論