技術(shù)報告基于注意力機制的雙向LSTM模型在中文商品評論情感分類中_第1頁
技術(shù)報告基于注意力機制的雙向LSTM模型在中文商品評論情感分類中_第2頁
技術(shù)報告基于注意力機制的雙向LSTM模型在中文商品評論情感分類中_第3頁
技術(shù)報告基于注意力機制的雙向LSTM模型在中文商品評論情感分類中_第4頁
技術(shù)報告基于注意力機制的雙向LSTM模型在中文商品評論情感分類中_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、計劃類別 項目編號 項目技術(shù)報告課題名稱 項目主持人 承擔單位 題目:基于注意力機制的雙向LSTM模型在中文商品評論情感分類中的研究國內(nèi)電商網(wǎng)站的快速發(fā)展促使產(chǎn)生大量的中文商品評論信息。對這些評論進行情感分類有利于獲取其中的有用信息,具有重要的應用意義。目前,情感分類的研究主要基于情感詞典或者傳統(tǒng)機器學習。這些方法通常需要人工選取特征,費事費力,分類效果不好。針對這些不足,本文提出一種基于注意力機制的雙向LSTM模型,對中文商品評論進行情感分類。實驗結(jié)果表明,該模型在中文商品評論二分類任務和三分類任務中均獲得了較好的準確率、召回率、F1值。關(guān)鍵詞:中文商品評論;情感分類;注意力機制;雙向LST

2、MAbstract:With the rapid development of domestic E-commerce websites,there are lots of Chinese product reviews.The sentiment classification of Chinese product reviews is helpful to obtain useful information,with great application significance.Currently,most sentiment classification studies are based

3、 on the sentiment dictionary or traditional machine learning methods.These methods usually need artificial selection of features,with low classification efficiency and effectiveness.In view of all these deficiencies,the paper proposes an attention mechanism-based bidirectional LSTM model for the sen

4、timent classification of Chinese product reviews.The experimental results show that the proposed model has better precision rate,recall rate and F1 score in binary classification tasks and three classification tasks in Chinese product reviews.Keywords:Chinese product reviews;sentiment classification

5、;attention mechanism;bidirectional LSTM1 引言(Introduction)隨著國內(nèi)電商網(wǎng)站的迅猛發(fā)展,越來越多的人選擇網(wǎng)上購物,隨之產(chǎn)生大量的中文商品評論信息。對這些信息進行情感分類,不僅可以挖掘用戶對商品的喜好程度,給潛在用戶提供購買建議,同時有利于商家及時改善產(chǎn)品及服務,從而提高商業(yè)價值。因此,對中文商品評論進行情感分類變得非常必要。傳統(tǒng)的情感分類研究方法主要有兩種:(1)基于情感詞典的方法;(2)基于傳統(tǒng)機器學習的方法1。前者需要人工創(chuàng)建情感詞典,費事費力。后者通常采用樸素貝葉斯(NB)、最大熵(ME)、支持向量機(SVM)等進行分類,這些方法容易

6、丟失文本語法語義信息,很難有效捕獲文本中的情感。隨著深度神經(jīng)網(wǎng)絡在自然語言處理領(lǐng)域的應用,2003年Bengio等人2通過神經(jīng)網(wǎng)絡訓練詞向量來表示文本。詞向量不僅可以有效獲取語義信息3,同時避免了數(shù)據(jù)稀疏性問題。利用詞向量表示文本,并采用深度學習模型,如遞歸神經(jīng)網(wǎng)絡4,5、卷積神經(jīng)網(wǎng)絡(CNN)6,7、循環(huán)神經(jīng)網(wǎng)絡(RNN)8等,進行情感分類可以獲得比傳統(tǒng)機器學習方法更優(yōu)的效果??紤]到在對商品評論進行情感分類時,文本對上下文有較強的依賴性,而標準的神經(jīng)網(wǎng)絡模型不能很好地解決該問題,本文采用雙向的長短時記憶神經(jīng)網(wǎng)絡(Bidirectional Long Sort Term Memory,Bi-L

7、STM)進行情感分類。另外,考慮到不同的詞對文本的貢獻不相同,引入Attention機制。基于此,本文提出了一種基于Attention機制的Bi-LSTM模型對中文商品評論進行情感分類。為了驗證模型的有效性,本文采用某電商網(wǎng)站的手機評論數(shù)據(jù)集對模型進行實驗。實驗結(jié)果表明,該模型取得了較好的效果。2 基于Attention機制的Bi-LSTM模型(Bi-LSTMmodel based on attention mechanism)基于Attention機制的Bi-LSTM模型如圖1所示。該模型主要由四部分組成:(1)采用詞向量表示文本;(2)利用Bi-LSTM模型獲取文本特征;(3)引入Atte

8、ntion機制表示不同特征的重要性;(4)最后利用分類器進行情感分類。3 實驗(Experiment)3.1 數(shù)據(jù)集為了驗證模型,采取某電商網(wǎng)站的手機評論作為數(shù)據(jù)集。該數(shù)據(jù)集共15649篇評論,根據(jù)評論星級劃分為:好評(4星、5星)4373篇評論,中評(3星)4629篇評論,差評(1星、2星)6647篇評論。數(shù)據(jù)集樣例見表1。本文選取好評、差評進行二分類;選擇好評、中評、差評進行三分類。所有的分類任務重,按照80%、10%、10%的比例將數(shù)據(jù)集隨機分為訓練集、驗證集、測試集,見表2。endprint3.2 數(shù)據(jù)預處理本文采用jieba分詞工具對評論文本進行分詞并去除分詞列表中的停用詞和標點符號

9、。處理之后文本最大長度為281。為了構(gòu)建特征向量,詞向量的維度為100,采用兩種方式初始化詞向量:(1)隨機初始化:所有的詞均隨機初始化,并在訓練過程中詞向量動態(tài)更新。(2)使用word2vec工具:使用2013年Google提出的開源工具word2vec訓練詞向量,同時對于未出現(xiàn)的詞隨機初始化,訓練過程中詞向量動態(tài)更新。3.3 實驗參數(shù)設置為了訓練一個較優(yōu)的模型,模型參數(shù)的設置非常關(guān)鍵。模型中主要參數(shù)設置為:學習率為0.01,批處理文件數(shù)為50,Bi-LSTM中隱藏單元數(shù)為200,Dropout值為0.75,L2正則化參數(shù)為0.0001。3.4 實驗結(jié)果及分析為了驗證模型的有效性,將本文提出

10、的模型rand-Attention-Bi-LSTM、word2vec-Attention-Bi-LSTM與LSTM、Bi-LSTM進行比較。模型評價指標為準確率、召回率、F值。實驗結(jié)果見表3。通過表3可以看出:(1)Bi-LSTM和LSTM相比,準確率、召回率、F值均有所提升,這是因為Bi-LSTM同時考慮文本的上下文,說明Bi-LSTM的分類效果優(yōu)于LSTM。(2)由于引入Attention機制,本文的模型準確率、召回率、F值均高于LSTM和Bi-LSTM,說明Attention機制能夠較好地反映文本中詞的重要性。(3)通過word2vec-Attention-Bi-LSTM和rand-At

11、tention-Bi-LSTM對比發(fā)現(xiàn),采用word2vec初始化詞向量更有效,有利于提高情感分類精度。4 結(jié)論(Conclusion)本文提出了一種基于Attention機制的Bi-LSTM模型對中文商品評論進行情感分類。將商品評論用詞向量表示,通過Bi-LSTM獲取文本的上下文關(guān)系,同時引入Attention機制表示不同特征的重要性,并進一步優(yōu)化模型。最后,運用該模型在某電商網(wǎng)站的手機評論集上進行情感分類,實驗結(jié)果驗證了該模型的可行性和有效性。由于中文商品評論中包含對商品多個屬性的評價,下一步工作將尋找更優(yōu)的深度學習模型,對商品評論中的不同屬性進行情感傾向性研究。參考文獻(Referenc

12、es)1 杜昌順,黃磊.分段卷積神經(jīng)網(wǎng)絡在文本情感分析中的應用J.計算機工程與科學,2017,39(01):173-179.2 Yoshua Bengio,Holger Schwenk,Jean-Sbastien Sencal,et al.A Neural Probabilistic Language ModelJ.Journal of Machine Learning Research,2003,3:1137-1155.3 Mikolov Tomas,Yih Wen-tau,Zweig Geoffrey.Linguistic regularities in continuous space

13、word representationsC.The Annual Conference of the North American Chapter of the Association for Computational Linguistics(NAACL-HLT), 2013:746-751.4 Richard Socher,Brody Huval,Christopher D.Manning,et al.Semantic compositionality through recursive matrix vector spacesC.Proceedings of the 2012 Joint

14、 Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning(EMNLP-CoNLL),2012:1201-1211.5 Richard Socher,Alex Perelygin,Jean Wu,et al.Recursive deep models for semantic compositionality over a sentiment TreebankC.Proceedings of 2013 Conference on Empir

15、ical Methods in Natural Language Processing(EMNLP),2013:1631-1642.6 Yoon Kim.Convolutional neural networks for sentence classificationC.Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing(EMNLP),2014:1746-1751.7 Nal Kalchbrenner,Edward Grefenstette,Phil Blunsom.A c

16、onvolutional neural network for modelling sentencesC.Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics(ACL),2014:655-665.endprint8 Siwei Lai,Liheng Xu,Kang Liu,et al.Recurrent convolutional neural networks for text classificationC.Proceedings of the Twenty-Ninth

17、 AAAI Conference on Artificial Intelligence,2015:2267-2273.9 Yequan Wang,Minlie Huang,Xiaoyan Zhu,et al.Attention-based LSTM for Aspect-level Sentiment ClassificationJ.Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing(EMNL),2016:606-615.10 Sepp Hochreiter,Jrgen S

18、chmidhuber.Long short-term memoryJ.Neural computation,1997,9(8):1735-1780.11 Kelvin Xu,Jimmy Ba,Ryan Kiros,et al.Show,attend and tell:Neural image caption generation with visual attentionC.Proceedings of the 32nd International Conference on Machine Learning(ICML),2015:2048-2057.12 Volodymyr Mnih,Nicolas Heess,Alex Graves,et al.Recurrent models o

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論