




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
備案號:DB4401DB4401/T12—2018網絡輿情分級與判定Classificationandjudgmentfornetworkpublicopinion廣州市質量技術監(jiān)督局發(fā)布I Ⅲ 1 1 1 1 2 2 3 3 3 4 5 6 7 7 7 8 9 1全稱為PageRank,是google搜索排名算法中的一個組成部分,級別從1到10級,10級為滿分,PR值AHP:層次分析法(TheAnalyticHierarchyProcLDA:文檔主題生成模型(LatentDirichletAllo2b)數(shù)據分析:構建層次結構的指標體系,選擇VVVVVVVV網絡輿情評價一般流程4指標體系自的子參數(shù),構成了一個層次的指標體系,如圖2所示。針對不同的3網絡輿情評價指標體系網絡輿情評價指標體系5指標量化5.1量化要求5.1.1對網絡輿情評價各指標量化可采用定性或定量的方法,標度范圍為[0,15.1.2對指標定性量化以評價小組成員的平5.2事件指標5.2.1事件性質P1145.2.2事件波及度P12N——表示網站總數(shù)量。5.2.3事件風險度P13P21——網民活躍度;A(t)——在t時刻相關事件的網民活躍值,見公式(3N——平滑參數(shù),表示網民活躍值大于N時具有參考價值。5Na——網民P(t)——網民在t時刻對事件發(fā)布的信息、回復等各種對信息的關注行為次數(shù)。好5.3.3情感傾向度P235.4媒體指標5.4.1媒體權威度P31媒體權威度衡量了某個媒體的可信度和影響力,是一個網絡媒體的最重要指標之一,常以PR值進行表征,見公式(4)。它包括了媒體的性質(政府,綜合大站,娛樂大站,其他),網站新聞真實可靠 P31 PR——網站的PR值,可由站長工具輸入網址得到,取值范圍為[5.4.2傳播擴散度P32x1+x2+x36Tstart——之前的一次觀察時間點;x2——Tend-Tstart微博中有關事件條數(shù);x3——Tend-Tstart微信中有關事件條數(shù)。5.4.3傳播階段P33?1…………………5.5輿情態(tài)勢指標5.5.1熱度P41地域等在互聯(lián)網上的受關注程度。熱度指數(shù)所呈現(xiàn)的數(shù)值為[0,1],數(shù)值越大,表明其網絡受關注度越PYYYYYYYb3——Y3的權重系數(shù),權重比率為17Yb4——Y4的權重系數(shù),權重比率為5%。?1……Yi——第i項新聞、事件的合成結果,i=1、2、3、4;ai——第i項標準化公式參數(shù),i=1、2、3、4,a1是網站新聞標準化公式參數(shù)1.05,a2是微博標準化公式參數(shù)1.001,a3是微信標準化公式參數(shù)1.005,a4是視頻標準化公式參數(shù)1.1;xi——第i項新聞、事件條數(shù),i=1、2、3、4,x1是網站新聞條數(shù),x2是微博中有關事件條數(shù),x3是微信中有關事件條數(shù),x4是視頻中有關事件條Qage——距離話題發(fā)表的時間(天);Qupdate——最近一次更新時間(天)。Pi——第i項指標的得分。a)藍色祥和區(qū):表示安全,正常網絡信息流通,沒有引起網民的關注,沒有輿情傾向;8綜合評價得分取值區(qū)間為[0,1],根據大量數(shù)據統(tǒng)計、實43219A.2Dirichlet分布和多項式分布Dirichlet分布被認為是分布之上的分布。K維Dirichlet分布的定義如下(公式(A.1。pkαk?1………………p=(p1,...,pk),α=(α1,...,αk),且α1,...,αk是相等的。Γ(n)=(n?1)!……………Multipixi……………P(p|x,α)=Dir(p|x+α)iA.3LDA文檔主題生成模型αβKNdZd,nDWd,na)對于主題Z,根據Dirichlet分布(公式(A.1))Dir(β)得到該主題上的一個單詞多項式b)根據泊松分布P和公式(A.4)得到文本的單詞數(shù)目N;c)根據Dirichlet分布(公式(A.1))Dird)對于該文本Nd個單詞中的每一個單詞Wd,n:))))A.4LDA模型的參數(shù)推斷))(k)z?i為除去當前詞后的所有詞的主題分配;w為所有詞;cd,?i為除當前詞以外,文檔d中主題k產生(v)的詞的個數(shù);ck,?i為除當前詞外,主題k詞v出現(xiàn)的次數(shù);V為詞項數(shù)。+βEQ\*jc3\*hps13\o\al(\s\up1(V),v)θEQ\*jc3\*hps14\o\al(\s\up8(k),d)為文檔d中主題k所占比例,φEQ\*jc3\*hps14\o\al(\s\up8(v),k)表示主題k中詞v所占比例。A.5LDA模型訓練和推理a)隨機初始化:對語料中每篇文檔中的每個詞w,隨機賦一個topic編號z;A.6新文檔語義預測按照Gibbs抽樣公式實行迭代收斂后,得到文檔的主題分布,從分布中選擇概率最大的對應主題作判斷矩陣A是本層所有因素針對上一層某一個因素相對重要性的比較,兩兩相互比較結果可表示為A=a13表示兩個因素相比,因素i比因素j稍微重要57表示兩個因素相比,因素i比因素j強烈重要9表示兩個因素相比,因素i比因素j極端重要因素i與因素j的重要性判斷為aij,則因素j與因素i的重要性判斷為aji=1/判斷矩陣A對應于最大特征值λmax的特征向量W,經歸一化后即為同一層次相應因素對應上一層次……………(λ(λmax?RI如表B.2所示取值。n123456789>11RI00B1n,關于Aj的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年注冊會計師考試《會計》新準則綜合應用模擬試題
- 2025年大學輔導員招聘考試題庫-學生職業(yè)生涯規(guī)劃指導教學設計試題
- 2025年安全生產考試題庫:機械安全操作規(guī)范及現(xiàn)場安全管理試題解析
- 2025年成人高考語文經典題型作文審題技巧題庫試卷
- 基于AI的既有建筑節(jié)能監(jiān)測與優(yōu)化系統(tǒng)研究-全面剖析
- 2025-2030全球及中國現(xiàn)場服務管理(FSM)軟件行業(yè)市場現(xiàn)狀供需分析及市場深度研究發(fā)展前景及規(guī)劃可行性分析研究報告
- 2025-2030全球及中國點火互鎖裝置行業(yè)市場現(xiàn)狀供需分析及市場深度研究發(fā)展前景及規(guī)劃可行性分析研究報告
- 2025-2030全球及中國汽車測功機行業(yè)市場現(xiàn)狀供需分析及市場深度研究發(fā)展前景及規(guī)劃可行性分析研究報告
- 2025年小學英語畢業(yè)模擬試卷:英語歌曲欣賞與演唱能力考核
- 2025-2030全球及中國拖車輪輞行業(yè)市場現(xiàn)狀供需分析及市場深度研究發(fā)展前景及規(guī)劃可行性分析研究報告
- 少兒美術課件- 9-12歲 素描班《感知力素描》
- 《強化學習理論與應用》深度強化學習概述
- zippo稀有品系列圖鑒
- 優(yōu)藝國際環(huán)??萍迹ㄐ锣l(xiāng))有限公司新鄉(xiāng)市醫(yī)療廢物集中處理中心遷建擴能項目環(huán)境影響報告
- 經驗萃取實戰(zhàn)技術課件
- 醫(yī)學女性盆腔腫瘤的影像學表現(xiàn)和鑒別專題課件
- 南匯區(qū)供排水一體化整合研究的任務書
- 23CG60 預制樁樁頂機械連接(螺絲緊固式)
- 小學道德與法治-【課堂實錄】生活中處處有規(guī)則教學設計學情分析教材分析課后反思
- 軍營相親活動策劃方案
- Python語言基礎與應用學習通課后章節(jié)答案期末考試題庫2023年
評論
0/150
提交評論