面向電網(wǎng)調控信息智能檢索的知識圖譜構建及應用

上傳人：1*** IP屬地：湖南上傳時間：2024-08-14 格式：DOCX 頁數(shù)：12 大?。?.03MB 積分：20 舉報 版權申訴

已閱讀5頁，還剩7頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

01電網(wǎng)調控信息知識圖譜構建電網(wǎng)調控信息知識圖譜通過業(yè)務需求分析，構建知識圖譜本體概念框架，以電網(wǎng)設備作為圖譜基礎本體，與設備相關屬性進行鏈接，通過設備與廠站關聯(lián)關系，鏈接全網(wǎng)范圍設備，將調度規(guī)程文本中對設備的描述作為電力設備屬性，通過上述方式構建調控信息層次化知識圖譜，如圖1所示。在圖1中，數(shù)據(jù)層主要以結構化的電網(wǎng)模型信息以及非結構的調度規(guī)程文本形式存在。數(shù)據(jù)預處理層形成了調控信息訓練樣本庫。知識抽取層是構建知識圖譜的關鍵，其采用提取-翻譯-加載方法將電網(wǎng)模型數(shù)據(jù)轉換為調控信息知識圖譜的實體和實體間關系。知識融合層可以對抽取的知識進行標準化以形成統(tǒng)一的知識模型。知識應用層基于調控信息知識圖譜推薦和檢索調控業(yè)務操作知識提升調控業(yè)務處置效率。圖1

調控信息知識圖譜構建方案Fig.1

ConstructionplanofdispatchingandcontrolinformationknowledgegraphBiLSTM-CRF模型是將BiLSTM模型和CRF進行結合，模型結構如圖2所示。與此同時，本文將BiLSTM中Softmax層替換為CRF層，以提升調度運行規(guī)程文本的段落類別識別精確性。BiLSTM將前向與后向LSTM相結合，以更好地從兩個方向獲取序列特征。本文模型包含向前和向后兩個訓練層，且兩層之間沒有信息流，共同連接一個輸出層。這個結構提供給輸出層輸入序列中每一個點完整的過去和未來上、下文信息。Embedding層將模型輸入特征轉化為低維稠密向量。LSTM記憶單元由輸入門、遺忘門、輸出門與存儲記憶單元組合而成，使得序列信息可以更好地向后傳遞。圖2

BiLSTM-CRF模型結構Fig.2

StructureofBiLSTM-CRFmodelCRF通過考慮相鄰標簽的關系獲得一個全局最優(yōu)的標簽序列。通過學習各類別標注間的約束條件，以彌補BiLSTM網(wǎng)絡沒有考慮輸出標注間關系的劣勢。將BiLSTM網(wǎng)絡計算出的狀態(tài)序列向量作為CRF層的輸入，并通過狀態(tài)轉移矩陣，得到整個預測序列的得分。02基于BiLSTM-CRF的調度規(guī)程文本信息抽取

將電網(wǎng)調度運行規(guī)程文本轉化為超文本標記語言（hypertextmarkuplanguage，HTML）格式，通過分析調度規(guī)程屬性、內容和格式，確定影響文本信息的8維特征，如表1所示。其中文本特征基于正則表達式識別運行規(guī)則文本特定字符、符號或數(shù)字確定，其余7種特征均由HTML格式文本直接生成。表1

特征變量表示Table1

Characteristicvariablerepresentation通過對調度運行規(guī)程分析，確定20個規(guī)則標題及段落標簽作為模型輸出，20個標簽存在父子關系，父節(jié)點標簽為待檢索問題，子節(jié)點標簽為檢索所對應的解釋內容。本文將電網(wǎng)調度運行規(guī)程20種輸出標簽劃分為10個層級，如表2所示。表2

層級劃分及其標簽類別對應關系Table2

Hierarchyandcorrespondingrelationshipbetweenlabelcategories在模型訓練階段，將前5種特征中的每個特征通過Embedding層轉化為3維向量，剩余3種特征利用自身數(shù)值表示，如此形成一個18維的輸入樣本。采用20種信息標簽作為模型輸出。通過樣本訓練基于BiLSTM-CRF的電網(wǎng)調度規(guī)程信息識別模型，批次大小為16，學習率為0.01，隱藏層維數(shù)為256，神經元隨機失活率為0.5，優(yōu)化器為Adam。03算例分析本文試驗數(shù)據(jù)來自某調控中心，包括電網(wǎng)調度控制管理規(guī)程、電網(wǎng)調度控制運行管理細則、電網(wǎng)作業(yè)指導書等調度規(guī)程文本，將文檔中每一段落作為一條數(shù)據(jù)，累計得到10904條數(shù)據(jù)，按照7∶2∶1的比例將數(shù)據(jù)集劃分為訓練集、驗證集和測試集，得到訓練集、驗證集、測試集數(shù)據(jù)分別為7634、2180、1090條。模型訓練采用GPU顯卡型號為NVIDIAQuadroRTX5000，深度學習框架為Torch1.4.0。本文采用精準率P、召回率R和綜合評價指標F1作為電網(wǎng)運行規(guī)程信息識別結果的評價指標，即式中：T為正類預測為正類的樣本數(shù)；L為負類預測為正類的樣本數(shù)；N為正類預測為負類的樣本數(shù)。基于調度規(guī)程訓練集和驗證集訓練BiSLTM-CRF知識識別模型。采用1090條測試樣本驗證，20種標簽識別效果如表3所示。表3

各類別標簽識別結果Table3

Labelrecognitionresultsofeachcategory從表3可以看出，文中所提BiSLTM-CRF模型在測試集上取得了較高的識別效果，對于部分調度規(guī)程段落標簽，其各項評價指標可以達到100%，多數(shù)段落標簽識別指標也超過90%。與此同時，計算20種段落標簽識別效果，其P為98.10%，R為98.19%，F(xiàn)1為98.10%。采用相同數(shù)據(jù)集驗證LSTM模型、BiLSTM模型和BiLSTM-CRF模型對調度運行規(guī)程信息的識別效果，如圖3所示。圖3

訓練過程準確率Fig.3

Accuracycurveoftrainingprocess從圖3可以看出，隨著訓練迭代次數(shù)增加，3個模型呈現(xiàn)不同程度的收斂速度。相比LSTM和BiLSTM模型，BiLSTM-CRF模型收斂速度較快，損失值較小，準確率較高。對于測試樣本集，各模型性能如表4所示。表4

不同模型性能比較Table4

Performancecomparisonofdifferentmodels采用不同模型計算每條測試樣本的F1，繪制箱型圖如圖4所示。從圖4可以看出BiLSTM-CRF模型的F1要明顯高于BiSLTM和LSTM模型。LSTM模型的F1集中在89.15%~93.11%，個別類別標簽識別準確性在80%，這種情況的原因可能是由于部分標簽之間特征過于相似，模型難以學習到區(qū)分規(guī)程。BiLSTM對調度規(guī)程整體識別精度有了一定提升，模型的F1提升了2.77%，說明加入反向學習后，使得模型對運行規(guī)程段落信息特征提取能力更加充分，但還不能解決由于部分標簽之間特征過于相似，使模型難以有效區(qū)分的問題。加入CRF后，模型對各類別標簽識別精度集中于96.60%~99.60%，使得原來難以區(qū)分的段落標簽得到有效區(qū)分，其相對于BiLSTM模型的F1值提升了4.68%。圖4

各模型綜合評價指標F1對比Fig.4

Comparisonofdifferentmodels

value04基于知識圖譜的信息智能檢索融合識別的電網(wǎng)模型知識建立電力實體知識圖譜，融合識別的調度運行規(guī)程知識建立調度運行規(guī)程知識圖譜，通過“設備-廠站-運行規(guī)程”的關系將上述知識圖譜鏈接建立調控信息知識圖譜。基于詞頻-逆文件頻率和余弦值計算輸入的調度檢索語言與知識圖譜實體節(jié)點文本的相似度距離，檢索和推薦出與輸入調度運行語言最匹配的解釋內容。在實際應用中，涉及調度應用場景中較多，文中以系統(tǒng)自動感知事件檢索信息和人工檢索信息兩種方式給出典型調度場景下的應用實例，如圖5所示。在電網(wǎng)故障異常、倒閘操作、設備啟動等場景中，調控系統(tǒng)可以自動感知相關事件，將事件輸入到調控信息知識圖譜中，經過知識推理，快速檢索出調控人員所需要的設備信息、天氣信息以及調度規(guī)程精細化信息，快速反饋給調度員，大幅度提升調度員對信息檢索和歸集的效率。同時調控人員也可以通過手動輸入調度運行語言，并通過調控信息知識圖譜推理定位檢索內容所對應的精細化解釋，以減少查找時間。文中所提檢索方法可以精細化地將檢索要點和對應的解釋內容，與現(xiàn)行單純檢索規(guī)程標題的方法相比，更能夠滿足實際現(xiàn)場的需要。目前基于知識圖譜的調控信息智能檢索應用已經在多個調控中心上線應用，調控業(yè)務信息檢索平均準確率在95%以上，能夠滿足調控人員面對海量信息快速增長，對多維信息進行精細化檢索的需求。圖5

基于知識圖譜的調控信息智能檢索技術應用實例Fig.5

Applicationofintelligentretrievalofdispatchingandcontrolinformationbaseknowledgegraph

05結語

為了提升不同電網(wǎng)調控場景下多維信息快速檢索和推薦能力，提出基于知識圖譜的調控信息智能檢索方法，采用BiLSTM-CRF識別調度運行規(guī)則知識，通過“設備-廠站-規(guī)程”的調度業(yè)務邏輯關系融合

人人文庫> 全部分類> 教育資料 > 輔導培訓

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

面向電網(wǎng)調控信息智能檢索的知識圖譜構建及應用

文檔簡介

溫馨提示

最新文檔

評論

面向電網(wǎng)調控信息智能檢索的知識圖譜構建及應用

文檔簡介

溫馨提示

最新文檔

評論

相關文檔