版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
01電網(wǎng)調(diào)控信息知識(shí)圖譜構(gòu)建電網(wǎng)調(diào)控信息知識(shí)圖譜通過(guò)業(yè)務(wù)需求分析,構(gòu)建知識(shí)圖譜本體概念框架,以電網(wǎng)設(shè)備作為圖譜基礎(chǔ)本體,與設(shè)備相關(guān)屬性進(jìn)行鏈接,通過(guò)設(shè)備與廠站關(guān)聯(lián)關(guān)系,鏈接全網(wǎng)范圍設(shè)備,將調(diào)度規(guī)程文本中對(duì)設(shè)備的描述作為電力設(shè)備屬性,通過(guò)上述方式構(gòu)建調(diào)控信息層次化知識(shí)圖譜,如圖1所示。在圖1中,數(shù)據(jù)層主要以結(jié)構(gòu)化的電網(wǎng)模型信息以及非結(jié)構(gòu)的調(diào)度規(guī)程文本形式存在。數(shù)據(jù)預(yù)處理層形成了調(diào)控信息訓(xùn)練樣本庫(kù)。知識(shí)抽取層是構(gòu)建知識(shí)圖譜的關(guān)鍵,其采用提取-翻譯-加載方法將電網(wǎng)模型數(shù)據(jù)轉(zhuǎn)換為調(diào)控信息知識(shí)圖譜的實(shí)體和實(shí)體間關(guān)系。知識(shí)融合層可以對(duì)抽取的知識(shí)進(jìn)行標(biāo)準(zhǔn)化以形成統(tǒng)一的知識(shí)模型。知識(shí)應(yīng)用層基于調(diào)控信息知識(shí)圖譜推薦和檢索調(diào)控業(yè)務(wù)操作知識(shí)提升調(diào)控業(yè)務(wù)處置效率。圖1
調(diào)控信息知識(shí)圖譜構(gòu)建方案Fig.1
ConstructionplanofdispatchingandcontrolinformationknowledgegraphBiLSTM-CRF模型是將BiLSTM模型和CRF進(jìn)行結(jié)合,模型結(jié)構(gòu)如圖2所示。與此同時(shí),本文將BiLSTM中Softmax層替換為CRF層,以提升調(diào)度運(yùn)行規(guī)程文本的段落類別識(shí)別精確性。BiLSTM將前向與后向LSTM相結(jié)合,以更好地從兩個(gè)方向獲取序列特征。本文模型包含向前和向后兩個(gè)訓(xùn)練層,且兩層之間沒(méi)有信息流,共同連接一個(gè)輸出層。這個(gè)結(jié)構(gòu)提供給輸出層輸入序列中每一個(gè)點(diǎn)完整的過(guò)去和未來(lái)上、下文信息。Embedding層將模型輸入特征轉(zhuǎn)化為低維稠密向量。LSTM記憶單元由輸入門(mén)、遺忘門(mén)、輸出門(mén)與存儲(chǔ)記憶單元組合而成,使得序列信息可以更好地向后傳遞。圖2
BiLSTM-CRF模型結(jié)構(gòu)Fig.2
StructureofBiLSTM-CRFmodelCRF通過(guò)考慮相鄰標(biāo)簽的關(guān)系獲得一個(gè)全局最優(yōu)的標(biāo)簽序列。通過(guò)學(xué)習(xí)各類別標(biāo)注間的約束條件,以彌補(bǔ)BiLSTM網(wǎng)絡(luò)沒(méi)有考慮輸出標(biāo)注間關(guān)系的劣勢(shì)。將BiLSTM網(wǎng)絡(luò)計(jì)算出的狀態(tài)序列向量作為CRF層的輸入,并通過(guò)狀態(tài)轉(zhuǎn)移矩陣,得到整個(gè)預(yù)測(cè)序列的得分。02基于BiLSTM-CRF的調(diào)度規(guī)程文本信息抽取
將電網(wǎng)調(diào)度運(yùn)行規(guī)程文本轉(zhuǎn)化為超文本標(biāo)記語(yǔ)言(hypertextmarkuplanguage,HTML)格式,通過(guò)分析調(diào)度規(guī)程屬性、內(nèi)容和格式,確定影響文本信息的8維特征,如表1所示。其中文本特征基于正則表達(dá)式識(shí)別運(yùn)行規(guī)則文本特定字符、符號(hào)或數(shù)字確定,其余7種特征均由HTML格式文本直接生成。表1
特征變量表示Table1
Characteristicvariablerepresentation通過(guò)對(duì)調(diào)度運(yùn)行規(guī)程分析,確定20個(gè)規(guī)則標(biāo)題及段落標(biāo)簽作為模型輸出,20個(gè)標(biāo)簽存在父子關(guān)系,父節(jié)點(diǎn)標(biāo)簽為待檢索問(wèn)題,子節(jié)點(diǎn)標(biāo)簽為檢索所對(duì)應(yīng)的解釋內(nèi)容。本文將電網(wǎng)調(diào)度運(yùn)行規(guī)程20種輸出標(biāo)簽劃分為10個(gè)層級(jí),如表2所示。表2
層級(jí)劃分及其標(biāo)簽類別對(duì)應(yīng)關(guān)系Table2
Hierarchyandcorrespondingrelationshipbetweenlabelcategories在模型訓(xùn)練階段,將前5種特征中的每個(gè)特征通過(guò)Embedding層轉(zhuǎn)化為3維向量,剩余3種特征利用自身數(shù)值表示,如此形成一個(gè)18維的輸入樣本。采用20種信息標(biāo)簽作為模型輸出。通過(guò)樣本訓(xùn)練基于BiLSTM-CRF的電網(wǎng)調(diào)度規(guī)程信息識(shí)別模型,批次大小為16,學(xué)習(xí)率為0.01,隱藏層維數(shù)為256,神經(jīng)元隨機(jī)失活率為0.5,優(yōu)化器為Adam。03算例分析本文試驗(yàn)數(shù)據(jù)來(lái)自某調(diào)控中心,包括電網(wǎng)調(diào)度控制管理規(guī)程、電網(wǎng)調(diào)度控制運(yùn)行管理細(xì)則、電網(wǎng)作業(yè)指導(dǎo)書(shū)等調(diào)度規(guī)程文本,將文檔中每一段落作為一條數(shù)據(jù),累計(jì)得到10904條數(shù)據(jù),按照7∶2∶1的比例將數(shù)據(jù)集劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,得到訓(xùn)練集、驗(yàn)證集、測(cè)試集數(shù)據(jù)分別為7634、2180、1090條。模型訓(xùn)練采用GPU顯卡型號(hào)為NVIDIAQuadroRTX5000,深度學(xué)習(xí)框架為T(mén)orch1.4.0。本文采用精準(zhǔn)率P、召回率R和綜合評(píng)價(jià)指標(biāo)F1作為電網(wǎng)運(yùn)行規(guī)程信息識(shí)別結(jié)果的評(píng)價(jià)指標(biāo),即式中:T為正類預(yù)測(cè)為正類的樣本數(shù);L為負(fù)類預(yù)測(cè)為正類的樣本數(shù);N為正類預(yù)測(cè)為負(fù)類的樣本數(shù)。基于調(diào)度規(guī)程訓(xùn)練集和驗(yàn)證集訓(xùn)練BiSLTM-CRF知識(shí)識(shí)別模型。采用1090條測(cè)試樣本驗(yàn)證,20種標(biāo)簽識(shí)別效果如表3所示。表3
各類別標(biāo)簽識(shí)別結(jié)果Table3
Labelrecognitionresultsofeachcategory從表3可以看出,文中所提BiSLTM-CRF模型在測(cè)試集上取得了較高的識(shí)別效果,對(duì)于部分調(diào)度規(guī)程段落標(biāo)簽,其各項(xiàng)評(píng)價(jià)指標(biāo)可以達(dá)到100%,多數(shù)段落標(biāo)簽識(shí)別指標(biāo)也超過(guò)90%。與此同時(shí),計(jì)算20種段落標(biāo)簽識(shí)別效果,其P為98.10%,R為98.19%,F(xiàn)1為98.10%。采用相同數(shù)據(jù)集驗(yàn)證LSTM模型、BiLSTM模型和BiLSTM-CRF模型對(duì)調(diào)度運(yùn)行規(guī)程信息的識(shí)別效果,如圖3所示。圖3
訓(xùn)練過(guò)程準(zhǔn)確率Fig.3
Accuracycurveoftrainingprocess從圖3可以看出,隨著訓(xùn)練迭代次數(shù)增加,3個(gè)模型呈現(xiàn)不同程度的收斂速度。相比LSTM和BiLSTM模型,BiLSTM-CRF模型收斂速度較快,損失值較小,準(zhǔn)確率較高。對(duì)于測(cè)試樣本集,各模型性能如表4所示。表4
不同模型性能比較Table4
Performancecomparisonofdifferentmodels采用不同模型計(jì)算每條測(cè)試樣本的F1,繪制箱型圖如圖4所示。從圖4可以看出BiLSTM-CRF模型的F1要明顯高于BiSLTM和LSTM模型。LSTM模型的F1集中在89.15%~93.11%,個(gè)別類別標(biāo)簽識(shí)別準(zhǔn)確性在80%,這種情況的原因可能是由于部分標(biāo)簽之間特征過(guò)于相似,模型難以學(xué)習(xí)到區(qū)分規(guī)程。BiLSTM對(duì)調(diào)度規(guī)程整體識(shí)別精度有了一定提升,模型的F1提升了2.77%,說(shuō)明加入反向?qū)W習(xí)后,使得模型對(duì)運(yùn)行規(guī)程段落信息特征提取能力更加充分,但還不能解決由于部分標(biāo)簽之間特征過(guò)于相似,使模型難以有效區(qū)分的問(wèn)題。加入CRF后,模型對(duì)各類別標(biāo)簽識(shí)別精度集中于96.60%~99.60%,使得原來(lái)難以區(qū)分的段落標(biāo)簽得到有效區(qū)分,其相對(duì)于BiLSTM模型的F1值提升了4.68%。圖4
各模型綜合評(píng)價(jià)指標(biāo)F1對(duì)比Fig.4
Comparisonofdifferentmodels
F1
value04基于知識(shí)圖譜的信息智能檢索融合識(shí)別的電網(wǎng)模型知識(shí)建立電力實(shí)體知識(shí)圖譜,融合識(shí)別的調(diào)度運(yùn)行規(guī)程知識(shí)建立調(diào)度運(yùn)行規(guī)程知識(shí)圖譜,通過(guò)“設(shè)備-廠站-運(yùn)行規(guī)程”的關(guān)系將上述知識(shí)圖譜鏈接建立調(diào)控信息知識(shí)圖譜?;谠~頻-逆文件頻率和余弦值計(jì)算輸入的調(diào)度檢索語(yǔ)言與知識(shí)圖譜實(shí)體節(jié)點(diǎn)文本的相似度距離,檢索和推薦出與輸入調(diào)度運(yùn)行語(yǔ)言最匹配的解釋內(nèi)容。在實(shí)際應(yīng)用中,涉及調(diào)度應(yīng)用場(chǎng)景中較多,文中以系統(tǒng)自動(dòng)感知事件檢索信息和人工檢索信息兩種方式給出典型調(diào)度場(chǎng)景下的應(yīng)用實(shí)例,如圖5所示。在電網(wǎng)故障異常、倒閘操作、設(shè)備啟動(dòng)等場(chǎng)景中,調(diào)控系統(tǒng)可以自動(dòng)感知相關(guān)事件,將事件輸入到調(diào)控信息知識(shí)圖譜中,經(jīng)過(guò)知識(shí)推理,快速檢索出調(diào)控人員所需要的設(shè)備信息、天氣信息以及調(diào)度規(guī)程精細(xì)化信息,快速反饋給調(diào)度員,大幅度提升調(diào)度員對(duì)信息檢索和歸集的效率。同時(shí)調(diào)控人員也可以通過(guò)手動(dòng)輸入調(diào)度運(yùn)行語(yǔ)言,并通過(guò)調(diào)控信息知識(shí)圖譜推理定位檢索內(nèi)容所對(duì)應(yīng)的精細(xì)化解釋,以減少查找時(shí)間。文中所提檢索方法可以精細(xì)化地將檢索要點(diǎn)和對(duì)應(yīng)的解釋內(nèi)容,與現(xiàn)行單純檢索規(guī)程標(biāo)題的方法相比,更能夠滿足實(shí)際現(xiàn)場(chǎng)的需要。目前基于知識(shí)圖譜的調(diào)控信息智能檢索應(yīng)用已經(jīng)在多個(gè)調(diào)控中心上線應(yīng)用,調(diào)控業(yè)務(wù)信息檢索平均準(zhǔn)確率在95%以上,能夠滿足調(diào)控人員面對(duì)海量信息快速增長(zhǎng),對(duì)多維信息進(jìn)行精細(xì)化檢索的需求。圖5
基于知識(shí)圖譜的調(diào)控信息智能檢索技術(shù)應(yīng)用實(shí)例Fig.5
Applicationofintelligentretrievalofdispatchingandcontrolinformationbaseknowledgegraph
05結(jié)語(yǔ)
為了提升不同電網(wǎng)調(diào)控場(chǎng)景下多維信息快速檢索和推薦能力,提出基于知識(shí)圖譜的調(diào)控信息智能檢索方法,采用BiLSTM-CRF識(shí)別調(diào)度運(yùn)行規(guī)則知識(shí),通過(guò)“設(shè)備-廠站-規(guī)程”的調(diào)度業(yè)務(wù)邏輯關(guān)系融合
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 統(tǒng)編版二年級(jí)上冊(cè)《道德與法治》全冊(cè)教案
- 農(nóng)、林專用儀器賬務(wù)處理實(shí)例-記賬實(shí)操
- 2024年一季度碳交易市場(chǎng)運(yùn)行與政策盤(pán)點(diǎn)-雙碳政策護(hù)航碳市場(chǎng)健康發(fā)展
- 介紹英文足球課件
- 2023年寧泌泰膠囊項(xiàng)目評(píng)價(jià)分析報(bào)告
- 2023年工具油項(xiàng)目評(píng)估分析報(bào)告
- 2024年紫外線強(qiáng)度觀測(cè)儀器項(xiàng)目評(píng)價(jià)分析報(bào)告
- 2019粵教版 高中美術(shù) 選擇性必修3 雕塑《第一單元 初探雕塑藝術(shù)》大單元整體教學(xué)設(shè)計(jì)2020課標(biāo)
- 2024屆河北省衡水十三中高三下學(xué)期期終考前模擬數(shù)學(xué)試題
- 餐飲合作經(jīng)營(yíng)合同協(xié)議書(shū)范本
- 《國(guó)有企業(yè)采購(gòu)操作規(guī)范》【2023修訂版】
- 2024年安徽交控集團(tuán)招聘筆試參考題庫(kù)含答案解析
- 古典主義時(shí)期音樂(lè)
- 2024年云南交投集團(tuán)招聘筆試參考題庫(kù)含答案解析
- 如何培養(yǎng)孩子的家務(wù)勞動(dòng)習(xí)慣
- 膠原蛋白相關(guān)項(xiàng)目實(shí)施方案
- 蘇科版八年級(jí)生物上冊(cè)知識(shí)點(diǎn)匯總
- Unit+6+Understanding+ideas高中英語(yǔ)外研版(2019)必修第一冊(cè)
- 龍華網(wǎng)站建設(shè)方案范文
- 建立有效的財(cái)務(wù)內(nèi)控體系
- 多媒體技術(shù)在中小學(xué)教學(xué)中的實(shí)施與效果評(píng)價(jià)
評(píng)論
0/150
提交評(píng)論