《電力系統(tǒng)的大語言模型微調(diào)數(shù)據(jù)準備規(guī)范》編制說明_第1頁
《電力系統(tǒng)的大語言模型微調(diào)數(shù)據(jù)準備規(guī)范》編制說明_第2頁
《電力系統(tǒng)的大語言模型微調(diào)數(shù)據(jù)準備規(guī)范》編制說明_第3頁
《電力系統(tǒng)的大語言模型微調(diào)數(shù)據(jù)準備規(guī)范》編制說明_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

《電力系統(tǒng)的大語言模型微調(diào)數(shù)據(jù)準備規(guī)范》編制說明

(征求意見稿)

一、工作簡況

1主要工作過程

起草(草案、調(diào)研)階段:

國網(wǎng)信息通信產(chǎn)業(yè)集團有限公司于2023年9月成立了標準編制工作起草小

組,組織標準編制組織工作。標準編制工作起草小組在2023年10月積極組織籌

備和征集標準起草單位,成立標準起草工作組。

標準起草工作組制定了標準編制工作計劃、編寫大綱,明確任務(wù)分工及各階

段進度時間。同時,標準起草工作組成員認真學習了GB/T1.1—2020《標準化

工作導(dǎo)則第1部分:標準的結(jié)構(gòu)和編寫規(guī)則》,GB/T20000.2—2009《標準化工

作指南第2部分:采用國際標準的規(guī)則》,結(jié)合標準制定工作程序的各個環(huán)節(jié),

進行了探討和研究。

標準立項階段:標準立項階段:2023年11月,在北京召開了第一次標準

的專家立項評審會,經(jīng)中國電工技術(shù)學會標準工作委員會專家組審議,批準《電

力系統(tǒng)的大語言模型微調(diào)數(shù)據(jù)準備規(guī)范》標準立項;

2主要參加單位和起草工作組成員及其所做的工作

本標準由國網(wǎng)信息通信產(chǎn)業(yè)集團有限公司、國家電網(wǎng)有限公司大數(shù)據(jù)中心、

中國電力科學研究院有限公司、國網(wǎng)智能電網(wǎng)研究院有限公司、北京國網(wǎng)信通埃

森哲信息技術(shù)有限公司、四川中電啟明星信息技術(shù)有限公司、國網(wǎng)福建省電力有

限公司共同負責起草。

主要成員:李強、趙峰、趙永生、邱鎮(zhèn)、陳振宇、李博、劉識、李炳森、黃

曉光、秦余、王曉東、張琳瑜、張國梁、劉園園、崔迎寶、王興濤、盧大瑋、吳

迪、趙如意、宋衛(wèi)平、楊帆、高攀、王紅蕾、董梅、李歡歡、徐小云、葉林峰、

趙林林、王譽博、李揚笛、楊彥、林晨翔等人。

所做的工作:標準編寫組收集了電力系統(tǒng)中大語言模型應(yīng)用以及數(shù)據(jù)準備

等方面的相關(guān)材料,通過對比整理分析,確定了標準主要技術(shù)內(nèi)容,主要由國網(wǎng)

信息通信產(chǎn)業(yè)集團有限公司牽頭完成標準初稿編制,其他參與單位配合編制,并

負責收集相關(guān)資料、提出建議。

二、標準編制原則和主要內(nèi)容

1、標準編制原則

本標準按照GB/T1.1-2020《標準化工作導(dǎo)則第1部分:標準化文件的結(jié)

構(gòu)與起草規(guī)則》的編寫原則制定,定位為團體標準是對國家標準的補充,與相關(guān)

技術(shù)領(lǐng)域的國家現(xiàn)行法律、法規(guī)、規(guī)章、政策及相關(guān)標準保持一致。

本標準遵循科學性、先進性、經(jīng)濟性,堅持實事求是,以符合標準化工作導(dǎo)

則,綜合國內(nèi)外經(jīng)驗、公平公正公開、實際可操作、可復(fù)制可驗證、綜合考慮技

術(shù)安全倫理要求,制定了《電力系統(tǒng)的大語言模型微調(diào)數(shù)據(jù)準備規(guī)范》,以電力

系統(tǒng)的大語言模型技術(shù)和豐富的數(shù)據(jù)處理經(jīng)驗為基礎(chǔ),遵守國家有關(guān)法律法規(guī),

符合團體標準要求,目的在于規(guī)范在大語言模型訓練中的數(shù)據(jù)處理過程,以保證

數(shù)據(jù)的可用性、一致性和可追溯性。

2、標準主要內(nèi)容

本標準正文內(nèi)容分為八個章節(jié),第一章是本標準的適用范圍、第二章是規(guī)范

性引用文件、第三章是術(shù)語和定義、第四章是縮略語、第五章是總則

第六章是數(shù)據(jù)準備要求,主要從數(shù)據(jù)來源、數(shù)據(jù)多樣性與數(shù)據(jù)質(zhì)量三個方面

介紹對數(shù)據(jù)收集過程進行相關(guān)的規(guī)范性要求,確保大語言模型微調(diào)技術(shù)應(yīng)用過程

中訓練數(shù)據(jù)符合要求。

第七章是數(shù)據(jù)準備規(guī)范,主要對電力系統(tǒng)中大語言模型的數(shù)據(jù)準備過程中的

關(guān)鍵性步驟進行規(guī)范性要求。

第八章是大語言模型微調(diào)數(shù)據(jù)準備流程規(guī)范,主要規(guī)范了在電力系統(tǒng)中通用

的大語言模型微調(diào)數(shù)據(jù)準備流程的相應(yīng)要求。

3、主要技術(shù)差異

本標準為新制度標準,無主要技術(shù)差異。

4、解決的主要問題

針對目前電力系統(tǒng)中大語言模型技術(shù)應(yīng)用相關(guān)的業(yè)務(wù)場景,主要解決如何有

效地采集和清洗與電力系統(tǒng)相關(guān)的數(shù)據(jù),包括數(shù)據(jù)來源的選擇和數(shù)據(jù)質(zhì)量的評估;

定義必要的數(shù)據(jù)標簽和注釋,以確保模型了解電力系統(tǒng)領(lǐng)域的相關(guān)概念和關(guān)系;

規(guī)定數(shù)據(jù)的格式和結(jié)構(gòu),以適應(yīng)大語言模型的微調(diào)需求,包括數(shù)據(jù)的輸入和輸出

格式;確定數(shù)據(jù)的安全存儲方式,并定義數(shù)據(jù)共享政策,以確保數(shù)據(jù)的合規(guī)和安

全性。

三、主要試驗(或驗證)情況

《電力系統(tǒng)的大語言模型微調(diào)數(shù)據(jù)準備規(guī)范》的主要試驗情況包括場景化驗

證、數(shù)據(jù)質(zhì)量驗證、微調(diào)模型性能驗證、可信度驗證和安全性驗證。這些試驗旨

在驗證電力系統(tǒng)中大語言模型微調(diào)過程中數(shù)據(jù)準備在特定場景下的數(shù)據(jù)可用性、

一致性和可追溯性,通過嚴格的驗證和評價流程,提供可靠的基于實際需求的驗

證和評價體系,確保大語言模型在電力系統(tǒng)中的應(yīng)用具備準確性、可信度和安全

性,并為推廣和應(yīng)用大語言模型提供堅實的數(shù)據(jù)基礎(chǔ)。

四、標準中涉及專利的情況

本標準不涉及專利問題。

五、預(yù)期達到的社會效益、對產(chǎn)業(yè)發(fā)展的作用等情況

電力系統(tǒng)是一個復(fù)雜的系統(tǒng),準確預(yù)測和優(yōu)化能夠?qū)δ茉垂?yīng)和消費產(chǎn)生深

遠的影響。通過大型語言模型的微調(diào),可以提高對電力系統(tǒng)中各種情況的預(yù)測和

優(yōu)化能力,從而降低能源浪費,提高效率。大型語言模型的微調(diào)能夠為電力系統(tǒng)

的運營和管理提供更智能的決策支持,解決電力系統(tǒng)中很多場景問題,包括預(yù)測

負荷需求、優(yōu)化能源分配、改善供電穩(wěn)定性等方面,有助于管理者做出更明智、

更基于數(shù)據(jù)的決策。對電力系統(tǒng)的大型語言模型微調(diào)需要涉及大量的數(shù)據(jù)和技術(shù),

將促進相關(guān)領(lǐng)域的技術(shù)創(chuàng)新和發(fā)展。通過更好地理解和利用數(shù)據(jù),可以推動電力

系統(tǒng)相關(guān)技術(shù)的進步,從而推動整個產(chǎn)業(yè)的發(fā)展。

六、與國際、國外對比情況

未檢索到國際同類標準。

七、在標準體系中的位置,與現(xiàn)行相關(guān)法律、法規(guī)、規(guī)章及相關(guān)標準,特

別是強制性標準的協(xié)調(diào)性

本標準與相關(guān)技術(shù)領(lǐng)域的國家現(xiàn)行法律、法規(guī)和政策保持一致。

八、重大分歧意見的處理經(jīng)過和依據(jù)

標準編制過程中充分征集了專家意見,所有意見均按照標準編制程序進行了

是否采納,不存在重大分歧

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論