《電力人工智能樣本增廣技術(shù)架構(gòu)要求》編制說明_第1頁
《電力人工智能樣本增廣技術(shù)架構(gòu)要求》編制說明_第2頁
《電力人工智能樣本增廣技術(shù)架構(gòu)要求》編制說明_第3頁
《電力人工智能樣本增廣技術(shù)架構(gòu)要求》編制說明_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

《電力人工智能樣本增廣技術(shù)架構(gòu)要求》編制說明

(征求意見稿)

一、工作簡況

1主要工作過程

起草(草案、調(diào)研)階段:2023年10月開始,國家電網(wǎng)有限公司大數(shù)據(jù)中

心牽頭各單位成立標(biāo)準(zhǔn)編寫組,討論確定了標(biāo)準(zhǔn)的主要內(nèi)容及分工,同時(shí)進(jìn)行調(diào)

研分析,收集資料,形成標(biāo)準(zhǔn)草案稿,準(zhǔn)備立項(xiàng)審查答辯;

立項(xiàng)階段:2023年11月開始進(jìn)行專家函審,其中,七位專家同意立項(xiàng)并提

出部分意見,詳見標(biāo)準(zhǔn)提案立項(xiàng)評(píng)估函審結(jié)論表與立項(xiàng)建議匯總表。

中期稿評(píng)審階段:2023年12月報(bào)2023年中國電工技術(shù)學(xué)會(huì)標(biāo)準(zhǔn)提案申報(bào)

項(xiàng)目(第五批),經(jīng)專家組審閱同意立項(xiàng)并提出意見,修改后形成征求意見稿。

2主要參加單位和起草工作組成員及其所做的工作

本標(biāo)準(zhǔn)由國家電網(wǎng)有限公司大數(shù)據(jù)中心、國網(wǎng)信息通信產(chǎn)業(yè)集團(tuán)有限公司、

中國電力科學(xué)研究院有限公司、國網(wǎng)智能電網(wǎng)研究院有限公司、安徽繼遠(yuǎn)軟件有

限公司、國網(wǎng)福建省電力有限公司共同負(fù)責(zé)起草。

主要成員:李強(qiáng)、趙峰、邱鎮(zhèn)、陳振宇、李博、劉識(shí)、李炳森、黃曉光、張

琳瑜、秦余、王曉東、張國梁、周逸平、蘇勇、朱署光、李小寧、徐凡、鄭碧煌、

李黎、余江斌、郭慶、浦正國、薛濛、黃旭東、聶文萍、劉曉飛、劉健、李揚(yáng)笛、

林晨翔、謝煒。

所做的工作:標(biāo)準(zhǔn)編寫組查閱收集人工智能領(lǐng)域樣本增廣技術(shù)方面的相關(guān)資

料,結(jié)合電力人工智能場景,經(jīng)分析討論和對(duì)比整理確定了標(biāo)準(zhǔn)主要技術(shù)內(nèi)容,

由國家電網(wǎng)有限公司大數(shù)據(jù)中心牽頭完成標(biāo)準(zhǔn)草案編制,其他參與單位配合編制

并負(fù)責(zé)收集相關(guān)資料、提出建議。

二、標(biāo)準(zhǔn)編制原則和主要內(nèi)容

1、標(biāo)準(zhǔn)編制原則

本標(biāo)準(zhǔn)按照GB/T1.1-2020《標(biāo)準(zhǔn)化工作導(dǎo)則第1部分:標(biāo)準(zhǔn)化文件的結(jié)構(gòu)

與起草規(guī)則》的規(guī)定起草,遵循科學(xué)性、先進(jìn)性、經(jīng)濟(jì)性,堅(jiān)持實(shí)事求是,以電

力人工智能樣本增廣技術(shù)為基礎(chǔ),遵守國家有關(guān)法律、法規(guī),符合團(tuán)體標(biāo)準(zhǔn)要求,

目的在于明確電力人工智能樣本增廣技術(shù)架構(gòu)要求,提高電力人工智能模型的泛

化能力和準(zhǔn)確性,提升公司電力人工智能樣本增廣技術(shù)及應(yīng)用水平,促進(jìn)電力人

工智能技術(shù)的標(biāo)準(zhǔn)化和規(guī)范化,為電力行業(yè)的數(shù)字化轉(zhuǎn)型和智能化升級(jí)提供有力

的技術(shù)支持和保障。

在標(biāo)準(zhǔn)編制過程中,主要參考了《信息技術(shù)詞匯第29部分:人工智能語

音識(shí)別與合成》(GB/T5271.29—2006)、《信息技術(shù)詞匯第31部分:人工智

能機(jī)器學(xué)習(xí)》(GB/T5271.29—2006)、《紙質(zhì)檔案數(shù)字復(fù)制件光學(xué)字符識(shí)別OCR

工作規(guī)范》(DA/T77-2019)等標(biāo)準(zhǔn)。

2、標(biāo)準(zhǔn)主要內(nèi)容

本標(biāo)準(zhǔn)分為11個(gè)章節(jié):(1)范圍;(2)規(guī)范性引用文件;(3)術(shù)語和定義;

(4)符號(hào)、代號(hào)和縮略語;(5)樣本增廣技術(shù)總體架構(gòu);(6)圖像類樣本增廣

技術(shù);(7)文本文檔類樣本增廣技術(shù);(8)音頻類樣本增廣技術(shù);(9)樣本增廣

效果評(píng)價(jià)要求;(10)樣本增廣策略制定要求;(11)樣本增廣算子編排技術(shù)和功

能要求。主要內(nèi)容如下:

圖像類樣本增廣技術(shù)。規(guī)范圖像類樣本增廣技術(shù):包括基本圖像增廣、混合

圖像增廣和虛擬圖像生成。

文本文檔類樣本增廣技術(shù)。規(guī)范文本文檔類樣本增廣技術(shù):包括標(biāo)簽無關(guān)方

法、標(biāo)簽相關(guān)增廣方法、用于OCR文檔的樣本增廣技術(shù)。

語音類樣本增廣技術(shù)。規(guī)范語音類樣本增廣技術(shù):包括回譯技術(shù)、詞匯替換

技術(shù)、隨機(jī)噪聲引入技術(shù)和生成式技術(shù)。

樣本增廣效果評(píng)價(jià)要求。規(guī)范樣本增廣效果評(píng)價(jià)要求:包括通用評(píng)價(jià)要求、

圖像類樣本增廣效果評(píng)價(jià)要求、文本類樣本增廣效果評(píng)價(jià)要求、音頻類樣本增廣

效果評(píng)價(jià)要求。

樣本增廣策略制定要求。規(guī)范樣本增廣策略制定要求:包括樣本增廣目標(biāo)、

樣本增廣算子選擇、樣本增廣算子的順序、樣本增廣程度、樣本增廣的隨機(jī)性。

樣本增廣算子編排技術(shù)和功能要求。規(guī)范樣本增廣算子編排技術(shù)和功能要求:

要求增廣算子編排技術(shù)具備可擴(kuò)展性、并行性和容錯(cuò)性,數(shù)據(jù)流管理、優(yōu)化、調(diào)

度、可視化和管理。

3、主要技術(shù)差異

本標(biāo)準(zhǔn)為新制度標(biāo)準(zhǔn),無主要技術(shù)差異。

4、解決的主要問題

1)樣本數(shù)量不足和質(zhì)量層次不齊:在電力人工智能領(lǐng)域,訓(xùn)練樣本的數(shù)量

和質(zhì)量對(duì)模型的準(zhǔn)確性和泛化能力有著至關(guān)重要的影響。由于電力行業(yè)的特殊性

和復(fù)雜性,收集到的訓(xùn)練樣本往往數(shù)量不足、質(zhì)量層次不齊,這給模型訓(xùn)練和測

試帶來了很大的困難;

2)模型泛化能力不足:電力人工智能模型在訓(xùn)練過程中往往會(huì)出現(xiàn)過擬合

和欠擬合的問題,導(dǎo)致模型在測試集上的表現(xiàn)不佳,泛化能力不足。這主要是因

為訓(xùn)練樣本的數(shù)量和質(zhì)量、模型復(fù)雜度、訓(xùn)練時(shí)間等因素的影響;

3)架構(gòu)設(shè)計(jì)不規(guī)范:電力人工智能樣本增廣架構(gòu)設(shè)計(jì)是影響樣本增廣效果

的關(guān)鍵因素之一,目前電力人工智能樣本增廣技術(shù)的架構(gòu)設(shè)計(jì)往往缺乏規(guī)范和標(biāo)

準(zhǔn),給行業(yè)應(yīng)用和推廣帶來了一定的困難。通過規(guī)定電力人工智能平臺(tái)中樣本增

廣技術(shù)的架構(gòu)設(shè)計(jì)、技術(shù)要求和評(píng)估指標(biāo),提高電力人工智能模型的泛化能力和

準(zhǔn)確性,促進(jìn)電力人工智能樣本增廣技術(shù)的標(biāo)準(zhǔn)化和規(guī)范化。

三、主要試驗(yàn)(或驗(yàn)證)情況

本標(biāo)準(zhǔn)不涉及試驗(yàn)(或研制)情況。

四、標(biāo)準(zhǔn)中涉及專利的情況

本標(biāo)準(zhǔn)不涉及專利問題。

五、預(yù)期達(dá)到的社會(huì)效益、對(duì)產(chǎn)業(yè)發(fā)展的作用等情況

(1)填補(bǔ)電力人工智能樣本增廣技術(shù)領(lǐng)域標(biāo)準(zhǔn)的空白;

(2)規(guī)范電力人工智能樣本增廣技術(shù)架構(gòu)設(shè)計(jì),提升電力人工智能樣本增

廣效果;

(3)提高電力人工智能模型的泛化效果。

六、與國際、國外對(duì)比情況

本標(biāo)準(zhǔn)不涉及國際標(biāo)準(zhǔn)。本標(biāo)準(zhǔn)在編制過程中參考了《信息技術(shù)詞匯第

29部分:人工智能語音識(shí)別與合成》(GB/T5271.29—2006)、《信息技術(shù)詞

匯第31部分:人工智能機(jī)器學(xué)習(xí)》(GB/T5271.29—2006)、《紙質(zhì)檔案數(shù)字

復(fù)制件光學(xué)字符識(shí)別OCR工作規(guī)范》(DA/T77-2019)等標(biāo)準(zhǔn)。目前,國內(nèi)缺少電

力人工智能樣本增廣技術(shù)相關(guān)標(biāo)準(zhǔn)。本標(biāo)準(zhǔn)屬于國內(nèi)先進(jìn)水平。本標(biāo)準(zhǔn)與現(xiàn)行的

相關(guān)法律、法規(guī)、規(guī)章與相關(guān)標(biāo)準(zhǔn)保持一致。

七、在標(biāo)準(zhǔn)體系中的位置,與現(xiàn)行相關(guān)法律、法規(guī)、規(guī)章及相關(guān)標(biāo)準(zhǔn),特

別是強(qiáng)制性標(biāo)準(zhǔn)的協(xié)調(diào)性

本標(biāo)準(zhǔn)與現(xiàn)行的相關(guān)法律、法規(guī)、規(guī)章與相關(guān)標(biāo)準(zhǔn)保持一致。

八、重大分歧意見的處理經(jīng)過和依據(jù)

無。標(biāo)準(zhǔn)編制過程中廣泛征集了專家意見,所有意見均按照標(biāo)準(zhǔn)編制程序進(jìn)

行了采納,不存在重大分歧意見。

九、標(biāo)準(zhǔn)性質(zhì)的建議說明

建議本團(tuán)體標(biāo)準(zhǔn)的性質(zhì)為推薦性團(tuán)體標(biāo)準(zhǔn)。

十、貫徹標(biāo)準(zhǔn)的要求和措施建議

(1)規(guī)定相關(guān)從事電力人工智能領(lǐng)域工作的人員或團(tuán)體,按照此標(biāo)準(zhǔn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論