下載本文檔
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)
團(tuán)體標(biāo)準(zhǔn)《面向異構(gòu)計(jì)算的數(shù)據(jù)質(zhì)量要求》(征求意見(jiàn)稿)
編制說(shuō)明
一、工作簡(jiǎn)況
1、任務(wù)來(lái)源
2017年國(guó)務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》,要求提升新一代人工智能
科技創(chuàng)新能力為主攻方向,構(gòu)建開(kāi)放協(xié)同的人工智能科技創(chuàng)新體系,2020年國(guó)家
標(biāo)準(zhǔn)委等五部門(mén)印發(fā)《國(guó)家新一代人工智能標(biāo)準(zhǔn)體系建設(shè)指南》,對(duì)人工智能產(chǎn)
業(yè)標(biāo)準(zhǔn)體系的構(gòu)建提出了需求和目標(biāo),以推進(jìn)人工智能產(chǎn)業(yè)全面規(guī)范化發(fā)展。隨
著科技的飛速發(fā)展,大量的數(shù)據(jù)被不斷生成、收集和存儲(chǔ),這些數(shù)據(jù)成為了推動(dòng)
人工智能技術(shù)發(fā)展的關(guān)鍵資源。然而,數(shù)據(jù)的核心不在于“大”而在于“質(zhì)量”,
數(shù)據(jù)的質(zhì)量對(duì)于人工智能的應(yīng)用和決策過(guò)程具有深遠(yuǎn)的影響,對(duì)于異構(gòu)智能計(jì)算
場(chǎng)景來(lái)說(shuō)更是如此。面對(duì)海量的多源異構(gòu)數(shù)據(jù),若不對(duì)這些數(shù)據(jù)的質(zhì)量進(jìn)行約束
和評(píng)估,將會(huì)影響整個(gè)異構(gòu)智能計(jì)算的應(yīng)用流程。
然而,我國(guó)目前對(duì)于異構(gòu)計(jì)算的數(shù)據(jù)質(zhì)量的標(biāo)準(zhǔn)體系并不完善,這使得異構(gòu)
智能計(jì)算的發(fā)展受影響,帶來(lái)異構(gòu)計(jì)算的訓(xùn)練過(guò)程后得到的模型精度不理想、模
型存在惡意后門(mén)等諸多問(wèn)題;因此,為規(guī)范異構(gòu)智能計(jì)算場(chǎng)景下的數(shù)據(jù)質(zhì)量,亟
需定制相關(guān)的數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn),以促進(jìn)人工智能等數(shù)據(jù)驅(qū)動(dòng)型產(chǎn)業(yè)進(jìn)一步發(fā)展。
本團(tuán)體標(biāo)準(zhǔn)屬于國(guó)家重大研發(fā)計(jì)劃的國(guó)家質(zhì)量基礎(chǔ)設(shè)施體系(NQI)專(zhuān)項(xiàng)(項(xiàng)
目號(hào):2022YFF0604500)。
本團(tuán)體標(biāo)準(zhǔn)任務(wù)來(lái)源于中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)(以下簡(jiǎn)稱(chēng)“中電標(biāo)
協(xié)”)2023年7月10日發(fā)布的《2023年第六批團(tuán)體標(biāo)準(zhǔn)制修訂項(xiàng)目的通知》(中
電標(biāo)通[2023]020號(hào)),項(xiàng)目號(hào)為CESA-2023-075,標(biāo)準(zhǔn)項(xiàng)目名稱(chēng):面向異構(gòu)計(jì)算
的數(shù)據(jù)質(zhì)量要求,本標(biāo)準(zhǔn)是新制定標(biāo)準(zhǔn),項(xiàng)目周期12個(gè)月。項(xiàng)目牽頭單位是南京
大學(xué)。
2、標(biāo)準(zhǔn)起草單位
本標(biāo)準(zhǔn)由南京大學(xué)、中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院等單位共同起草。
3、主要工作過(guò)程
中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)
2022年10月-2023年3月,南京大學(xué)對(duì)異構(gòu)計(jì)算場(chǎng)景下數(shù)據(jù)質(zhì)量的現(xiàn)狀、需求
和問(wèn)題進(jìn)行了廣泛的前期調(diào)研,為標(biāo)準(zhǔn)的編寫(xiě)奠定基礎(chǔ)。
2023年3月31日,南京大學(xué)與標(biāo)準(zhǔn)起草組內(nèi)單位進(jìn)行討論,結(jié)合討論的意見(jiàn),
確定了標(biāo)準(zhǔn)的框架和主體內(nèi)容,并開(kāi)始撰寫(xiě)標(biāo)準(zhǔn)的草案。
2023年5月26日,南京大學(xué)完成了標(biāo)準(zhǔn)草案的初步撰寫(xiě),并就撰寫(xiě)的草案與
標(biāo)準(zhǔn)起草組內(nèi)單位進(jìn)行討論,重點(diǎn)對(duì)標(biāo)準(zhǔn)的范圍、異構(gòu)數(shù)據(jù)的考慮以及數(shù)據(jù)質(zhì)量
的維度進(jìn)行了討論。
2023年6月9日,南京大學(xué)就修改后的草案與標(biāo)準(zhǔn)起草組內(nèi)單位進(jìn)行討論,重
點(diǎn)對(duì)異構(gòu)計(jì)算訓(xùn)練過(guò)程的輸入數(shù)據(jù)和輸出數(shù)據(jù)在安全、隱私、可溯源等方面的相
關(guān)意見(jiàn)進(jìn)行了討論。
2023年6月20日,南京大學(xué)完成對(duì)相關(guān)意見(jiàn)的整合和對(duì)草案的修改,形成了
團(tuán)體標(biāo)準(zhǔn)《信息技術(shù)異構(gòu)計(jì)算安全可信數(shù)據(jù)要求》(草案稿)。
2023年7月4日,由中國(guó)電子工業(yè)技術(shù)協(xié)會(huì)組織團(tuán)體標(biāo)準(zhǔn)項(xiàng)目立項(xiàng)論證會(huì),對(duì)
《信息技術(shù)異構(gòu)計(jì)算安全可信聯(lián)邦學(xué)習(xí)系統(tǒng)技術(shù)要求》等四項(xiàng)團(tuán)體標(biāo)準(zhǔn)項(xiàng)目建
議進(jìn)行了論證,會(huì)上建議修改標(biāo)準(zhǔn)名稱(chēng)為《面向異構(gòu)計(jì)算的數(shù)據(jù)質(zhì)量要求》后同
意立項(xiàng)。
2023年9月4日,根據(jù)中電標(biāo)協(xié)發(fā)布的《2023年第六批團(tuán)體標(biāo)準(zhǔn)制修訂項(xiàng)目的
通知》(中電標(biāo)通[2023]020號(hào))要求,南京大學(xué)聯(lián)合中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究
院等單位成立標(biāo)準(zhǔn)編制工作組,召開(kāi)了第一次標(biāo)準(zhǔn)編制工作會(huì)議,策劃標(biāo)準(zhǔn)的編
制工作,制定了編制工作任務(wù),著手開(kāi)展標(biāo)準(zhǔn)的編制工作。
2023年9月5日-2023年9月15日,標(biāo)準(zhǔn)工作組對(duì)標(biāo)準(zhǔn)草案進(jìn)行研討,初步形成
《面向異構(gòu)計(jì)算的數(shù)據(jù)質(zhì)量要求》(征求意見(jiàn)稿)。
2023年9月16日-2023年10月17日,對(duì)征求意見(jiàn)稿(初稿)進(jìn)行再編制、研討
及完善,形成了《面向異構(gòu)計(jì)算的數(shù)據(jù)質(zhì)量要求》(征求意見(jiàn)稿)。
二、標(biāo)準(zhǔn)編制原則和確定主要內(nèi)容的論據(jù)及解決的主要問(wèn)題
1、編制原則
在標(biāo)準(zhǔn)編制過(guò)程中,遵循了以下五方面的原則。
a)符合性。遵循國(guó)家法律、法規(guī)等相關(guān)規(guī)定,制定過(guò)程嚴(yán)格按照程序
執(zhí)行。
中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)
b)先進(jìn)性。制定過(guò)程中充分考慮了異構(gòu)計(jì)算下的數(shù)據(jù)多分布、多模態(tài)
特點(diǎn),并從數(shù)據(jù)的安全、可信方面的數(shù)據(jù)質(zhì)量進(jìn)行考慮,具有前瞻性。
c)適用性。本文件充分考慮異構(gòu)計(jì)算下的智能計(jì)算的數(shù)據(jù)使用需求,
并參考了現(xiàn)有的多源異構(gòu)數(shù)據(jù)可能存在的數(shù)據(jù)質(zhì)量問(wèn)題。
d)中立性。在本文件制定過(guò)程中,編制工作組對(duì)標(biāo)準(zhǔn)文本進(jìn)行了充分
討論,確保了中立性和客觀(guān)性。
e)科學(xué)性。本文件的指標(biāo)經(jīng)過(guò)科學(xué)合理的設(shè)計(jì),試驗(yàn)方法已經(jīng)經(jīng)過(guò)驗(yàn)
證。
2、確定主要內(nèi)容的依據(jù)
當(dāng)前,海量的終端設(shè)備每時(shí)每刻都在產(chǎn)生大量的數(shù)據(jù),這為異構(gòu)智能計(jì)算場(chǎng)
景訓(xùn)練出更加優(yōu)秀的模型提供了良好的基礎(chǔ)。然而,這些多源異構(gòu)數(shù)據(jù)的數(shù)據(jù)質(zhì)
量卻參差不齊。目前缺失對(duì)于這些多源異構(gòu)數(shù)據(jù)的數(shù)據(jù)質(zhì)量規(guī)范,會(huì)存在用于智
能模型訓(xùn)練的輸入數(shù)據(jù)質(zhì)量低、甚至是存在投毒數(shù)據(jù)的問(wèn)題,并導(dǎo)致輸出的智能
模型存在模型精度低、包含被惡意植入的后門(mén)等,影響整個(gè)異構(gòu)智能計(jì)算的應(yīng)用
流程,阻礙異構(gòu)智能計(jì)算的發(fā)展。結(jié)合《GB/T36344-2018信息技術(shù)數(shù)據(jù)質(zhì)量
評(píng)價(jià)指標(biāo)》中對(duì)于數(shù)據(jù)質(zhì)量的評(píng)價(jià)維度以及現(xiàn)有智能計(jì)算的數(shù)據(jù)在安全性和隱私
性等多方面的質(zhì)量要求,本標(biāo)準(zhǔn)對(duì)于異構(gòu)計(jì)算中的多源異構(gòu)數(shù)據(jù)的數(shù)據(jù)質(zhì)量進(jìn)行
要求,規(guī)范該場(chǎng)景下的數(shù)據(jù)質(zhì)量。
本標(biāo)準(zhǔn)針對(duì)異構(gòu)智能計(jì)算訓(xùn)練場(chǎng)景的數(shù)據(jù)質(zhì)量的要求,包含智能計(jì)算訓(xùn)練過(guò)
程的輸入數(shù)據(jù)質(zhì)量要求和輸出數(shù)據(jù)質(zhì)量要求。
3、編制過(guò)程中解決的主要問(wèn)題
由于當(dāng)前國(guó)內(nèi)外沒(méi)有多源異構(gòu)智能計(jì)算場(chǎng)景下數(shù)據(jù)質(zhì)量的相關(guān)標(biāo)準(zhǔn),為此標(biāo)
準(zhǔn)工作組在編制過(guò)程中充分吸取了異構(gòu)計(jì)算數(shù)據(jù)提供方、異構(gòu)計(jì)算數(shù)據(jù)使用方以
及高校和科研院所對(duì)異構(gòu)計(jì)算的數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)的意見(jiàn),對(duì)于解決異構(gòu)計(jì)算場(chǎng)景下
的數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)缺失,保護(hù)數(shù)據(jù)的安全流通共享提供標(biāo)準(zhǔn)依據(jù),推動(dòng)異構(gòu)計(jì)算場(chǎng)
景下的數(shù)據(jù)要素市場(chǎng)健康發(fā)展,助力形成新的特色產(chǎn)業(yè)和國(guó)際競(jìng)爭(zhēng)力。
三、主要試驗(yàn)[或驗(yàn)證]情況分析
在標(biāo)準(zhǔn)制定過(guò)程中,標(biāo)準(zhǔn)工作組對(duì)標(biāo)準(zhǔn)規(guī)定的異構(gòu)計(jì)算的數(shù)據(jù)質(zhì)量要求征集
了異構(gòu)計(jì)算數(shù)據(jù)提供方、異構(gòu)計(jì)算數(shù)據(jù)使用方的意見(jiàn),并充分考慮科技發(fā)展及應(yīng)
中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)
用。從市場(chǎng)符合性分析,本標(biāo)準(zhǔn)規(guī)定的技術(shù)要求和是合理的,切實(shí)給出符合異構(gòu)
計(jì)算場(chǎng)景下的高質(zhì)量數(shù)據(jù)的要求。
四、知識(shí)產(chǎn)權(quán)情況說(shuō)明
本標(biāo)準(zhǔn)不涉及知識(shí)產(chǎn)權(quán)問(wèn)題。
五、產(chǎn)業(yè)化情況、推廣應(yīng)用論證和預(yù)期達(dá)到的經(jīng)濟(jì)效果
標(biāo)準(zhǔn)發(fā)布后,有助于突破多源異構(gòu)數(shù)據(jù)質(zhì)量的標(biāo)準(zhǔn)化評(píng)估技術(shù),構(gòu)建覆蓋多
指標(biāo)維度的數(shù)據(jù)評(píng)價(jià)體系;也可以為智慧教育、智慧醫(yī)療等多個(gè)典型行業(yè)的應(yīng)用
示范提供高質(zhì)量數(shù)據(jù)的技術(shù)支撐。
六、轉(zhuǎn)化國(guó)際標(biāo)準(zhǔn)和國(guó)外先進(jìn)標(biāo)準(zhǔn)情況
本標(biāo)準(zhǔn)未采用國(guó)際標(biāo)準(zhǔn)和國(guó)外先進(jìn)標(biāo)準(zhǔn)。
七、與現(xiàn)行相關(guān)法律、法規(guī)、規(guī)章及相關(guān)標(biāo)準(zhǔn)的協(xié)調(diào)性
本標(biāo)準(zhǔn)編制文本格式按照GB/T1.1-2020的規(guī)定起草,與現(xiàn)行相關(guān)法律、法
規(guī)、規(guī)章不矛盾。
本標(biāo)準(zhǔn)引用到的標(biāo)準(zhǔn)包括:
GB/T35273信息安全技術(shù)個(gè)人信息安全規(guī)范
GB/T41867-2022信息技術(shù)人工智能術(shù)語(yǔ)
八、重大分歧意見(jiàn)的處理經(jīng)過(guò)和依據(jù)
標(biāo)準(zhǔn)研制過(guò)程中,本標(biāo)準(zhǔn)在立項(xiàng)論證時(shí),多位立項(xiàng)評(píng)審專(zhuān)家進(jìn)行專(zhuān)家質(zhì)詢(xún)時(shí),
認(rèn)為標(biāo)準(zhǔn)名稱(chēng)《信息技術(shù)異構(gòu)計(jì)算安全可信數(shù)據(jù)要求》不足以涵蓋標(biāo)準(zhǔn)內(nèi)容,
建議將名稱(chēng)改為《面向異構(gòu)計(jì)算的數(shù)據(jù)質(zhì)量要求》,更能準(zhǔn)確體現(xiàn)標(biāo)準(zhǔn)文本的范
圍和實(shí)質(zhì)內(nèi)容,為此提出調(diào)整標(biāo)準(zhǔn)名稱(chēng)申請(qǐng),未變更標(biāo)準(zhǔn)的技術(shù)內(nèi)容。
九、貫徹標(biāo)準(zhǔn)的要求和措施建議
建議列為推薦性標(biāo)準(zhǔn),在標(biāo)準(zhǔn)發(fā)布后盡快組織標(biāo)準(zhǔn)宣貫、試驗(yàn)驗(yàn)證。
十、替代或廢止現(xiàn)行相關(guān)標(biāo)準(zhǔn)的建議
無(wú)需要替代或廢止的現(xiàn)行相關(guān)標(biāo)準(zhǔn)。
十一、其它應(yīng)予說(shuō)明的事項(xiàng)
無(wú)。
中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 浙江省金華市2024年中考數(shù)學(xué)一模試題含答案
- 開(kāi)封文化藝術(shù)職業(yè)學(xué)院《創(chuàng)新與創(chuàng)業(yè)管理A》2023-2024學(xué)年第一學(xué)期期末試卷
- 江蘇警官學(xué)院《現(xiàn)代舞基訓(xùn)》2023-2024學(xué)年第一學(xué)期期末試卷
- 吉安職業(yè)技術(shù)學(xué)院《機(jī)器人技術(shù)基礎(chǔ)B》2023-2024學(xué)年第一學(xué)期期末試卷
- 湖南理工學(xué)院南湖學(xué)院《廣播電視新聞播音與主持》2023-2024學(xué)年第一學(xué)期期末試卷
- 黑龍江建筑職業(yè)技術(shù)學(xué)院《CA課件設(shè)計(jì)》2023-2024學(xué)年第一學(xué)期期末試卷
- 高考物理總復(fù)習(xí)《磁場(chǎng)的性質(zhì)》專(zhuān)項(xiàng)測(cè)試卷帶答案
- 重慶對(duì)外經(jīng)貿(mào)學(xué)院《快速建筑設(shè)計(jì)》2023-2024學(xué)年第一學(xué)期期末試卷
- 鎮(zhèn)江市高等專(zhuān)科學(xué)?!妒称芳庸ぐ踩刂啤?023-2024學(xué)年第一學(xué)期期末試卷
- 浙江交通職業(yè)技術(shù)學(xué)院《粉體工程與設(shè)備》2023-2024學(xué)年第一學(xué)期期末試卷
- 《榜樣9》觀(guān)后感心得體會(huì)四
- 《住院患者身體約束的護(hù)理》團(tuán)體標(biāo)準(zhǔn)解讀課件
- 足球比賽專(zhuān)用表格
- 全面設(shè)備管理(TPM)培訓(xùn)資料-課件
- 高中地理《外力作用與地表形態(tài)》優(yōu)質(zhì)課教案、教學(xué)設(shè)計(jì)
- 車(chē)間生產(chǎn)管理流程圖模板
- 河北省邢臺(tái)市各縣區(qū)鄉(xiāng)鎮(zhèn)行政村村莊村名居民村民委員會(huì)明細(xì)
- 市場(chǎng)部績(jī)效考核表
- 10000中國(guó)普通人名大全
- 學(xué)霸高中數(shù)學(xué)高中數(shù)學(xué)筆記全冊(cè)(最終)
- 熱棒的要點(diǎn)及要求
評(píng)論
0/150
提交評(píng)論