人工智能 音視頻及圖像分析算法接口-編制說明_第1頁
人工智能 音視頻及圖像分析算法接口-編制說明_第2頁
人工智能 音視頻及圖像分析算法接口-編制說明_第3頁
人工智能 音視頻及圖像分析算法接口-編制說明_第4頁
人工智能 音視頻及圖像分析算法接口-編制說明_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

國家標準報批資料

一、工作簡況

1、任務來源

根據(jù)國家標準委員會2021年標準制修訂計劃,杭州??低晹?shù)字技術股份

有限公司負責制定《人工智能音視頻及圖像分析算法接口》(項目計劃號:

20213184-T-339)。本標準由全國音頻、視頻及多媒體系統(tǒng)與設備標準化技術委

員會(SAC/TC242)作為技術歸口單位。

2、協(xié)作單位及主要起草人

本標準主要由杭州??低晹?shù)字技術股份有限公司負責牽頭起草,音視頻標

委會組織相關單位成立起草組,起草過程中廣泛征求意見。

起草組成員(待完善):杭州??低晹?shù)字技術股份有限公司

本標準主要起草人(待完善):陳喆、楊揚。

二、標準編制原則和確定主要內容的論據(jù)及解決的主要問題

1、標準編制原則

標準編制依據(jù)GB/T1.1-2020《標準化工作導則第1部分:標準化文件的結

構和起草規(guī)則》的要求進行編寫。使應用該技術規(guī)范的各方就其意義和意圖達成

共識。標準力求格式、規(guī)范內容清晰、準確并有正確和一致的解釋。

國家標準報批資料

2、標準編制的主要內容

標準規(guī)定了音視頻與圖像分析算法接口,涵蓋了解析算法和比對算法在算法

包和算法服務形式下的接口規(guī)范,包括接口的應用環(huán)境、數(shù)據(jù)格式定義和接口交

互過程等。本文件適用于音視頻與圖像的分析算法的接入與應用,也可用于指導

智能應用系統(tǒng)與算法包、算法服務的系統(tǒng)集成與開發(fā)。

3、標準制定的目的和意義

a)智能分析技術在十幾年前就已經在人工智能領域開始應用,隨著深度學習等

技術的發(fā)展,智能分析算法也有了長足進步。隨著與智能家居、智能安防等

場景的結合程度持續(xù)提高,智能分析技術也迎來了前所未有的大機遇;

b)現(xiàn)在的視頻分析領域有眾多的需求,如車牌識別、人臉識別、行為分析、場

景分析等等。同時行業(yè)中也涌現(xiàn)了很多以AI算法為核心的技術公司,深耕

于各個細分領域;

c)隨著用戶對智能和算法的了解深入,用戶開始不滿足于只采用一家的算法,

希望將各家優(yōu)秀算法放入算法倉庫,在使用時擇優(yōu)取之,這樣可以有效發(fā)揮

各家算法的長處,同時,這類需求同時也與行業(yè)的發(fā)展方向相匹配;

d)目前的智能算法使用方式固化,和設備呈現(xiàn)強綁定關系。即使有算法的替換,

也需要通過定制統(tǒng)一接口來實現(xiàn)。由于缺乏統(tǒng)一標準,項目成果的復用程度

低,很難在其他項目上借鑒。因此算法廠商與平臺集成廠商面對不同項目時

需要投入大量的人力、物力進行重復性開發(fā)、調試;

e)該標準旨在通過對算法接口的統(tǒng)一,實現(xiàn)系統(tǒng)有能力對多種算法的兼容,這種

應用在目前的眾多應用領域需求已成熟(目前較多項目是定制化的統(tǒng)一接口),

實際項目可直接落地應用,同時也與當前人工智能智慧容器的大方向相匹

配。

三、編制過程

一)、團標階段:

國家標準報批資料

2018年9月14日,中國電子工業(yè)標準化技術協(xié)會下達2018年第四季度第

一批團體標準,擬研制《信息技術音視頻及圖像分析算法接口》相關標準。本

標準為自主制定標準,計劃編號為CESA-2018-4-002,歸口單位為中國電子技術

標準化研究院,由杭州海康威視數(shù)字技術股份有限公司牽頭組織編制。該團標于

2019年4月發(fā)布,標準編號為T/CESA1035-2019。具體工作過程如下:

2017年6月28日,總體組在京召開人工智能標準需求研討會,確定對該項標準進

行研制。

2018年8月28日,第一次標準編制討論會,與各參與單位進行研討,對各標準的

立項材料進行封閉編寫。

2018年9月13日,立項評審會,標準立項評審。

2018年10月15日,標準編制會,對標準草案進行封閉編寫。

2018年11月7日,標準編制會,對標準草案進行封閉編寫。

2018年11月28日到12月25日,電標協(xié)會針對該標準征求意見,標準編制組針

對意見進行了處理,形成了標準審查稿。

2019年1月,團標審查,

2019年4月,團標發(fā)布。

二)、國標階段:

在主管部門支持下,經過工信部、國標委評審和專家論證,該項目于2021

年第三度獲得正式立項。標準獲得立項后,在全國音頻、視頻及多媒體系統(tǒng)與設

備標準化技術委員會組織下,杭州??低晹?shù)字技術股份有限公司成立了起草

組,單位包括主流算法廠商與平臺集成廠商、算法接口以及服務用戶廠商、高校、

研究機構等。具體工作過程以及詳細討論內容如下:

2019年5月,國標立項答辯。

2020年1月,電子司答辯。

2020年6月,科技司答辯。

2021年3月,國標委答辯。

2021年8月,標準計劃號下達。

2021年12月,國標編制啟動會召開。

2022年8月,國標編制討論會召開。

國家標準報批資料

2022年11月,國標編制討論會召開。

第一次會議

2021年12月,召開國標立項啟動會,來自各不同領域的相關單位代表共同

參會討論。會上,音視頻標委會介紹了國標的背景和編制要求,海康威視作為標

準主編單位介紹了標準從團標階段到國標階段的整體工作過程以及標準文件主

要內容。會議針對各與會單位提出的問題進行了充分的研討溝通,會上各單位就

現(xiàn)有標準草案的范圍、框架以及內容成熟程度一致認可。會議決議對標準文本進

行規(guī)范化調整后,可進入征求意見階段。

第二次會議

2022年8月,召開國標編制討論會,全體代表對標準進行較為詳細的討論,

會上主要討論的內容分為如下三個板塊:

1.對上一版草案反饋的意見處理情況進行溝通并確定處理方案;

2.對各單位會上提出的問題和建議進行討論并確定修改方向。會后需修改的主

要內容如下:

1)首頁封面中英文需保持一致;

2)范圍:規(guī)定了接口的具體內容盡量補充完整;

3)縮略語如果定義,關鍵詞替換為縮略詞;

4)圖1的大箭頭改為雙向箭頭;

5)類似中的角標存在使用不規(guī)范問題,建議參考國標1.1,修

改描述方式;

6)建議把要求內容寫細致便于落地;

7)建議建立標準討論群便于溝通;

3、標委會秘書處協(xié)助起草組明確后續(xù)工作計劃。具體安排如下:

1)牽頭單位需做好過程文件的準備和管理。本次會議紀要以及標準草

案郵件發(fā)出給起草組各參編單位;

2)標準各參編單位請將處理意見于9月8號之前反饋至牽頭單位郵箱

(yangyangyf1@)并抄送給標委會秘書處郵箱

(sac_tc242@163.com);

3)9月8日意見回收后,9月再針對意見處理版本進行一次討論定稿,

國家標準報批資料

之后進入標準征求意見階段。

第三次會議

1、對第二次編制討論會會上以及會后反饋的多項意見修改成果逐條研討,其

中絕大多數(shù)修改成果組內達成一致。個別未達成共識的問題經會上討論已明確

修改方案,將于會后完成修改。具體意見以及處理結論見附錄表2;

2、對各單位會上提出的意見和建議進行討論并確定修改方案;

工作組各單位會上所提意見已做充分討論,修改方案已達成一致,將于會后完

成修改。具體意見以及處理結論見附錄表3;

3、標委會秘書處協(xié)助起草組明確后續(xù)工作計劃。具體安排如下:

1)牽頭單位將本次會上討論的問題處理完畢,形成征求意見稿,稿件

文本于11月30日前發(fā)給標委會及編制組各單位,編制說明等相關

資料同期提交給標委會。

2)計劃在年底前完成征求意見公示過程。

四、知識產權情況說明

該標準為接口規(guī)范標準,不涉及專利問題。

五、產業(yè)化情況、推廣應用論證和預期達到的經濟效果

當前人工智能受到的關注度持續(xù)提升,大量資本的匯聚以及各類社會資源的

不斷投入,驅動人工智能技術的飛速發(fā)展。近年來,隨著深度學習技術的突破性

進展,利用深度學習技術理解視音頻內容,為視音頻分析領域帶來了前所未有的

大機遇,使之成為人工智能技術最大應用場景之一。

視音頻分析領域中,有眾多細分場景,如車牌識別、人臉識別、行為分析、

場景分析等等。行業(yè)中涌現(xiàn)了很多以AI算法為核心的技術公司,深耕于各個細分

領域。隨著社會對AI認知的不斷加深,大量用戶開始不滿足于只采用一家的算法,

轉而希望實現(xiàn)算法的兼收并蓄,針對不同細分場景擇優(yōu)取之,最大化各個算法的

優(yōu)勢。

國家標準報批資料

目前,在涉及多算法的智能分析項目中,為實現(xiàn)系統(tǒng)對多種算法的兼容,算

法廠商與平臺集成廠商都需要投入大量的人力、物力進行開發(fā)、調試。且由于缺

乏統(tǒng)一標準,項目成果的復用程度低,很難在其他項目上借鑒。本標準規(guī)定了音

視頻與圖像分析算法接口,包括算法包接口和算法服務接口。通過算法接口標準

化,可實現(xiàn)系統(tǒng)對不同算法的調用規(guī)范化,從而滿足各醫(yī)療、教育、金融、家居、

交通、公安等等眾多行業(yè)不同領域對基礎通用標準的實際需求。該標準適用于視

音頻與圖片智能分析算法的接入與應用,可用于指導智能算法與服務系統(tǒng)的集成

與開發(fā)。標準的研制可避免因缺少統(tǒng)一的算法接口標準導致開發(fā)成本浪費,同時

也很好的為當前人工智能智慧容器的大發(fā)展方向提供支撐。標準的實施可實現(xiàn)產

業(yè)內的統(tǒng)一探討,形成產業(yè)共認的標準接口,推動智能分析領域相關技術的良性

合作和發(fā)展,具有不可取代的支撐作用。

六、采用國際標準和國外先進標準情況

本標準未采用國際標準或國外先進標準。

七、與現(xiàn)行相關法律、法規(guī)、規(guī)章及相關標準的協(xié)調性

本標準與現(xiàn)行相關法律、法規(guī)、規(guī)章及相關標準協(xié)調一致。

八、重大分歧意見的處理經過和依據(jù)

無。

九、標準性質的建議

該標準的推廣應用將產生巨大的經濟效益和社會效益,因此,建議作為推薦

性國家標準發(fā)布。

國家標準報批資料

十、貫徹標準的要求和措施建議

建議加快推進該標準的發(fā)布和實施工作,由中國電子技術標準化研究院組織

行業(yè)單位,開展該標準的宣貫工作。

十一、替代或廢止現(xiàn)行相關標準的建議

十二、其它應予說明的事項

國家標準報批資料

國家標準報批資料

一、工作簡況

1、任務來源

根據(jù)國家標準委員會2021年標準制修訂計劃,杭州海康威視數(shù)字技術股份

有限公司負責制定《人工智能音視頻及圖像分析算法接口》(項目計劃號:

20213184-T-339)。本標準由全國音頻、視頻及多媒體系統(tǒng)與設備標準化技術委

員會(SAC/TC242)作為技術歸口單位。

2、協(xié)作單位及主要起草人

本標準主要由杭州??低晹?shù)字技術股份有限公司負責牽頭起草,音視頻標

委會組織相關單位成立起草組,起草過程中廣泛征求意見。

起草組成員(待完善):杭州海康威視數(shù)字技術股份有限公司

本標準主要起草人(待完善):陳喆、楊揚。

二、標準編制原則和確定主要內容的論據(jù)及解決的主要問題

1、標準編制原則

標準編制依據(jù)GB/T1.1-2020《標準化工作導則第1部分:標準化文件的結

構和起草規(guī)則》的要求進行編寫。使應用該技術規(guī)范的各方就其意義和意圖達成

共識。標準力求格式、規(guī)范內容清晰、準確并有正確和一致的解釋。

國家標準報批資料

2、標準編制的主要內容

標準規(guī)定了音視頻與圖像分析算法接口,涵蓋了解析算法和比對算法在算法

包和算法服務形式下的接口規(guī)范,包括接口的應用環(huán)境、數(shù)據(jù)格式定義和接口交

互過程等。本文件適用于音視頻與圖像的分析算法的接入與應用,也可用于指導

智能應用系統(tǒng)與算法包、算法服務的系統(tǒng)集成與開發(fā)。

3、標準制定的目的和意義

a)智能分析技術在十幾年前就已經在人工智能領域開始應用,隨著深度學習等

技術的發(fā)展,智能分析算法也有了長足進步。隨著與智能家居、智能安防等

場景的結合程度持續(xù)提高,智能分析技術也迎來了前所未有的大機遇;

b)現(xiàn)在的視頻分析領域有眾多的需求,如車牌識別、人臉識別、行為分析、場

景分析等等。同時行業(yè)中也涌現(xiàn)了很多以AI算法為核心的技術公司,深耕

于各個細分領域;

c)隨著用戶對智能和算法的了解深入,用戶開始不滿足于只采用一家的算法,

希望將各家優(yōu)秀算法放入算法倉庫,在使用時擇優(yōu)取之,這樣可以有效發(fā)揮

各家算法的長處,同時,這類需求同時也與行業(yè)的發(fā)展方向相匹配;

d)目前的智能算法使用方式固化,和設備呈現(xiàn)強綁定關系。即使有算法的替換,

也需要通過定制統(tǒng)一接口來實現(xiàn)。由于缺乏統(tǒng)一標準,項目成果的復用程度

低,很難在其他項目上借鑒。因此算法廠商與平臺集成廠商面對不同項目時

需要投入大量的人力、物力進行重復性開發(fā)、調試;

e)該標準旨在通過對算法接口的統(tǒng)一,實現(xiàn)系統(tǒng)有能力對多種算法的兼容,這種

應用在目前的眾多應用領域需求已成熟(目前較多項目是定制化的統(tǒng)一接口),

實際項目可直接落地應用,同時也與當前人工智能智慧容器的大方向相匹

配。

三、編制過程

一)、團標階段:

國家標準報批資料

2018年9月14日,中國電子工業(yè)標準化技術協(xié)會下達2018年第四季度第

一批團體標準,擬研制《信息技術音視頻及圖像分析算法接口》相關標準。本

標準為自主制定標準,計劃編號為CESA-2018-4-002,歸口單位為中國電子技術

標準化研究院,由杭州??低晹?shù)字技術股份有限公司牽頭組織編制。該團標于

2019年4月發(fā)布,標準編號為T/CESA1035-2019。具體工作過程如下:

2017年6月28日,總體組在京召開人工智能標準需求研討會,確定對該項標準進

行研制。

2018年8月28日,第一次標準編制討論會,與各參與單位進行研討,對各標準的

立項材料進行封閉編寫。

2018年9月13日,立項評審會,標準立項評審。

2018年10月15日,標準編制會,對標準草案進行封閉編寫。

2018年11月7日,標準編制會,對標準草案進行封閉編寫。

2018年11月28日到12月25日,電標協(xié)會針對該標準征求意見,標準編制組針

對意見進行了處理,形成了標準審查稿。

2019年1月,團標審查,

2019年4月,團標發(fā)布。

二)、國標階段:

在主管部門支持下,經過工信部、國標委評審和專家論證,該項目于2021

年第三度獲得正式立項。標準獲得立項后,在全國音頻、視頻及多媒體系統(tǒng)與設

備標準化技術委員會組織下,杭州海康威視數(shù)字技術股份有限公司成立了起草

組,單位包括主流算法廠商與平臺集成廠商、算法接口以及服務用戶廠商、高校、

研究機構等。具體工作過程以及詳細討論內容如下:

2019年5月,國標立項答辯。

2020年1月,電子司答辯。

2020年6月,科技司答辯。

2021年3月,國標委答辯。

2021年8月,標準計劃號下達。

2021年12月,國標編制啟動會召開。

2022年8月,國標編制討論會召開。

國家標準報批資料

2022年11月,國標編制討論會召開。

第一次會議

2021年12月,召開國標立項啟動會,來自各不同領域的相關單位代表共同

參會討論。會上,音視頻標委會介紹了國標的背景和編制要求,海康威視作為標

準主編單位介紹了標準從團標階段到國標階段的整體工作過程以及標準文件主

要內容。會議針對各與會單位提出的問題進行了充分的研討溝通,會上各單位就

現(xiàn)有標準草案的范圍、框架以及內容成熟程度一致認可。會議決議對標準文本進

行規(guī)范化調整后,可進入征求意見階段。

第二次會議

2022年8月,召開國標編制討論會,全體代表對標準進行較為詳細的討論,

會上主要討論的內容分為如下三個板塊:

1.對上一版草案反饋的意見處理情況進行溝通并確定處理方案;

2.對各單位會上提出的問題和建議進行討論并確定修改方向。會后需修改的主

要內容如下:

1)首頁封面中英文需保持一致;

2)范圍:規(guī)定了接口的具體內容盡量補充完整;

3)縮略語如果定義,關鍵詞替換為縮略詞;

4)圖1的大箭頭改為雙向箭頭;

5)類似中的角標存在使用不規(guī)范問題,建議參考國標1.1,修

改描述方式;

6)建議把要求內容寫細致便于落地;

7)建議建立標準討論群便于溝通;

3、標委會秘書處協(xié)助起草組明確后續(xù)工作計劃。具體安排如下:

1)牽頭單位需做好過程文件的準備和管理。本次會議紀要以及標準草

案郵件發(fā)出給起草組各參編單位;

2)標準各參編單位請將處理意見于9月8號之前反饋至牽頭單位郵箱

(yangyangyf1@)并抄送給標委

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論