




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
ICS35.240CCSL70團(tuán)體標(biāo)準(zhǔn)Applicationofartificialintelligencechip—Technicalrequirementstosystemof中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)發(fā)布IT/CESA1150—2021版權(quán)保護(hù)文件版權(quán)所有歸屬于該標(biāo)準(zhǔn)的發(fā)布機(jī)構(gòu),除非有其他規(guī)定,否則未經(jīng)許可,此發(fā)行物及其章節(jié)不得以其他形式或任何手段進(jìn)行復(fù)制、再版或使用,包括電子版,影印件,或發(fā)布在互聯(lián)網(wǎng)及內(nèi)部網(wǎng)絡(luò)等。使用許可可于發(fā)布機(jī)構(gòu)獲取。T/CESA1150—2021前言 2規(guī)范性引用文件 3術(shù)語和定義 4總體功能 5輸入和輸出 26服務(wù)接口 37功能模塊 58性能指標(biāo) 5參考文獻(xiàn) T/CESA1150—2021本文件按照GB/T1.1—2020《標(biāo)準(zhǔn)化工作導(dǎo)則第1部分:標(biāo)準(zhǔn)化文件的結(jié)構(gòu)和起草規(guī)則》的規(guī)定起請(qǐng)注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機(jī)構(gòu)不承擔(dān)識(shí)別這些專利的責(zé)任。本文件由中國(guó)科學(xué)院計(jì)算技術(shù)研究所提出。本文件由中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)歸口。本文件起草單位:中國(guó)科學(xué)院計(jì)算技術(shù)研究所、中國(guó)盲文出版社、中科寒武紀(jì)科技股份有限公司、浙江大學(xué)。本文件主要起草人:王向東、劉宏、王艷萍、李威、卜佳俊、錢躍良、周瑋琪、胡晨希、惲超、劉俊英、王煒、周晟。1T/CESA1150—2021人工智能芯片應(yīng)用面向漢盲翻譯系統(tǒng)的技術(shù)要求本文件規(guī)定了在人工智能芯片應(yīng)用方面,面向漢盲翻譯系統(tǒng)的技術(shù)要求,包括輸入/輸出、服務(wù)接口、功能模塊設(shè)置、性能指標(biāo)等方面的要求。本文件適用于在智能芯片上進(jìn)行漢盲翻譯系統(tǒng)的部署、檢驗(yàn)及應(yīng)用。2規(guī)范性引用文件下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,僅該日期對(duì)應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。GB/T15720-2008中國(guó)盲文GB/T38640-2020盲用數(shù)字出版格式GF0019-2018國(guó)家通用盲文方案3術(shù)語和定義下列術(shù)語和定義適用于本文件。3.1機(jī)器學(xué)習(xí)machinelearning功能單元通過獲取新知識(shí)或技能,或通過整理已有的知識(shí)或技能來改進(jìn)其性能的過程。[來源:GB/T5271.31-2006,術(shù)語和定義31.01.02]3.2漢盲翻譯Chinese-Brailletranslation將漢字文本轉(zhuǎn)換為對(duì)應(yīng)的漢語盲文文本。3.3電子盲文electronicBraille以數(shù)字形式存儲(chǔ)的盲文內(nèi)容。2T/CESA1150—2021[GB/T38640-2020,術(shù)語和定義3.2]4總體功能4.1核心功能漢盲翻譯系統(tǒng)應(yīng)至少具備將輸入的漢字文本翻譯為對(duì)應(yīng)的漢語盲文文本的核心功能。基于智能芯片的漢盲翻譯系統(tǒng)宜充分利用智能芯片運(yùn)行人工智能和機(jī)器學(xué)習(xí)模型,以實(shí)現(xiàn)高效的漢盲翻譯。4.2漢語盲文方案漢盲翻譯系統(tǒng)所處理的漢語盲文應(yīng)符合GB/T15720-2008、GF0019-2018。4.3輸入輸出形式以輸入和輸出的形式來劃分,基于智能芯片的漢盲翻譯系統(tǒng)可以兩種方式提供漢盲翻譯服務(wù):文件翻譯和字符串翻譯。文件翻譯是指輸入一個(gè)漢字文本文件,返回一個(gè)與之相應(yīng)的盲文文本文件。字符串翻譯是指輸入一個(gè)漢字字符串,返回一個(gè)與之相應(yīng)的盲文字符串。4.4服務(wù)方式及接口以提供服務(wù)的方式和接口來劃分,基于智能芯片的漢盲翻譯系統(tǒng)可以兩種方式提供漢盲翻譯服務(wù):網(wǎng)絡(luò)服務(wù)和本地服務(wù)。網(wǎng)絡(luò)服務(wù)是指基于網(wǎng)絡(luò)通信接口提供服務(wù)。本地服務(wù)是指基于本機(jī)的進(jìn)程/線程/模塊間的通信接口提供服務(wù)。5輸入和輸出5.1文件翻譯5.1.1輸入文件輸入的文件應(yīng)支持常用的文本文件格式,包括txt格式、word格式(doc或docx)、pdf格式。對(duì)于包含格式和非文本內(nèi)容的文件格式,如word格式和pdf格式,應(yīng)至少可提取其中的所有標(biāo)題和正文文本作為翻譯的輸入。根據(jù)需要,輸入文件中的文本應(yīng)包含所需的非漢字字符,如標(biāo)點(diǎn)符號(hào)、英文字母、阿拉伯?dāng)?shù)字符號(hào)及其它可能用到的符號(hào),而非只由漢字字符構(gòu)成。5.1.2輸出文件3T/CESA1150—2021輸出的文件應(yīng)符合GB/T38640-2020中電子盲文的格式要求??刹捎脴?biāo)準(zhǔn)中定義的XML格式,DBO格式或其它符合標(biāo)準(zhǔn)的格式。5.2字符串翻譯5.2.1輸入字符串輸入字符串應(yīng)采用UTF-8編碼。一般為一個(gè)漢語句子。字符數(shù)不超過128。根據(jù)需要,輸入字符串應(yīng)包含所需的非漢字字符,如標(biāo)點(diǎn)符號(hào)、英文字母、阿拉伯?dāng)?shù)字符號(hào)及其它可能用到的符號(hào),而非只由漢字字符構(gòu)成。5.2.2輸出字符串輸出字符串應(yīng)遵循常用的盲文編碼規(guī)范,包括Unicode編碼和ASCII編碼。6服務(wù)接口6.1網(wǎng)絡(luò)服務(wù)網(wǎng)絡(luò)服務(wù)采用網(wǎng)絡(luò)服務(wù)接口,可基于socket接口或http服務(wù)。6.2本地服務(wù)本地服務(wù)除可采用運(yùn)行于本地的網(wǎng)絡(luò)接口外,也可采用本地接口。如作為SDK,以函數(shù)形式提供接6.3具體服務(wù)接口6.3.1應(yīng)具備的服務(wù)接口一個(gè)用于向上層應(yīng)用提供服務(wù)的漢盲翻譯系統(tǒng)至少應(yīng)具備如下的服務(wù)接口:任務(wù)創(chuàng)建接口、任務(wù)狀態(tài)查詢接口、翻譯結(jié)果獲取接口、翻譯任務(wù)取消接口。6.3.2文件翻譯任務(wù)創(chuàng)建接口調(diào)用此接口創(chuàng)建文件翻譯任務(wù),并在漢盲翻譯服務(wù)器或本地進(jìn)行翻譯。接口的輸入、輸出參數(shù)見表1。4T/CESA1150—2021表1文件翻譯任務(wù)創(chuàng)建接口參數(shù)定義參數(shù)名描述類型輸入/輸出input_file要翻譯的文件名字符串輸入?yún)?shù)braille_type要翻譯的盲文類型,1為現(xiàn)行盲文,2為通用盲文,3為雙拼盲文整數(shù)輸入?yún)?shù)task_id翻譯任務(wù)標(biāo)識(shí)符(ID)整數(shù)輸出參數(shù)6.3.3字符串翻譯任務(wù)創(chuàng)建接口調(diào)用此接口創(chuàng)建字符串翻譯任務(wù),并在漢盲翻譯服務(wù)器或本地進(jìn)行翻譯。接口的輸入、輸出參數(shù)見表2。參數(shù)名描述類型輸入?yún)?shù)名描述類型輸入/輸出input_string要翻譯的字符串字符串輸入?yún)?shù)braille_type要翻譯的盲文類型,1為現(xiàn)行盲文,2為通用盲文,3為雙拼盲文整數(shù)輸入?yún)?shù)task_id翻譯任務(wù)標(biāo)識(shí)符(ID)整數(shù)輸出參數(shù)6.3.4任務(wù)狀態(tài)查詢接口調(diào)用此接口查詢翻譯任務(wù)狀態(tài)。此接口適用于文件翻譯和字符串翻譯。接口輸入、輸出參數(shù)見表3。表3任務(wù)查詢接口參數(shù)定義參數(shù)名描述類型輸入/輸出task_id要查詢的任務(wù)標(biāo)識(shí)符(ID)整數(shù)輸入?yún)?shù)task_status任務(wù)狀態(tài),Y表示轉(zhuǎn)換完成,W表示正在執(zhí)行,N表示任務(wù)尚未開始字符串輸出參數(shù)表2字符串翻譯任務(wù)創(chuàng)建接口參數(shù)定義6.3.5文件翻譯結(jié)果獲取接口調(diào)用此接口獲取文件翻譯結(jié)果。輸入、輸出參數(shù)見表4。表4文件翻譯結(jié)果獲取接口參數(shù)定義參數(shù)名描述類型輸入/輸出task_id要獲取結(jié)果的翻譯任務(wù)標(biāo)識(shí)符(ID)整數(shù)輸入?yún)?shù)result_url翻譯結(jié)果文件的URL字符串輸出參數(shù)6.3.6字符串翻譯結(jié)果獲取接口5T/CESA1150—2021調(diào)用此接口獲取字符串翻譯結(jié)果。輸入、輸出參數(shù)見表5。表5字符串翻譯結(jié)果獲取接口參數(shù)定義參數(shù)名描述類型輸入/輸出task_id要獲取結(jié)果的翻譯任務(wù)標(biāo)識(shí)符(ID)整數(shù)輸入?yún)?shù)result_string翻譯結(jié)果字符串字符串輸出參數(shù)6.3.7翻譯任務(wù)取消接口調(diào)用此任務(wù)取消翻譯任務(wù)。此接口適用于文件翻譯和字符串翻譯。輸入、輸出參數(shù)見表6。表6翻譯任務(wù)取消接口參數(shù)定義參數(shù)名描述類型輸入/輸出task_id要取消的翻譯任務(wù)標(biāo)識(shí)(ID)整數(shù)輸入?yún)?shù)state是否成功取消,true為成功,false為失敗輸出參數(shù)7功能模塊7.1模塊劃分基于智能芯片的漢盲翻譯系統(tǒng),應(yīng)將機(jī)器學(xué)習(xí)模型與程序獨(dú)立?;谥悄苄酒臐h盲翻譯系統(tǒng),應(yīng)至少劃分為接口響應(yīng)模塊、機(jī)器學(xué)習(xí)模型加載模塊、翻譯模塊。接口響應(yīng)模塊負(fù)責(zé)響應(yīng)各種接口請(qǐng)求,接收相應(yīng)的輸入,調(diào)用內(nèi)部功能實(shí)現(xiàn),并在需要時(shí)返回相應(yīng)輸出。機(jī)器學(xué)習(xí)模型加載模塊負(fù)責(zé)一次性將外部存儲(chǔ)(硬盤)中的機(jī)器學(xué)習(xí)模型文件加載至內(nèi)存;翻譯模塊負(fù)責(zé)使用加載的機(jī)器學(xué)習(xí)模型執(zhí)行翻譯任務(wù)。在模型加載后,執(zhí)行每次翻譯任務(wù)時(shí)無需再次加載模型。7.2翻譯模塊采用智能芯片時(shí),翻譯模塊應(yīng)盡可能采用智能芯片運(yùn)算。機(jī)器學(xué)習(xí)模型應(yīng)盡可能加載至智能芯片。8性能指標(biāo)8.1翻譯準(zhǔn)確率指標(biāo)自動(dòng)翻譯完成后,將翻譯結(jié)果與標(biāo)準(zhǔn)答案進(jìn)行比對(duì),計(jì)算相關(guān)的翻譯準(zhǔn)確率指標(biāo)。對(duì)于標(biāo)準(zhǔn)答案中的某個(gè)盲文詞,當(dāng)在不考慮讀音的情況下,該盲文詞與翻譯結(jié)果中對(duì)應(yīng)的盲文詞一致,即對(duì)應(yīng)相同的漢字串時(shí),認(rèn)為該盲文詞分詞正確;當(dāng)該盲文詞與翻譯結(jié)果中對(duì)應(yīng)的盲文詞完全一致時(shí),認(rèn)為該盲文詞完全正確。按下面的兩個(gè)式子計(jì)算盲文分詞準(zhǔn)確率和盲文詞翻譯準(zhǔn)確率。盲文分詞準(zhǔn)確率=分詞正確的盲文詞數(shù)/標(biāo)準(zhǔn)答案中盲文詞總數(shù).(1)6T/CESA1150—2021盲文詞翻譯準(zhǔn)確率=完全正確的盲文詞數(shù)/標(biāo)準(zhǔn)答案中盲文詞總數(shù) 對(duì)于標(biāo)準(zhǔn)答案中的某個(gè)盲文音節(jié),當(dāng)翻譯結(jié)果中的對(duì)應(yīng)音節(jié)與之完全相同時(shí),認(rèn)為該音節(jié)讀音標(biāo)注正確。按下面的式子計(jì)算讀音標(biāo)注準(zhǔn)確率。讀音標(biāo)注準(zhǔn)確率=讀音標(biāo)注正確的音節(jié)數(shù)/標(biāo)準(zhǔn)答案中的音節(jié)總數(shù) 8.2時(shí)間效率指標(biāo)翻譯時(shí)間:從開始翻譯到結(jié)束翻譯的時(shí)間。響應(yīng)時(shí)間:從接收到翻譯任務(wù)到返回結(jié)果的時(shí)間。平均每秒翻譯字?jǐn)?shù):平均每秒翻譯的字?jǐn)?shù)。8.3測(cè)試和性能指標(biāo)要求測(cè)試時(shí),應(yīng)按照具體的漢盲翻譯系統(tǒng)實(shí)際應(yīng)用時(shí)的真實(shí)場(chǎng)景,包括所處理的漢字文本的領(lǐng)域、主題等,設(shè)計(jì)測(cè)試數(shù)據(jù)。測(cè)試數(shù)據(jù)應(yīng)盡可能的多樣化,如來源于不同的書籍或資料。測(cè)試數(shù)據(jù)規(guī)模一般應(yīng)不
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中秋節(jié)創(chuàng)意活動(dòng)策劃方案模板
- 2025年度體育課題工作方案
- 水泥業(yè)務(wù)員工作方案演講稿2025年
- 汽車使用與維護(hù) 課件 項(xiàng)目四 傳動(dòng)系統(tǒng)的使用與維護(hù)4-2 驅(qū)動(dòng)軸的檢查與維護(hù)
- 2025年電子測(cè)試儀表項(xiàng)目可行性研究報(bào)告
- 2025年電動(dòng)平行修整器項(xiàng)目可行性研究報(bào)告
- 2025年琥珀蜂蜜核桃仁項(xiàng)目可行性研究報(bào)告
- 2025年玳瑁指甲項(xiàng)目可行性研究報(bào)告
- 2025年特大雙色名流口杯項(xiàng)目可行性研究報(bào)告
- 西安海棠職業(yè)學(xué)院《色彩造型2(風(fēng)景)》2023-2024學(xué)年第二學(xué)期期末試卷
- 圖書館讀者服務(wù)課件
- 山西省太原市尖草坪區(qū)第一中學(xué)高三數(shù)學(xué)理月考試卷含解析
- 工程安全檢查記錄表
- 我與地壇讀書分享
- 中石油職稱考試俄語選讀第01-27課
- 學(xué)校宗教排查報(bào)告(6篇)
- 新鄉(xiāng)縣恒新熱力有限公司集中供熱項(xiàng)目二期工程變更項(xiàng)目環(huán)境影響報(bào)告
- A3報(bào)告解析課件
- “越……越……”“越來越……”課件
- 小學(xué)生必背古詩(shī)75首+80首(精排+目錄)
- 精密測(cè)量技術(shù)課后答案
評(píng)論
0/150
提交評(píng)論