信息技術(shù) 人工智能 小樣本機(jī)器學(xué)習(xí)樣本量和算法要求_第1頁
信息技術(shù) 人工智能 小樣本機(jī)器學(xué)習(xí)樣本量和算法要求_第2頁
信息技術(shù) 人工智能 小樣本機(jī)器學(xué)習(xí)樣本量和算法要求_第3頁
信息技術(shù) 人工智能 小樣本機(jī)器學(xué)習(xí)樣本量和算法要求_第4頁
信息技術(shù) 人工智能 小樣本機(jī)器學(xué)習(xí)樣本量和算法要求_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

ICS35.240在提交反饋意見時(shí),請(qǐng)將您知道的相關(guān)專利連同

L70支持性文件一并附上

團(tuán)體標(biāo)準(zhǔn)

T/CESAXXXX—XXXX

信息技術(shù)人工智能小樣本機(jī)器學(xué)習(xí)樣本

量和算法要求

Informationtechnology-Artificialintelligence-Samplesizeandalgorithm

requirementsforfew-shotlearning

(征求意見稿)

XXXX-XX-XX發(fā)布XXXX-XX-XX實(shí)施

中國電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)發(fā)布

T/XXXXXXXX—XXXX

前??言

本標(biāo)準(zhǔn)按照GB/T1.1-2009給出的規(guī)則起草。

請(qǐng)注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機(jī)構(gòu)不承擔(dān)識(shí)別這些專利的責(zé)任。

本標(biāo)準(zhǔn)由中國電子技術(shù)標(biāo)準(zhǔn)化研究院提出并歸口。

本標(biāo)準(zhǔn)起草單位:

本標(biāo)準(zhǔn)主要起草人:

II

T/XXXXXXXX—XXXX

信息技術(shù)人工智能小樣本機(jī)器學(xué)習(xí)樣本量和算法要求

1范圍

本標(biāo)準(zhǔn)規(guī)定了小樣本機(jī)器學(xué)習(xí)算法在不同場(chǎng)景情況下的樣本量及算法的要求。

本標(biāo)準(zhǔn)適用于小樣本量機(jī)器學(xué)習(xí)相關(guān)產(chǎn)品。

2規(guī)范性引用文件

下列文件對(duì)于本文件的應(yīng)用是必不可少的。凡是注日期的引用文件,僅所注日期的版本適用于本文

件。凡是不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。

ISO3534-1:2006統(tǒng)計(jì)學(xué)詞匯及符號(hào)第1部分:一般統(tǒng)計(jì)術(shù)語與用于概率的術(shù)語(Statistics--

Vocabularyandsymbols--Part1:Generalstatisticaltermsandtermsusedinprobability)

3術(shù)語和定義

下列術(shù)語和定義適用于本文件。

3.1

樣本量samplesize

樣本中包含的個(gè)體(或抽樣單元)的數(shù)目。

[ISO3534-1:2006,定義3.7]

3.2

小樣本smallsample

數(shù)量較少或不足的樣本量。

3.3

小樣本機(jī)器學(xué)習(xí)few-shotlearning

樣本數(shù)據(jù)量較少或不足情況下的機(jī)器學(xué)習(xí)。

4縮略語

以下縮略語適用于本文件。

AP:平均精確率(AveragePrecision)

AUC:ROC曲線覆蓋區(qū)域面積(AreaUnderCurveROC)

mAP:平均精確率均值(MeanAveragePrecision)

MOS:平均主觀意見得分(MeanOpinionScore)

ROC曲線:接受者操作特性曲線(ReceiverOperatingCharacteristicCurve)

1

T/XXXXXXXX—XXXX

5小樣本機(jī)器學(xué)習(xí)樣本量和算法要求

5.1算法要求描述項(xiàng)

算法要求包含評(píng)價(jià)要素、指標(biāo)屬性、量化方法和量化范圍四個(gè)部分,含義分別為:

a)評(píng)價(jià)要素:每個(gè)評(píng)價(jià)指標(biāo)項(xiàng)的具體評(píng)價(jià)內(nèi)容和要求;

b)指標(biāo)屬性:每個(gè)評(píng)價(jià)指標(biāo)的屬性為“定性指標(biāo)”和“定量指標(biāo)”之一;

c)量化方法:每個(gè)評(píng)價(jià)指標(biāo)的量化方法;

d)量化范圍:每個(gè)評(píng)價(jià)指標(biāo)的取值范圍。

5.2算法要求量化方法

5.2.1精確率/查準(zhǔn)率

精確率是被模型預(yù)測(cè)為正的正樣本(真正例)占預(yù)測(cè)為正的樣本的比例。精確率見式(1)。

TP

P...............................................................................(1)

TPFP

式中:

P——精確率/查準(zhǔn)率;

TP——被判定為正樣例,實(shí)際為正樣例數(shù)目;

FP——被判定為正樣例,實(shí)際為負(fù)樣例數(shù)目。

5.2.2交叉精確率

交叉精確率是多次交叉抽樣計(jì)算的精確率的平均值。交叉精確率見式(2)。

kP

crossPseti............................................................................(2)

ik

式中:

crossP——交叉精確率;

P——第i次測(cè)試樣本隨機(jī)抽樣子集合的精確率;

seti

k——抽樣次數(shù)。

5.2.3召回率/查全率

召回率是被模型預(yù)測(cè)為正的正樣本(真正例)占實(shí)際正樣本的比例。召回率見式(3)。

TP

R...............................................................................(3)

TPFN

式中:

R——召回率/查全率;

TP——被判定為正樣例,實(shí)際為正樣例數(shù)目;

FN——被判定為負(fù)樣例,實(shí)際為正樣例數(shù)目。

5.2.4交叉召回率

交叉召回率是多次交叉抽樣得到的召回率的平均值。交叉召回率見式(4)。

kR

crossRseti...........................................................................(4)

ik

式中:

2

T/XXXXXXXX—XXXX

crossR——交叉召回率;

R——第i次測(cè)試樣本隨機(jī)抽樣子集合的召回率;

seti

k——抽樣次數(shù)。

5.2.5準(zhǔn)確率/正確率

準(zhǔn)確率是模型預(yù)測(cè)正確的結(jié)果占所有分類結(jié)果的比例。準(zhǔn)確率/正確率見式(5)。

TPTN

A.....................................................................(5)

TPTNFPFN

式中:

A——準(zhǔn)確率/正確率;

TP——被判定為正樣例,實(shí)際為正樣例數(shù)目;

TN——被判定為負(fù)樣例,實(shí)際為負(fù)樣例數(shù)目;

FP——被判定為正樣例,實(shí)際為負(fù)樣例數(shù)目;

FN——被判定為負(fù)樣例,實(shí)際為正樣例數(shù)目。

5.2.6交叉準(zhǔn)確率

交叉準(zhǔn)確率是多次交叉抽樣得到的準(zhǔn)確率的平均值。交叉準(zhǔn)確率見式(6)。

kA

crossAseti............................................................................(6)

ik

式中:

crossA——交叉準(zhǔn)確率;

A——第i次測(cè)試樣本隨機(jī)抽樣子集合的準(zhǔn)確率;

seti

k——抽樣次數(shù)。

5.2.7F值

F值是精確率和召回率的加權(quán)調(diào)和平均值,表達(dá)對(duì)精確率/召回率的不同偏好。F值見式(7)。

21PR

F.........................................................................(7)

2PR

式中:

——調(diào)和因子;

P——精確率;

R——召回率。

5.2.8交叉F值

交叉F值是多次交叉抽樣得到的F值的平均值。交叉F值見式(8)。

kF

crossFseti...........................................................................(8)

ik

式中:

crossF——交叉F值;

F——第i次測(cè)試樣本隨機(jī)抽樣子集合的F值;

seti

k——抽樣次數(shù)。

3

T/XXXXXXXX—XXXX

5.2.9接受者操作特性曲線

接受者操作特性曲線是根據(jù)預(yù)測(cè)結(jié)果對(duì)樣例進(jìn)行排序,按順序逐個(gè)把樣例作為正例進(jìn)行預(yù)測(cè),每次

計(jì)算出假正率和真正率,分別以它們?yōu)闄M縱坐標(biāo)作ROC曲線圖。橫縱坐標(biāo)見式(9)、式(10)。

FP

FPR............................................................................(9)

TNFP

TP

TPR..........................................................................(10)

TPFN

式中:

FPR——假正率;

TPR——真正率;

FP——被判定為正樣例,實(shí)際為負(fù)樣例數(shù)目;

TN——被判定為負(fù)樣例,實(shí)際為負(fù)樣例數(shù)目;

TP——被判定為正樣例,實(shí)際為正樣例數(shù)目;

FN——被判定為負(fù)樣例,實(shí)際為正樣例數(shù)目。

5.2.10ROC曲線覆蓋區(qū)域面積

AUC通過對(duì)ROC曲線下各部分求和得到,比較AUC大小是判斷模型優(yōu)劣的標(biāo)準(zhǔn)之一。

5.2.11平均精確率

根據(jù)預(yù)測(cè)結(jié)果對(duì)樣例進(jìn)行排序,按順序逐個(gè)將樣例作為正例進(jìn)行預(yù)測(cè),每次計(jì)算當(dāng)前的精確率和召

回率,最終計(jì)算精確率的平均值。以召回率為橫軸,精確率為縱軸作曲線。平均精確率就是精確率-召

回率曲線下的面積。

5.2.12交叉平均精確率

測(cè)試樣本中多次交叉抽樣子集合的平均精確率的均值。交叉平均精確率見式(11)。

kAP

crossAPseti.......................................................................(11)

ik

式中:

crossAP——交叉平均精確率;

AP——第i次測(cè)試樣本隨機(jī)抽樣子集合的AP值;

seti

k——抽樣次數(shù)。

5.2.13平均精確率均值

各類別平均精確率的均值。平均精確率均值見式(12)。

n

APi

mAPi1..........................................................................(12)

n

式中:

mAP——平均精確率均值;

第類樣本的平均精確率;

APi——i

n——樣本的總類別數(shù)。

5.2.14交叉平均精確率均值

測(cè)試樣本中多次交叉抽樣子集合的mAP的均值。交叉平均精確率均值見式(13)。

4

T/XXXXXXXX—XXXX

kmAP

crossmAPseti....................................................................(13)

ik

式中:

crossmAP——交叉平均精確率均值;

mAP——第i次測(cè)試樣本隨機(jī)抽樣子集合的mAP值;

seti

k——抽樣次數(shù)。

5.2.15目標(biāo)身份匹配錯(cuò)次數(shù)

同一個(gè)目標(biāo)在上一幀和當(dāng)前幀匹配的身份號(hào)不一致,視為身份號(hào)匹配錯(cuò)一次。

5.2.16目標(biāo)身份重復(fù)次數(shù)

跟蹤過程中,一個(gè)目標(biāo)匹配出的身份總數(shù)量。

5.2.17跟蹤穩(wěn)定率

衡量目標(biāo)跟蹤準(zhǔn)確程度,結(jié)合誤檢數(shù)量,漏檢數(shù)量,匹配錯(cuò)次數(shù),給出整體跟蹤性能的度量。跟蹤穩(wěn)

定率見式(14)。

i

dt

TPi,t.............................................................................(14)

c

tt

式中:

TP——跟蹤穩(wěn)定率;

t——幀圖像序列號(hào);

i——跟蹤算法輸出的單目標(biāo)框;

i時(shí)刻算法輸出的第個(gè)目標(biāo)框與目標(biāo)框標(biāo)簽的誤差;

dt——ti

時(shí)刻算法輸出結(jié)果和標(biāo)簽匹配上的目標(biāo)框數(shù)量。

ct——t

5.2.18跟蹤準(zhǔn)確率

衡量目標(biāo)跟蹤穩(wěn)定程度,描述了目標(biāo)被精確跟蹤的程度,并通過邊界框重疊和邊界框間的距離度量。

跟蹤準(zhǔn)確率見式(15)。

mtfptmmet

TA1t.............................................................(15)

g

tt

式中:

TA——跟蹤準(zhǔn)確率;

t——幀圖像序列號(hào);

時(shí)刻標(biāo)簽中未被匹配的目標(biāo)個(gè)數(shù);

mt——t

時(shí)刻誤檢數(shù)量;

fpt——t

時(shí)刻匹配錯(cuò)次數(shù);

mmet——t

時(shí)刻目標(biāo)框標(biāo)簽的數(shù)量。

gt——t

5

T/XXXXXXXX—XXXX

5.2.19交并比

目標(biāo)檢測(cè)中,產(chǎn)生的候選框與原標(biāo)記框的交疊率。交并比見式(16)。

areaCareaG

IOU...............................................................(16)

areaCareaG

式中:

IOU——交并比;

areaC——候選框區(qū)域面積;

areaG——原標(biāo)記框區(qū)域面積。

5.2.20交叉熵

用于度量?jī)蓚€(gè)概率分布間的差異性信息。交叉熵見式(17)。

n

Hp,qpxlogqx...........................................................(17)

i1ii

式中:

Hp,q——交叉熵;

的真實(shí)概率分布;

pxi——xi

的預(yù)測(cè)概率分布;

qxi——xi

n——測(cè)試集的大小。

5.2.21均方誤差

觀測(cè)值與真值之差的平方的期望值。均方誤差見式(18)。

2

n

Xbos,iXmodel,i

MSEi1.............................................................(18)

n

式中:

MSE——均方誤差;

第次的觀測(cè)值;

Xbos,i——

第次的真值;

Xmodel,i——

n——觀測(cè)