版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
ICS35.240在提交反饋意見時(shí),請(qǐng)將您知道的相關(guān)專利連同
L70支持性文件一并附上
團(tuán)體標(biāo)準(zhǔn)
T/CESAXXXX—XXXX
信息技術(shù)人工智能小樣本機(jī)器學(xué)習(xí)樣本
量和算法要求
Informationtechnology-Artificialintelligence-Samplesizeandalgorithm
requirementsforfew-shotlearning
(征求意見稿)
XXXX-XX-XX發(fā)布XXXX-XX-XX實(shí)施
中國電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)發(fā)布
T/XXXXXXXX—XXXX
前??言
本標(biāo)準(zhǔn)按照GB/T1.1-2009給出的規(guī)則起草。
請(qǐng)注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機(jī)構(gòu)不承擔(dān)識(shí)別這些專利的責(zé)任。
本標(biāo)準(zhǔn)由中國電子技術(shù)標(biāo)準(zhǔn)化研究院提出并歸口。
本標(biāo)準(zhǔn)起草單位:
本標(biāo)準(zhǔn)主要起草人:
II
T/XXXXXXXX—XXXX
信息技術(shù)人工智能小樣本機(jī)器學(xué)習(xí)樣本量和算法要求
1范圍
本標(biāo)準(zhǔn)規(guī)定了小樣本機(jī)器學(xué)習(xí)算法在不同場(chǎng)景情況下的樣本量及算法的要求。
本標(biāo)準(zhǔn)適用于小樣本量機(jī)器學(xué)習(xí)相關(guān)產(chǎn)品。
2規(guī)范性引用文件
下列文件對(duì)于本文件的應(yīng)用是必不可少的。凡是注日期的引用文件,僅所注日期的版本適用于本文
件。凡是不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。
ISO3534-1:2006統(tǒng)計(jì)學(xué)詞匯及符號(hào)第1部分:一般統(tǒng)計(jì)術(shù)語與用于概率的術(shù)語(Statistics--
Vocabularyandsymbols--Part1:Generalstatisticaltermsandtermsusedinprobability)
3術(shù)語和定義
下列術(shù)語和定義適用于本文件。
3.1
樣本量samplesize
樣本中包含的個(gè)體(或抽樣單元)的數(shù)目。
[ISO3534-1:2006,定義3.7]
3.2
小樣本smallsample
數(shù)量較少或不足的樣本量。
3.3
小樣本機(jī)器學(xué)習(xí)few-shotlearning
樣本數(shù)據(jù)量較少或不足情況下的機(jī)器學(xué)習(xí)。
4縮略語
以下縮略語適用于本文件。
AP:平均精確率(AveragePrecision)
AUC:ROC曲線覆蓋區(qū)域面積(AreaUnderCurveROC)
mAP:平均精確率均值(MeanAveragePrecision)
MOS:平均主觀意見得分(MeanOpinionScore)
ROC曲線:接受者操作特性曲線(ReceiverOperatingCharacteristicCurve)
1
T/XXXXXXXX—XXXX
5小樣本機(jī)器學(xué)習(xí)樣本量和算法要求
5.1算法要求描述項(xiàng)
算法要求包含評(píng)價(jià)要素、指標(biāo)屬性、量化方法和量化范圍四個(gè)部分,含義分別為:
a)評(píng)價(jià)要素:每個(gè)評(píng)價(jià)指標(biāo)項(xiàng)的具體評(píng)價(jià)內(nèi)容和要求;
b)指標(biāo)屬性:每個(gè)評(píng)價(jià)指標(biāo)的屬性為“定性指標(biāo)”和“定量指標(biāo)”之一;
c)量化方法:每個(gè)評(píng)價(jià)指標(biāo)的量化方法;
d)量化范圍:每個(gè)評(píng)價(jià)指標(biāo)的取值范圍。
5.2算法要求量化方法
5.2.1精確率/查準(zhǔn)率
精確率是被模型預(yù)測(cè)為正的正樣本(真正例)占預(yù)測(cè)為正的樣本的比例。精確率見式(1)。
TP
P...............................................................................(1)
TPFP
式中:
P——精確率/查準(zhǔn)率;
TP——被判定為正樣例,實(shí)際為正樣例數(shù)目;
FP——被判定為正樣例,實(shí)際為負(fù)樣例數(shù)目。
5.2.2交叉精確率
交叉精確率是多次交叉抽樣計(jì)算的精確率的平均值。交叉精確率見式(2)。
kP
crossPseti............................................................................(2)
ik
式中:
crossP——交叉精確率;
P——第i次測(cè)試樣本隨機(jī)抽樣子集合的精確率;
seti
k——抽樣次數(shù)。
5.2.3召回率/查全率
召回率是被模型預(yù)測(cè)為正的正樣本(真正例)占實(shí)際正樣本的比例。召回率見式(3)。
TP
R...............................................................................(3)
TPFN
式中:
R——召回率/查全率;
TP——被判定為正樣例,實(shí)際為正樣例數(shù)目;
FN——被判定為負(fù)樣例,實(shí)際為正樣例數(shù)目。
5.2.4交叉召回率
交叉召回率是多次交叉抽樣得到的召回率的平均值。交叉召回率見式(4)。
kR
crossRseti...........................................................................(4)
ik
式中:
2
T/XXXXXXXX—XXXX
crossR——交叉召回率;
R——第i次測(cè)試樣本隨機(jī)抽樣子集合的召回率;
seti
k——抽樣次數(shù)。
5.2.5準(zhǔn)確率/正確率
準(zhǔn)確率是模型預(yù)測(cè)正確的結(jié)果占所有分類結(jié)果的比例。準(zhǔn)確率/正確率見式(5)。
TPTN
A.....................................................................(5)
TPTNFPFN
式中:
A——準(zhǔn)確率/正確率;
TP——被判定為正樣例,實(shí)際為正樣例數(shù)目;
TN——被判定為負(fù)樣例,實(shí)際為負(fù)樣例數(shù)目;
FP——被判定為正樣例,實(shí)際為負(fù)樣例數(shù)目;
FN——被判定為負(fù)樣例,實(shí)際為正樣例數(shù)目。
5.2.6交叉準(zhǔn)確率
交叉準(zhǔn)確率是多次交叉抽樣得到的準(zhǔn)確率的平均值。交叉準(zhǔn)確率見式(6)。
kA
crossAseti............................................................................(6)
ik
式中:
crossA——交叉準(zhǔn)確率;
A——第i次測(cè)試樣本隨機(jī)抽樣子集合的準(zhǔn)確率;
seti
k——抽樣次數(shù)。
5.2.7F值
F值是精確率和召回率的加權(quán)調(diào)和平均值,表達(dá)對(duì)精確率/召回率的不同偏好。F值見式(7)。
21PR
F.........................................................................(7)
2PR
式中:
——調(diào)和因子;
P——精確率;
R——召回率。
5.2.8交叉F值
交叉F值是多次交叉抽樣得到的F值的平均值。交叉F值見式(8)。
kF
crossFseti...........................................................................(8)
ik
式中:
crossF——交叉F值;
F——第i次測(cè)試樣本隨機(jī)抽樣子集合的F值;
seti
k——抽樣次數(shù)。
3
T/XXXXXXXX—XXXX
5.2.9接受者操作特性曲線
接受者操作特性曲線是根據(jù)預(yù)測(cè)結(jié)果對(duì)樣例進(jìn)行排序,按順序逐個(gè)把樣例作為正例進(jìn)行預(yù)測(cè),每次
計(jì)算出假正率和真正率,分別以它們?yōu)闄M縱坐標(biāo)作ROC曲線圖。橫縱坐標(biāo)見式(9)、式(10)。
FP
FPR............................................................................(9)
TNFP
TP
TPR..........................................................................(10)
TPFN
式中:
FPR——假正率;
TPR——真正率;
FP——被判定為正樣例,實(shí)際為負(fù)樣例數(shù)目;
TN——被判定為負(fù)樣例,實(shí)際為負(fù)樣例數(shù)目;
TP——被判定為正樣例,實(shí)際為正樣例數(shù)目;
FN——被判定為負(fù)樣例,實(shí)際為正樣例數(shù)目。
5.2.10ROC曲線覆蓋區(qū)域面積
AUC通過對(duì)ROC曲線下各部分求和得到,比較AUC大小是判斷模型優(yōu)劣的標(biāo)準(zhǔn)之一。
5.2.11平均精確率
根據(jù)預(yù)測(cè)結(jié)果對(duì)樣例進(jìn)行排序,按順序逐個(gè)將樣例作為正例進(jìn)行預(yù)測(cè),每次計(jì)算當(dāng)前的精確率和召
回率,最終計(jì)算精確率的平均值。以召回率為橫軸,精確率為縱軸作曲線。平均精確率就是精確率-召
回率曲線下的面積。
5.2.12交叉平均精確率
測(cè)試樣本中多次交叉抽樣子集合的平均精確率的均值。交叉平均精確率見式(11)。
kAP
crossAPseti.......................................................................(11)
ik
式中:
crossAP——交叉平均精確率;
AP——第i次測(cè)試樣本隨機(jī)抽樣子集合的AP值;
seti
k——抽樣次數(shù)。
5.2.13平均精確率均值
各類別平均精確率的均值。平均精確率均值見式(12)。
n
APi
mAPi1..........................................................................(12)
n
式中:
mAP——平均精確率均值;
第類樣本的平均精確率;
APi——i
n——樣本的總類別數(shù)。
5.2.14交叉平均精確率均值
測(cè)試樣本中多次交叉抽樣子集合的mAP的均值。交叉平均精確率均值見式(13)。
4
T/XXXXXXXX—XXXX
kmAP
crossmAPseti....................................................................(13)
ik
式中:
crossmAP——交叉平均精確率均值;
mAP——第i次測(cè)試樣本隨機(jī)抽樣子集合的mAP值;
seti
k——抽樣次數(shù)。
5.2.15目標(biāo)身份匹配錯(cuò)次數(shù)
同一個(gè)目標(biāo)在上一幀和當(dāng)前幀匹配的身份號(hào)不一致,視為身份號(hào)匹配錯(cuò)一次。
5.2.16目標(biāo)身份重復(fù)次數(shù)
跟蹤過程中,一個(gè)目標(biāo)匹配出的身份總數(shù)量。
5.2.17跟蹤穩(wěn)定率
衡量目標(biāo)跟蹤準(zhǔn)確程度,結(jié)合誤檢數(shù)量,漏檢數(shù)量,匹配錯(cuò)次數(shù),給出整體跟蹤性能的度量。跟蹤穩(wěn)
定率見式(14)。
i
dt
TPi,t.............................................................................(14)
c
tt
式中:
TP——跟蹤穩(wěn)定率;
t——幀圖像序列號(hào);
i——跟蹤算法輸出的單目標(biāo)框;
i時(shí)刻算法輸出的第個(gè)目標(biāo)框與目標(biāo)框標(biāo)簽的誤差;
dt——ti
時(shí)刻算法輸出結(jié)果和標(biāo)簽匹配上的目標(biāo)框數(shù)量。
ct——t
5.2.18跟蹤準(zhǔn)確率
衡量目標(biāo)跟蹤穩(wěn)定程度,描述了目標(biāo)被精確跟蹤的程度,并通過邊界框重疊和邊界框間的距離度量。
跟蹤準(zhǔn)確率見式(15)。
mtfptmmet
TA1t.............................................................(15)
g
tt
式中:
TA——跟蹤準(zhǔn)確率;
t——幀圖像序列號(hào);
時(shí)刻標(biāo)簽中未被匹配的目標(biāo)個(gè)數(shù);
mt——t
時(shí)刻誤檢數(shù)量;
fpt——t
時(shí)刻匹配錯(cuò)次數(shù);
mmet——t
時(shí)刻目標(biāo)框標(biāo)簽的數(shù)量。
gt——t
5
T/XXXXXXXX—XXXX
5.2.19交并比
目標(biāo)檢測(cè)中,產(chǎn)生的候選框與原標(biāo)記框的交疊率。交并比見式(16)。
areaCareaG
IOU...............................................................(16)
areaCareaG
式中:
IOU——交并比;
areaC——候選框區(qū)域面積;
areaG——原標(biāo)記框區(qū)域面積。
5.2.20交叉熵
用于度量?jī)蓚€(gè)概率分布間的差異性信息。交叉熵見式(17)。
n
Hp,qpxlogqx...........................................................(17)
i1ii
式中:
Hp,q——交叉熵;
的真實(shí)概率分布;
pxi——xi
的預(yù)測(cè)概率分布;
qxi——xi
n——測(cè)試集的大小。
5.2.21均方誤差
觀測(cè)值與真值之差的平方的期望值。均方誤差見式(18)。
2
n
Xbos,iXmodel,i
MSEi1.............................................................(18)
n
式中:
MSE——均方誤差;
第次的觀測(cè)值;
Xbos,i——
第次的真值;
Xmodel,i——
n——觀測(cè)