標(biāo)準(zhǔn)解讀

《GB/T 4883-2008 數(shù)據(jù)的統(tǒng)計(jì)處理和解釋 正態(tài)樣本離群值的判斷和處理》相較于《GB/T 4883-1985 數(shù)據(jù)的統(tǒng)計(jì)處理和解釋 正態(tài)樣本異常值的判斷和處理》,在內(nèi)容上進(jìn)行了多方面的更新與改進(jìn),主要體現(xiàn)在以下幾個(gè)方面:

首先,在術(shù)語定義部分,《GB/T 4883-2008》對“離群值”及相關(guān)概念給出了更加明確、詳細(xì)的定義。新版標(biāo)準(zhǔn)中對于離群值的描述更為科學(xué)嚴(yán)謹(jǐn),有助于使用者更準(zhǔn)確地理解和應(yīng)用相關(guān)理論。

其次,《GB/T 4883-2008》增加了關(guān)于數(shù)據(jù)預(yù)處理的內(nèi)容,強(qiáng)調(diào)了在進(jìn)行離群值檢測之前需要對原始數(shù)據(jù)進(jìn)行適當(dāng)處理的重要性。這包括但不限于去除重復(fù)記錄、填補(bǔ)缺失值等步驟,確保后續(xù)分析基于高質(zhì)量的數(shù)據(jù)集。

再者,新版本標(biāo)準(zhǔn)引入了更多先進(jìn)的統(tǒng)計(jì)方法和技術(shù)來識(shí)別正態(tài)分布中的離群點(diǎn)。除了保留原有Grubbs檢驗(yàn)等經(jīng)典方法外,《GB/T 4883-2008》還推薦使用如Dixon Q檢驗(yàn)、Rosner's極端學(xué)生化偏差法等多種算法,提供了更為靈活的選擇空間以適應(yīng)不同類型數(shù)據(jù)的需求。

此外,《GB/T 4883-2008》加強(qiáng)了對結(jié)果解釋及后續(xù)處理策略指導(dǎo)。它不僅詳細(xì)說明了如何根據(jù)檢驗(yàn)結(jié)果判斷是否存在離群值,還進(jìn)一步討論了當(dāng)發(fā)現(xiàn)潛在離群值時(shí)應(yīng)采取何種措施——比如是否刪除這些觀測值或采用其他方式進(jìn)行調(diào)整,并提醒用戶注意保持?jǐn)?shù)據(jù)分析過程中的客觀性和合理性。

最后,新版標(biāo)準(zhǔn)通過增加案例研究等形式增強(qiáng)了其實(shí)用性,使得讀者能夠更好地將理論知識(shí)應(yīng)用于實(shí)際問題解決之中。


如需獲取更多詳盡信息,請直接參考下方經(jīng)官方授權(quán)發(fā)布的權(quán)威標(biāo)準(zhǔn)文檔。

....

查看全部

  • 現(xiàn)行
  • 正在執(zhí)行有效
  • 2008-07-16 頒布
  • 2009-01-01 實(shí)施
?正版授權(quán)
GB/T 4883-2008數(shù)據(jù)的統(tǒng)計(jì)處理和解釋正態(tài)樣本離群值的判斷和處理_第1頁
GB/T 4883-2008數(shù)據(jù)的統(tǒng)計(jì)處理和解釋正態(tài)樣本離群值的判斷和處理_第2頁
GB/T 4883-2008數(shù)據(jù)的統(tǒng)計(jì)處理和解釋正態(tài)樣本離群值的判斷和處理_第3頁
GB/T 4883-2008數(shù)據(jù)的統(tǒng)計(jì)處理和解釋正態(tài)樣本離群值的判斷和處理_第4頁
GB/T 4883-2008數(shù)據(jù)的統(tǒng)計(jì)處理和解釋正態(tài)樣本離群值的判斷和處理_第5頁
已閱讀5頁,還剩23頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

GB/T 4883-2008數(shù)據(jù)的統(tǒng)計(jì)處理和解釋正態(tài)樣本離群值的判斷和處理-免費(fèi)下載試讀頁

文檔簡介

犐犆犛03.120.30

犃41

中華人民共和國國家標(biāo)準(zhǔn)

犌犅/犜4883—2008

代替GB/T4883—1985

數(shù)據(jù)的統(tǒng)計(jì)處理和解釋

正態(tài)樣本離群值的判斷和處理

犛狋犪狋犻狊狋犻犮犪犾犻狀狋犲狉狆狉犲狋犪狋犻狅狀狅犳犱犪狋犪—

犇犲狋犲犮狋犻狅狀犪狀犱狋狉犲犪狋犿犲狀狋狅犳狅狌狋犾犻犲狉狊犻狀狋犺犲狀狅狉犿犪犾狊犪犿狆犾犲

20080716發(fā)布20090101實(shí)施

中華人民共和國國家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局

發(fā)布

中國國家標(biāo)準(zhǔn)化管理委員會(huì)

犌犅/犜4883—2008

目次

前言!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Ⅲ

引言!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Ⅳ

1范圍!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!1

2規(guī)范性引用文件!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!1

3術(shù)語、定義和符號!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!1

3.1術(shù)語和定義!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!1

3.2符號和縮略語!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!1

4離群值判斷!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!2

4.1來源與判斷!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!2

4.2離群值的三種情形!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!2

4.3檢出離群值個(gè)數(shù)的上限!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!2

4.4單個(gè)離群值情形!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!2

4.5判定多個(gè)離群值的檢驗(yàn)規(guī)則!!!!!!!!!!!!!!!!!!!!!!!!!!!!2

5離群值處理!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!2

5.1處理方式!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!2

5.2處理規(guī)則!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!3

5.3備案!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!3

6已知標(biāo)準(zhǔn)差情形離群值的判斷規(guī)則!!!!!!!!!!!!!!!!!!!!!!!!!!3

6.1一般原則!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!3

6.2離群值的判斷規(guī)則!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!3

6.2.1上側(cè)情形!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!3

6.2.2下側(cè)情形!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!3

6.2.3雙側(cè)情形!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!3

6.3使用奈爾(Nair)檢驗(yàn)法的示例!!!!!!!!!!!!!!!!!!!!!!!!!!!4

7未知標(biāo)準(zhǔn)差情形離群值的判斷規(guī)則(限定檢出離群值的個(gè)數(shù)不超過1時(shí))!!!!!!!!!!4

7.1一般原則!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!4

7.2格拉布斯(Grubbs)檢驗(yàn)法!!!!!!!!!!!!!!!!!!!!!!!!!!!!!4

7.2.1上側(cè)情形!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!4

7.2.2下側(cè)情形!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!4

7.2.3雙側(cè)情形!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!5

7.2.4使用格拉布斯(Grubbs)檢驗(yàn)法的示例!!!!!!!!!!!!!!!!!!!!!!!5

7.3狄克遜(Dixon)檢驗(yàn)法!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!5

7.3.1單側(cè)情形!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!5

7.3.2雙側(cè)情形!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!6

7.3.3使用狄克遜(Dixon)檢驗(yàn)法的示例!!!!!!!!!!!!!!!!!!!!!!!!6

8未知標(biāo)準(zhǔn)差情形離群值的判斷規(guī)則(限定檢出離群值的個(gè)數(shù)大于1時(shí))!!!!!!!!!!!6

8.1一般原則!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!6

8.2偏度—峰度檢驗(yàn)法!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!6

犌犅/犜4883—2008

8.2.1使用條件!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!6

8.2.2單側(cè)情形———偏度檢驗(yàn)法!!!!!!!!!!!!!!!!!!!!!!!!!!!!7

8.2.3雙側(cè)情形———峰度檢驗(yàn)法!!!!!!!!!!!!!!!!!!!!!!!!!!!!7

8.2.4重復(fù)使用峰度檢驗(yàn)法的示例!!!!!!!!!!!!!!!!!!!!!!!!!!!7

8.3狄克遜(Dixon)檢驗(yàn)法!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!8

8.3.1狄克遜(Dixon)檢驗(yàn)法的規(guī)則!!!!!!!!!!!!!!!!!!!!!!!!!!8

8.3.2重復(fù)使用狄克遜(Dixon)檢驗(yàn)法的示例!!!!!!!!!!!!!!!!!!!!!!8

附錄A(規(guī)范性附錄)統(tǒng)計(jì)數(shù)值表!!!!!!!!!!!!!!!!!!!!!!!!!!!10

附錄B(資料性附錄)選擇離群值判斷方法和處理規(guī)則的指南!!!!!!!!!!!!!!!15

B.1判定和處理離群值的目的!!!!!!!!!!!!!!!!!!!!!!!!!!!!15

B.2對各種檢驗(yàn)法的選擇!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!15

B.3重視檢出的離群值給出的信息!!!!!!!!!!!!!!!!!!!!!!!!!!16

附錄C(資料性附錄)當(dāng)狀>30時(shí)的狄克遜(Dixon)檢驗(yàn)!!!!!!!!!!!!!!!!!17

參考文獻(xiàn)!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!21

犌犅/犜4883—2008

前言

本標(biāo)準(zhǔn)代替GB/T4883—1985。本標(biāo)準(zhǔn)與GB/T4883—1985相比較,技術(shù)內(nèi)容的變化主要包括:

———增加了術(shù)語、定義和符號一章;

———將“正態(tài)樣本異常值的判斷和處理”改為“正態(tài)樣本離群值的判斷和處理”;

———將術(shù)語“檢出異常值”和“高度異常值”分別改為“歧離值”和“統(tǒng)計(jì)離群值”,并進(jìn)一步明確了二

者的含義及相互差異;

———增加了檢出水平和剔除水平的定義;

———檢出水平由原標(biāo)準(zhǔn)中“檢出水平α一般取為1%,5%或10%”改為“除非根據(jù)本標(biāo)準(zhǔn)達(dá)成協(xié)議

的各方另有約定外,α值應(yīng)為0.05”;

———明確規(guī)定剔除水平α為“除非根據(jù)本標(biāo)準(zhǔn)達(dá)成協(xié)議的各方另有約定外,α值應(yīng)為0.01”;

———增加了各種情形“統(tǒng)計(jì)離群值”的檢驗(yàn)步驟;

———將“沒有異常值”和“沒有高度異常的離群值”分別改為“未發(fā)現(xiàn)離群值”和“未發(fā)現(xiàn)統(tǒng)計(jì)離群

值”;

———增加了奈爾(Nair)統(tǒng)計(jì)量、格拉布斯(Grubbs)統(tǒng)計(jì)量、狄克遜(Dixon)統(tǒng)計(jì)量、偏度統(tǒng)計(jì)量、峰

度統(tǒng)計(jì)量的符號;

———作狄克遜(Dixon)檢驗(yàn)時(shí),將樣本量由30擴(kuò)充到100,此內(nèi)容作為附錄C。

本標(biāo)準(zhǔn)的附錄A為規(guī)范性附錄,附錄B和附錄C為資料性附錄。

本標(biāo)準(zhǔn)由中國標(biāo)準(zhǔn)化研究院提出。

本標(biāo)準(zhǔn)由全國統(tǒng)計(jì)方法應(yīng)用標(biāo)準(zhǔn)化技術(shù)委員會(huì)歸口。

本標(biāo)準(zhǔn)起草單位:中國標(biāo)準(zhǔn)化研究院、中國科學(xué)院數(shù)學(xué)與系統(tǒng)科學(xué)研究院、寧波工程學(xué)院、北京大

學(xué)、無錫市產(chǎn)品質(zhì)量監(jiān)督檢驗(yàn)所、北京師范大學(xué)。

本標(biāo)準(zhǔn)主要起草人:于振凡、丁文興、陳敏、荊廣珠、房祥忠、吳建國、崔恒建、陳玉忠。

本標(biāo)準(zhǔn)所代替標(biāo)準(zhǔn)的歷次版本的發(fā)布情況為:

———GB/T4883—1985。

犌犅/犜4883—2008

引言

從事科學(xué)研究、工農(nóng)業(yè)制造以及管理工作都離不開數(shù)據(jù),而對這些數(shù)據(jù)的整理、分析和解釋都離不

開統(tǒng)計(jì)方法。統(tǒng)計(jì)學(xué)是研究數(shù)字資料的整理、分析和正確解釋的一門學(xué)科。人們各自從不同的來源取

得各種數(shù)字資料,這些數(shù)字資料通常都是雜亂無章的,必須經(jīng)過整理和簡縮才能利用,使用完善的統(tǒng)計(jì)

方法就可使數(shù)據(jù)整理、排列的有條有理,用圖形或少量的幾個(gè)重要參數(shù),就可把一大堆數(shù)據(jù)的特征表達(dá)

出來,這樣既可避免不正確的解釋,又可將獲得滿意數(shù)據(jù)的成本降到最低限度,提高了經(jīng)濟(jì)效益?!稊?shù)據(jù)

的統(tǒng)計(jì)處理和解釋》含有多項(xiàng)國家標(biāo)準(zhǔn),它們是:

———統(tǒng)計(jì)容忍區(qū)間的確定(GB/T3359)

———均值的估計(jì)和置信區(qū)間(GB/T3360)

———在成對觀測值情形下兩個(gè)均值的比較(GB/T3361)

———二項(xiàng)分布參數(shù)的估計(jì)與檢驗(yàn)(GB/T4088)

———泊松分布參數(shù)的估計(jì)與檢驗(yàn)(GB/T4089)

———正態(tài)性檢驗(yàn)(GB/T4882)

———正態(tài)樣本離群值的判斷和處理(GB/T4883)

———正態(tài)分布均值和方差的估計(jì)與檢驗(yàn)(GB/T4889)

———正態(tài)分布均值和方差檢驗(yàn)的功效(GB/T4890)

———Ⅰ型極值分布樣本離群值的判斷和處理(GB/T6380)

———伽瑪分布(皮爾遜Ⅲ型分布)的參數(shù)估計(jì)(GB/T8055)

———指數(shù)分布樣本離群值的判斷和處理(GB/T8056)

對于《數(shù)據(jù)的統(tǒng)計(jì)處理和解釋正態(tài)樣本離群值的判斷和處理》尚無相應(yīng)的國際標(biāo)準(zhǔn),但在一些關(guān)

于測量的國際標(biāo)準(zhǔn)和技術(shù)文件中(例如:ISO5725《測量方法與結(jié)果的準(zhǔn)確度》、ISO導(dǎo)則98《用蒙特卡

羅方法評定不確定度》)都采用了本標(biāo)準(zhǔn)中規(guī)定的一些正態(tài)樣本離群值的判斷和處理的方法。

犌犅/犜4883—2008

數(shù)據(jù)的統(tǒng)計(jì)處理和解釋

溫馨提示

  • 1. 本站所提供的標(biāo)準(zhǔn)文本僅供個(gè)人學(xué)習(xí)、研究之用,未經(jīng)授權(quán),嚴(yán)禁復(fù)制、發(fā)行、匯編、翻譯或網(wǎng)絡(luò)傳播等,侵權(quán)必究。
  • 2. 本站所提供的標(biāo)準(zhǔn)均為PDF格式電子版文本(可閱讀打?。?,因數(shù)字商品的特殊性,一經(jīng)售出,不提供退換貨服務(wù)。
  • 3. 標(biāo)準(zhǔn)文檔要求電子版與印刷版保持一致,所以下載的文檔中可能包含空白頁,非文檔質(zhì)量問題。

評論

0/150

提交評論