數(shù)據(jù)分析假設(shè)檢驗(yàn)_第1頁(yè)
數(shù)據(jù)分析假設(shè)檢驗(yàn)_第2頁(yè)
數(shù)據(jù)分析假設(shè)檢驗(yàn)_第3頁(yè)
數(shù)據(jù)分析假設(shè)檢驗(yàn)_第4頁(yè)
數(shù)據(jù)分析假設(shè)檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

以收集到的數(shù)據(jù)為根據(jù),對(duì)要確認(rèn)的事實(shí)進(jìn)行判斷的方法以及

找出作為判斷基準(zhǔn)的p-Value的方法。

000營(yíng)業(yè)部的IQC小組每天都要檢查合作公司的產(chǎn)品質(zhì)量。

IQC小組根據(jù)產(chǎn)品有沒(méi)有達(dá)到規(guī)定的質(zhì)量要求,判斷它是合格品還是不合格品。

即IQC小組必須對(duì)以下兩個(gè)事實(shí)中的一個(gè)做出判斷。

-產(chǎn)品的質(zhì)量符合要求(是合格品)

-產(chǎn)品質(zhì)量不符合要求(是不合格品)

還沒(méi)有確認(rèn)的兩個(gè)事實(shí)稱(chēng)為假設(shè),分別用0假設(shè)和對(duì)立假設(shè)表示。

(肯定的假設(shè)是0假設(shè),否定0假設(shè)的是對(duì)立假設(shè))

這種情況下,如果按照常理,應(yīng)在合作公司交上來(lái)的部件中抽樣本,并將其與預(yù)定的規(guī)格進(jìn)行比較。規(guī)格和樣本的差異大,則為對(duì)立假設(shè);差異小,則為0假設(shè)。對(duì)這些數(shù)據(jù)進(jìn)行整理……

換句話說(shuō),以樣本為根據(jù)對(duì)0假設(shè)的概率進(jìn)行計(jì)算,如果概率大則設(shè)定為0假設(shè),概率小則設(shè)定為對(duì)立假設(shè),這樣的一系列判斷方法稱(chēng)為假設(shè)檢驗(yàn)。0假設(shè)的概率稱(chēng)為p-Value。

求出p-Value之后需要一個(gè)基準(zhǔn)來(lái)判斷它的大小。

這個(gè)基準(zhǔn)稱(chēng)為顯著性水平,一般會(huì)選擇1%、5%、10%中的一個(gè)。

(通常使用5%)。顯著性水平的選擇跟分析者對(duì)0假設(shè)的確信程度有關(guān)。

如果對(duì)0假設(shè)很確信,為了盡量使0假設(shè)正確,應(yīng)選擇較低的顯著性水平。

對(duì)0假設(shè)不是很確信的時(shí)候,為提高對(duì)立假設(shè)的正確率,應(yīng)該選擇較高的顯著性水平。

1/15

對(duì)一個(gè)平均值的假設(shè)檢驗(yàn)(已知某樣本集合的標(biāo)準(zhǔn)誤差率的時(shí)候)

確認(rèn)一下身高的平均值是否為70。

(已知:某樣本集合的標(biāo)準(zhǔn)偏差是12)

-0假設(shè):平均身高是70-對(duì)立假設(shè):平均身高不是70

Stat->BasicStatistics->1-SampleZ...

親自操作一下,比較結(jié)果

2/15

對(duì)一個(gè)平均值的假設(shè)檢驗(yàn)(未知某樣本集合的標(biāo)準(zhǔn)偏差的時(shí)候)

確認(rèn)一下身高的平均值是不是70

-0假設(shè):平均身高是70;

-對(duì)立假設(shè):平均身高不是70.

Stat->BasicStatistics->

1-Samplet...

親自操作一下,比較結(jié)果

對(duì)一個(gè)平均值的假設(shè)檢驗(yàn)(已知某樣本集合的標(biāo)準(zhǔn)偏差的時(shí)候)

關(guān)于OptionMenu……(想更改可信度的時(shí)候)

親自操作一下,比較結(jié)果

4/15

對(duì)一個(gè)平均值的假設(shè)檢驗(yàn)(已知某樣本集合的標(biāo)準(zhǔn)偏差的時(shí)候)

關(guān)于GraphsMenu……(要在分析同時(shí)畫(huà)圖像的時(shí)候)

親自操作一下,比較結(jié)果

對(duì)兩個(gè)平均值的假設(shè)檢驗(yàn)(已知某樣本集合的標(biāo)準(zhǔn)偏差的時(shí)候)

確認(rèn)一下男、女的平均身高有沒(méi)有差異。-0假設(shè):男平均身高=女平均身高-對(duì)立假設(shè):男平均身高≠女平均身高

Stat->BasicStatistics->

2-Samplet...

圖像和可信度的調(diào)整參考前一頁(yè)。

親自操作一下,比較結(jié)果.

6/15

關(guān)于散布差異的假設(shè)檢驗(yàn)...

確認(rèn)一下男女的平均身高有沒(méi)有差異

-0假設(shè):男身高的分散程度=女身高的分散程度

-對(duì)立假設(shè):男身高的分散程度≠女身高的分散程度

ANOVA->TestforEqualVariances...

關(guān)于男女身高的Boxplot,只能在比較對(duì)象是兩個(gè)的時(shí)候得出,

有三個(gè)以上對(duì)象的時(shí)候則不能得出結(jié)論。

親自操作一下,比較結(jié)果.

7/15

確認(rèn)是不是正態(tài)分布

確認(rèn)數(shù)據(jù)的正態(tài)分布

確認(rèn)一下收集的Pulse是否屬于正態(tài)分布。.

Stat->BasicStatistics->NormalityTest...

親自操作一下,比較結(jié)果

8/15

非正態(tài)分布的正態(tài)化

通過(guò)確認(rèn)可以知道練習(xí)3的數(shù)據(jù)不服從正態(tài)分布。

這時(shí),適當(dāng)改變變量可以轉(zhuǎn)換成正態(tài)分布。

Stat->ControlCharts->Box-CoxTransformation...

親自操作一下,比較結(jié)果

9/15

對(duì)一個(gè)比率差異的假設(shè)檢驗(yàn)

000營(yíng)業(yè)部為了確認(rèn)A合作企業(yè)的6西格馬計(jì)劃的成果,檢查了300個(gè)樣品。結(jié)果發(fā)現(xiàn)了15個(gè)不合格品。

以前A合作公司生產(chǎn)的部件不合格率是15%。

-0假設(shè):不合格率=15%

-對(duì)立假設(shè):不合格率≠15%

Stat->BasicStatistics->

1-Proportion...

親自操作一下,比較結(jié)果

10/15

對(duì)兩個(gè)比率差異的假設(shè)檢驗(yàn)

000營(yíng)業(yè)部為了比較A、B兩個(gè)生產(chǎn)線的不合格率,收集了相關(guān)數(shù)據(jù)。

結(jié)果,A生產(chǎn)線是1000個(gè)當(dāng)中有75個(gè)不合格品,B生產(chǎn)線是1500個(gè)當(dāng)中有120個(gè)不合格品。

-0假設(shè):A的不合格率=B的不合格率

-對(duì)立假設(shè):A的不合格率≠B的不合格率

Stat->BasicStatistics->

2-Proportion...

親自操作一下,比較結(jié)果

11/15

對(duì)表(Table)的假設(shè)檢驗(yàn)

這次說(shuō)明一下以表的形式整理數(shù)據(jù)的時(shí)使用的分析方法。

檢驗(yàn)三個(gè)以上比率之間的差異.

000營(yíng)業(yè)部對(duì)A、B、C、D四種材料進(jìn)行了作業(yè)性評(píng)價(jià),結(jié)果如下:

-0假設(shè):不同材料的不合格率一樣

-對(duì)立假設(shè):不同材料的不合格率不一樣

A

B

C

D樣本

不合格品

45

43

48

44

5

7

2

6

數(shù)據(jù)的輸入:

把表里的數(shù)據(jù)如實(shí)輸入到Worksheet.

Stat->Tables->

Chi-SquareTest...

親自操作一下,比較結(jié)果

12/15

對(duì)表(Table)的假設(shè)檢驗(yàn)

想確認(rèn)兩個(gè)變量的獨(dú)立關(guān)系的時(shí)候...

000營(yíng)業(yè)部調(diào)查了不同性別所喜歡的產(chǎn)品色彩,結(jié)果如下:

-0假設(shè):性別與色彩是相互獨(dú)立的(有關(guān)聯(lián))

-對(duì)立假設(shè):不同材料的不合格率不是相互獨(dú)立的(有關(guān)聯(lián))

白色紫色藍(lán)色男

37

41

44

35

72

71

數(shù)據(jù)的輸入:

把表里的數(shù)據(jù)如實(shí)輸入到Worksheet

Stat->Tables->Chi-SquareTest...

親自操作一下,比較結(jié)果

13/15

對(duì)表(Table)的假設(shè)檢驗(yàn)

Chi-SquareTest結(jié)果的解釋方法

假設(shè)有一個(gè)工廠生產(chǎn)娛樂(lè)場(chǎng)使用的骰子。

對(duì)完成品進(jìn)行質(zhì)量檢查的時(shí)候,應(yīng)該怎樣檢查出合格品和不合格品呢?(除了外觀檢查)

我們知道在拋擲合格的骰子時(shí),各個(gè)數(shù)字有1/6的出現(xiàn)概率。

利用這一點(diǎn)判斷出合格品和不合格品。

為此,我們擲6000個(gè)骰子,把結(jié)果記錄了下來(lái)。

把實(shí)際值和預(yù)測(cè)值相減,如果得出的值大,是不合格品;

如果得出的值小,則可以判定為合格品。

和標(biāo)準(zhǔn)偏差一樣,得出的值可能是0,為了避免這一情況,進(jìn)行平方。

這時(shí),有可能導(dǎo)致得出的值太大,因此可再除以期望值,然后對(duì)較實(shí)際值和預(yù)測(cè)值的大小進(jìn)行比較。

即:根據(jù)(實(shí)際值-預(yù)測(cè)值)/預(yù)測(cè)值的大小做出判斷。

預(yù)測(cè)值實(shí)際值實(shí)際值和

預(yù)測(cè)值的差12345610001010101000990-1010001050501000950-501000100111000999-1

14/15

3)對(duì)表(TABLE)的假設(shè)檢驗(yàn)

Chi-SquareTest結(jié)果的解釋方法

骰子的概率因我們事先已經(jīng)了解了,

因而能通過(guò)簡(jiǎn)單的計(jì)算算出來(lái)。

在不知概率的情況下,

如果〈當(dāng)想要確認(rèn)兩個(gè)變數(shù)的獨(dú)立關(guān)系時(shí)〉,我們將怎么做?

Chi-SquareTest:白色,紫色,

首先考慮一下出現(xiàn)白色的概率。

全部人員數(shù)是300名,選擇白色的人數(shù)72名,

選擇白色的概率是72/300。

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論