統(tǒng)計基礎知識與假設檢驗

上傳人：a*** IP屬地：貴州上傳時間：2023-01-04 格式：PPTX 頁數(shù)：71 大?。?03.78KB 積分：40 舉報 版權申訴

已閱讀5頁，還剩66頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權，請進行舉報或認領

文檔簡介

對比實驗聯(lián)想集團有限公司

歡迎光臨6sigma世界1統(tǒng)計基礎知識參數(shù)估計假設檢驗對比實驗報告編寫和練習課程進程為什么要學習對比實驗許多的問題需要就某些參數(shù)作出接受或拒絕的決定，這說明是一個假設。它代表把一個實務的問題演繹成統(tǒng)計學上的問題。而這個決策過程便稱為：HypothesisTesting我們把實現(xiàn)假設檢驗的過程成為對比實驗。統(tǒng)計學上的測試能為我們就問題作出客觀解說，相比較以前，我們只能作出主觀的解說。這是后續(xù)學習內(nèi)容的基礎。統(tǒng)計基礎知識第一單元總體(Population):在統(tǒng)計問題中,我們把研究對象的全體成為總體個體:構成總體的每個成員稱為個體樣本(Sample):從總體中抽取部分個體所組成的集合稱為樣本樣品:樣本中的個體稱為樣品樣本容量:樣品的個數(shù)稱為樣本容量,常用n表示1.1總體和樣本樣本隨機樣本(Randomsample):能夠被推廣應用于更大的總體的樣本。總體的每個個體有一個已知的（有時是相等的）機會被包含在該樣本中。簡單隨機樣本(Simplerandomsample):1、同一性：樣本與總體有同樣的分布2、獨立性：如果給定第一個事件，無論它的結果是什么，第二個事件的機會都一樣。1.2統(tǒng)計量和抽樣分布統(tǒng)計量:不含未知參數(shù)的樣本函數(shù)稱為統(tǒng)計量。抽樣分布：統(tǒng)計量的分布稱為抽樣分布。有序樣本：是從總體X中隨機抽取的容量為n的樣本，將它們的觀測值從小到大排序，這便是有序樣本。統(tǒng)計推斷過程統(tǒng)計學的主要任務：1、研究總體是什么分布？2、這個總體（即分布）的均值、方差是多少？樣本總體樣本統(tǒng)計量例如：樣本均值、方差總體均值、方差抽樣1.2常用統(tǒng)計量描述中心位置的統(tǒng)計量：1、眾數(shù)（mode）:一個變量的眾數(shù)是指出現(xiàn)次數(shù)最多的值，不過它不一定唯一。2、中位數(shù)：3、均值（mean）:1.2常用統(tǒng)計量描述數(shù)據(jù)分散程度的統(tǒng)計量：1、極差（range）:2、方差（variance）3、標準差（standarddeviation）：4、標準誤差（standarderror

）：是很多不同樣本的均值的標準差。5、變異系數(shù)：1.3正態(tài)分布正態(tài)分布：1.3正態(tài)分布標準正態(tài)分布布：它是特殊的正正態(tài)分布，服服從標準的正正態(tài)分布的隨隨機變量記為為z，概率密度函函數(shù)記為Φ（z）1.3正態(tài)分布標準正態(tài)分布布的變換：1.3正態(tài)分布標準正態(tài)分布布的分位數(shù)：：0.975是隨機變量z不超過1.96的概率1.96是標準正態(tài)分分布N（0,1)的0.975的分位數(shù)，記記為z0.9750.9750.0251.4常用的抽樣分分布正態(tài)樣本均值值的分布:=10Xn=4Xn=16總體分布抽樣分布1.4常用的抽樣分分布t分布:Xt

分布與正態(tài)分布的比較正態(tài)分布t分布t不同自由度的t分布標準正態(tài)分布t(df=13)t(df=5)1.4常用的抽樣分分布F分布:設X1，X2，…，Xn是來自正態(tài)總總體N(μ1,σ12)的一個樣本，，Y1，Y2，…，Yn是來自正態(tài)總總體N(μ2,σ22)的一個樣本，，且相互獨立立,則:將F(n-1,m-1)稱為第一自由由度為(n-1)，第二自由度度為(m-1)的F分布1.4常用的抽樣分分布F分布:F（1,10)(5,10)(10,10)參數(shù)估計第二單元2.1點估計點估計的概念念（pointestimation）:用樣本均值估估計總體均值值用樣本方差估估計總體方差差用樣本標準差差估計總體標標準差2.2區(qū)間估計區(qū)間估計的概概念（intervalestimate）:置信區(qū)間（confidenceinterval）：，則稱這種置置信區(qū)間為等等尾置信區(qū)間間。2.2區(qū)間估計置信區(qū)間下限值1-aa/2a/2x

置信區(qū)間上限值點估計與區(qū)間間估計的區(qū)別別:我是意見是這這個值是10，但誤差在±1之間。2.2區(qū)間估計2.2區(qū)間估計置信水平的概概念:是θ的置信信水平平為1-α的置信信區(qū)間間。它它的含含義是是能蓋蓋住未未知參參數(shù)θ的概率率為1-α。置信區(qū)區(qū)間量量化了了數(shù)據(jù)據(jù)的不不定性性。μ2.2區(qū)間估估計總體均均值置置信區(qū)區(qū)間的的計算算:σ已知：σ未知：2.2區(qū)間估估計Χ2分布:方差置置信區(qū)區(qū)間的的計算算：2.2區(qū)間估估計置信區(qū)區(qū)間的的長度度:1、大大的樣樣本產(chǎn)產(chǎn)生較短的的區(qū)間間，小小的樣樣本產(chǎn)產(chǎn)生較較長的的區(qū)間間。2、低低的置置信水水平產(chǎn)產(chǎn)生較較短的的區(qū)間間，高高的置置信水水平產(chǎn)產(chǎn)生較較長的的區(qū)間間。μN=100N=200N=300N=400N=500ExercisesX=sXnDistributionofSamplingAveragesXX研究草草莓醬醬的重重量是是多少少？答案：：μ=95％的置置信區(qū)區(qū)間假設檢檢驗第三單單元3.1假設檢檢驗問問題例：草草莓醬醬的凈凈重服服從正正態(tài)分分布N（μ，σ2），6月份從從產(chǎn)品品中隨隨機抽抽取50瓶稱重重的平平均重重量為為180.5克,5月份從從產(chǎn)品品中隨隨機抽抽取50瓶稱重重的平平均重重量為為179.6克,，問從從總體體上是是否重重量比比原來來少了了？1、這這不是是一個個參數(shù)數(shù)估計計問題題2、要要求對對μ6-μ5=0作出回回答：：是與與否3、這類類問題題被稱稱為統(tǒng)統(tǒng)計假假設檢檢驗問問題估計的的主要要任務務是找找參數(shù)數(shù)值等等于幾幾；假設檢檢驗的的興趣趣主要要是看看參數(shù)數(shù)的值值是否否等于于某個個特別別感興興趣的的值3.2定義假假設H0和HaH0要判斷斷0.9克這個個值是是否超超出了了樣本本變換換所能能造成成的差差異的的范圍圍，我我們先先要問問一問問在總總體均均值相相等的的情況況下，，樣本本均值值會發(fā)發(fā)生什什么情情況，，即是是否兩兩個均均值的的差等等于0，在統(tǒng)統(tǒng)計學學上被被稱為為零假設設(nullhypothesis)之所以以用零零來修修飾假假設，，其原原因是是假設設的內(nèi)內(nèi)容總總是沒沒有差差異或或沒有有改變變3.2定義假假設H0和HaHA零假設設其邏邏輯上上的反反面假假設是是“兩兩個參參數(shù)有有區(qū)別別”。。這種種反面面假設設稱為為備擇假假設（（alternativehypothesis）。當零假假設所所提問問的問問題被被否定定時，，備擇擇假設設的答答案就就是正正確的的。如如果樣樣本數(shù)數(shù)據(jù)能能證明明對于于零假假設提提出的的問題題應該該否定定，那那么我我們就就拒絕絕（reject）零假假設而而傾向向于備備擇假假設。。3.3怎樣回回答零零假設設所提提出的的問題題概率：：p-值p-值是當當零假假設正正確時時，得得到所所觀測測的數(shù)數(shù)據(jù)或或更極極端的的數(shù)據(jù)據(jù)的概概率，，這個個概率率稱為為p-值（p-value）。當p-值小到到以至至于幾幾乎不不可能能在零零假設設正確確時出出現(xiàn)目目前的的觀測測數(shù)據(jù)據(jù)時，，我們們就拒拒絕零零假設設。p-值越小小，拒拒絕零零假設設的理理由就就越充充分。。注意：：有時錯錯誤以以為p-值與零零假設設對錯錯的概概率有有關，，但這這是不不可能能的.p-值指的的是關關于數(shù)數(shù)據(jù)的的概率率。p-值告訴訴我們們在某某總體體的許許多樣樣本中中，某某一類類數(shù)據(jù)據(jù)出現(xiàn)現(xiàn)的經(jīng)經(jīng)常程程度。。3.3怎樣回回答零零假設設所提提出的的問題題假設檢檢驗機機制：：為了求求p-值，統(tǒng)統(tǒng)計理理論指指出要要把觀觀測到到的0.9這個樣樣本均均值之之差變變換成成標準準得分分。標準得得分：：0.0H00.00.510.9觀測到的差樣本均值的差標準得分2.142p-值＝0.03473.3怎樣樣回回答答零零假假設設所所提提出出的的問問題題假設設檢檢驗驗機機制制：：t值等等于于2.142的概概率率是是0.0347,因此此兩兩個個樣樣本本均均值值之之差差等等于于0.9的概概率率也也是是0.0347，換換句句話話說說就就是是如如果果兩兩總總體體均均值值相相等等的的話話，，從從均均值值相相等等的的總總體體中中抽抽取取200個樣樣本本兩兩兩兩相相減減所所得得之之差差只只有有3.47個樣樣本本的的樣樣本本均均值值相相差差在在0.9，是是小小概概率率（（0.05）事事件件，，我我們們拒拒絕絕零零假假設設。。H00.00.510.9觀測到的差樣本均值的差標準得分2.142p-值＝＝0.03473.4顯著著水水平平顯著著水水平平：：我我們們不不是是在在數(shù)數(shù)據(jù)據(jù)收收集集完畢畢之后后計計算算p-值，，而而是是在在收收集集數(shù)數(shù)據(jù)據(jù)以前前就已已經(jīng)經(jīng)確確定定好好的的小小概概率率來來構構造造一一個個區(qū)區(qū)間間。。當當樣樣本本數(shù)數(shù)據(jù)據(jù)落落入入這這個個區(qū)區(qū)間間時時就就拒拒絕絕零零假假設設。。這這個個小小概概率率稱稱為為檢檢驗驗的的顯顯著著水水平平（（significantlevel），，通通常常選選0.05.一個個檢檢驗驗的的顯顯著著水水平平α是抽抽樣樣所所得得的的數(shù)數(shù)據(jù)據(jù)拒拒絕絕了了本本來來是是正正確確的的零零假假設設的的概概率率。。拒絕絕域域：：當當樣樣本本數(shù)數(shù)據(jù)據(jù)落落入入這這個個區(qū)區(qū)間間時時就就拒拒絕絕零零假假設設，，那那么么這這個個區(qū)區(qū)間間就就稱稱為為拒拒絕絕域域。。臨界界值值（（criticalvalues）：：拒絕絕域域的的邊邊界界所所對對應應的的標標準準得得分分的的值值。。對對于于雙雙邊邊檢檢驗驗，，樣樣本本統(tǒng)統(tǒng)計計量量的的臨臨界界值是是兩兩個個值值。。3.4顯著水平平Ho值臨界值臨界值a/2a/2

樣本統(tǒng)計量拒絕域拒絕域接受域抽樣分布1-置信水平3.5風險（α和β）sX=sXnDistributionofSamplingAveragesXX3.5α和β的關系sX=sXnDistributionofSamplingAveragesXXαβ你不能同同時減少少兩類錯錯誤!3.6假設檢驗驗的步驟驟1、建立假假設2、數(shù)據(jù)獨獨立性檢檢查3、數(shù)據(jù)正正態(tài)性檢檢查4、如為OnetoOne問題進行行方差的的F檢驗5、計算檢檢驗統(tǒng)計計量6、給出顯顯著性水水平α，通常α=0.057、定出臨臨界值，，寫出拒拒絕域8、判斷案例1例：草莓莓醬的凈凈重服從從正態(tài)分分布N（180，22），5月份隨機機抽取50罐稱重的的平均重重量為179.6克，問是是否符合合標準？？平均凈重重：179.6g3.7OnetoStandard的問題是假設檢檢驗的特特例:其中一個個μ已知3.7OnetoStandard的問題計算標準準得分:σ已知時，，使用z統(tǒng)計量計計算σ未知時，，使用t統(tǒng)計量計計算雙側問題題Ho值臨界值臨界值a/2a/2樣本統(tǒng)計計量拒絕域拒絕域接受域抽樣分布布1-置信水平平3.7OnetoStandard的問題單側左檢檢驗表格值(臨界值)拒絕范圍無法拒絕HOHa:>(大于)3.7OnetoStandard的問題單側右檢檢驗拒絕范圍無法拒絕HO表格值(臨界值)Ha:<(小于)3.7OnetoStandard的問題JMP中的操作作3.7OnetoStandard的問題JMP中的操作作3.7OnetoStandard的問題JMP中的操作作案例2例：草莓莓醬的凈凈重服從從正態(tài)分分布N（μ，σ2），6月份從產(chǎn)產(chǎn)品中隨隨機抽取取50瓶稱重的的平均重重量為180.5克,5月份從產(chǎn)產(chǎn)品中隨隨機抽取取50瓶稱重的的平均重重量為179.6克,，問從總總體上是是否重量量比原來來少了？？假設檢驗驗的步驟驟1、建立假假設2、數(shù)據(jù)獨獨立性檢檢查3、數(shù)據(jù)正正態(tài)性檢檢查4、如為OnetoOne問題進行行方差的的F檢驗5、計算檢檢驗統(tǒng)計計量6、給出顯顯著性水水平α，通常α=0.057、定出臨界值值，寫出拒絕絕域8、判斷3.8OnetoOne的問題建立假設:假設檢驗的步步驟1、建立假設2、數(shù)據(jù)獨立性性檢查3、數(shù)據(jù)正態(tài)性性檢查4、如為OnetoOne問題進行方差差的F檢驗5、計算檢驗統(tǒng)統(tǒng)計量6、給出顯著性性水平α，通常α=0.057、定出臨界值值，寫出拒絕絕域8、判斷假設檢驗的步步驟1、建立假設2、數(shù)據(jù)獨立性性檢查3、數(shù)據(jù)正態(tài)性性檢查4、如為OnetoOne問題進行方差差的F檢驗5、計算檢驗統(tǒng)統(tǒng)計量6、給出顯著性性水平α，通常α=0.057、定出臨界值值，寫出拒絕絕域8、判斷3.8OnetoOne的問題FcritaF檢驗：假設檢驗的步步驟1、建立假設2、數(shù)據(jù)獨立性性檢查3、數(shù)據(jù)正態(tài)性性檢查4、如為OnetoOne問題進行方差差的F檢驗5、計算檢驗統(tǒng)統(tǒng)計量6、給出顯著性性水平α，通常α=0.057、定出臨界值值，寫出拒絕絕域8、判斷3.8OnetoOne的問題σ相等時t的計算：Sp為s1，s2的加權平均，，稱為兩個樣樣本的聯(lián)合方方差。3.8OnetoOne的問題σ不等時t的計算：3.8OnetoOne的問題假設檢驗的步步驟1、建立假設2、數(shù)據(jù)獨立性性檢查3、數(shù)據(jù)正態(tài)性性檢查4、如為OnetoOne問題進行方差差的F檢驗5、計算檢驗統(tǒng)統(tǒng)計量6、給出顯著性性水平α，通常α=0.057、定出臨界值值，寫出拒絕絕域8、判斷3.8OnetoOne的問題Ho值臨界值臨界值a/2a/2

樣本統(tǒng)計量拒絕域拒絕域接受域抽樣分布1-置信水平假設檢驗的步步驟1、建立假設2、數(shù)據(jù)獨立性性檢查3、數(shù)據(jù)正態(tài)性性檢查4、如為OnetoOne問題進行方差差的F檢驗5、計算檢驗統(tǒng)統(tǒng)計量6、給出顯著性性水平α，通常α=0.057、定出臨界值值，寫出拒絕絕域8、判斷3.8OnetoOne的問

人人文庫> 全部分類> 行業(yè)資料 > 管理策劃

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

統(tǒng)計基礎知識與假設檢驗

文檔簡介

溫馨提示

最新文檔

評論

統(tǒng)計基礎知識與假設檢驗

文檔簡介

溫馨提示

最新文檔

評論

相關文檔