第三章統(tǒng)計推斷_第1頁
第三章統(tǒng)計推斷_第2頁
第三章統(tǒng)計推斷_第3頁
第三章統(tǒng)計推斷_第4頁
第三章統(tǒng)計推斷_第5頁
已閱讀5頁,還剩43頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第三章統(tǒng)計推斷 第三章 統(tǒng)計推斷 第三章統(tǒng)計推斷 3.1 統(tǒng)計學的基本概念 數(shù)據(jù)不確定性來源: (1) 測量過程引入的隨機誤差; (2) 取樣隨機性所帶來的變化; (3) 我們所關心的性質(zhì)確實發(fā)生了某種變化。 統(tǒng)計學的基本任務:從包含有隨機誤差,又 并不完全的信息中得出科學的、盡可能正確 的結論。 統(tǒng)計結論并不是絕對可靠。 第三章統(tǒng)計推斷 統(tǒng)計推斷的兩種途徑統(tǒng)計推斷的兩種途徑 假設檢驗 : (1) 根據(jù)目標建立統(tǒng)計假設; (2) 根據(jù)統(tǒng)計假設建立理論分布; (3) 根據(jù)分布計算實驗結果出現(xiàn)的可能性; (4) 若可能性小于給定標準,則拒絕假設; 否則接受假設。 假設檢驗包括參數(shù)檢驗和非參數(shù)檢驗。

2、 第三章統(tǒng)計推斷 參數(shù)估計 l點估計:結果出現(xiàn)的條件下該參數(shù)可能性最 大的取值。 l區(qū)間估計:給出一個區(qū)間,并給出指定參數(shù) 落入這一區(qū)間的概率。 參數(shù)估計與假設檢驗所依據(jù)的統(tǒng)計學理 論其實是一樣的,它們的區(qū)別只是以不 同形式給出結果而已。 第三章統(tǒng)計推斷 統(tǒng)計學常用術語統(tǒng)計學常用術語 個體個體:可以單獨觀測和研究的一個物體,一 定量的材料或服務。也指表示上述物體,材 料或服務的一個定量或定性的特性值。 總體總體:一個統(tǒng)計問題中所涉及的個體的全體。 特性特性:所考查的定性或定量的性質(zhì)或指標。 總體分布總體分布:當個體理解為定量特性值時,總 體中的每一個個體可看成是某一確定的隨機 變量的一個觀測值

3、,稱這個隨機變量的分布 為總體分布。 第三章統(tǒng)計推斷 樣本樣本:按一定程序從總體中抽取的一組 (一個或多個)個體。 樣本量樣本量:樣本中所包含的個體數(shù)目。 觀測值觀測值:作為一次觀測結果而確定的特 性值。 統(tǒng)計量統(tǒng)計量:樣本觀測值的函數(shù),它不依賴 于未知參數(shù)。例如: l樣本均值樣本均值: l樣本方差: n i i x n x 1 1 n i i xx n S 1 22 )( 1 1 第三章統(tǒng)計推斷 抽樣分布 樣本線性函數(shù)的分布樣本線性函數(shù)的分布 若X1,X2,Xn為一簡單隨機樣本,其總體 分布為N(,2), 統(tǒng)計量u為: u=a1X1+a2X2+anXn , 其中a1,a2,an 為常數(shù),則u

4、也為正態(tài)隨 機變量,且 n i i n i i auD auE 1 2 2 1 )( )( 第三章統(tǒng)計推斷 若取ai=1/n, i=1,2,n,則u= 為樣本 均值。此時 2分布分布: 設X1,X2 Xn相互獨立,且同服從 N(0, 1),則稱隨機變量 所服從的分布為2分布,記為Y2(n), n 稱為它的自由度。 X 2 1 )(,)( n XDXE n i i XY 1 2 第三章統(tǒng)計推斷 t分布分布:設XN(0,1),Y2(n),且 X,Y互相獨立,則稱隨機變量 所服從的分布為t分布,記為Tt(n)。n稱 為它的自由度。 F分布:分布:設X2(m),Y2(n),且 互相獨立,則稱隨機變量

5、所服從的分布為F分布,記為FF(m,n), (m,n)稱為它的自由度。 nY X T / nY mX F / / 第三章統(tǒng)計推斷 正態(tài)總體正態(tài)總體 樣本均值與方差的分布樣本均值與方差的分布 定理:若X1,X2Xn為抽自總體N(,2)的 簡單隨機樣本,定義樣本均值為: 樣本方差為: 則有: (1) 與S2相互獨立; (2) (3)(n-1)S2/22 (n-1)。 n i i X n X 1 1 2 1 2 )( 1 1 n i i XX n S X ) 1 ,( 2 第三章統(tǒng)計推斷 推論1:統(tǒng)計量 推論2:若X 1 ,X 2 ,X m 為取自總體 N(1,12)的樣本,Y1,Y2Yn為取自總體

6、 N(2,22)的樣本,且它們互相獨立,則: 其中S12, S22 分別為X1,Xm,Y1,Yn的 樣本方差。 ) 1( / nt nS X T ) 1, 1( 2 1 2 2 2 2 2 1 nmF S S F 第三章統(tǒng)計推斷 推論3:在推論2的條件下,若1=2,則: )2( ) 11 ( ) 1() 1( ) 1() 1( )()( 2 2 2 1 21 nmt nmnm SnSm YX T 第三章統(tǒng)計推斷 假設檢驗的基本方法假設檢驗的基本方法 與兩種類型的錯誤與兩種類型的錯誤 例3.1 某地區(qū)10年前普查時,13歲男孩 子平均身高為1.51m,現(xiàn)抽查200個12.5 歲到13.5歲男孩,

7、身高平均值為1.53m, 標準差0.073m,問10年來該地區(qū)男孩身 高是否有明顯增長? 第三章統(tǒng)計推斷 假設的建立 l零假設:記為H0,針對要考查的內(nèi)容提出。原 則為: l通過統(tǒng)計檢驗決定接受或拒絕H0后,可對問題作出 明確回答; l要能根據(jù)H0建立統(tǒng)計量的理論分布。 l備擇假設:記為HA,是除H0外的一切可能值的 集合。原則為: l應包括除H0外的一切可能值; l如有可能,應縮小備擇假設范圍以提高檢驗精度。 第三章統(tǒng)計推斷 小概率原理:小概率事件在一次觀察中 不應出現(xiàn)。 兩種類型的錯誤及其關系: l第一類錯誤:H0正確,卻被拒絕。又稱棄真。 犯這種錯誤的概率記為。 l第二類錯誤:H0錯誤,

8、卻被接受。又稱存?zhèn)巍?犯這種錯誤的概率記為。 單側與雙側檢驗:在相同時,單側檢驗 的值小于雙側檢驗。 顯著性水平的選擇 :主要依據(jù)是犯了兩 類錯誤后的危害性大小。 的常用值為:0.05, 0.01。 第三章統(tǒng)計推斷 3.3 正態(tài)總體的假設檢驗正態(tài)總體的假設檢驗 檢驗針對正態(tài)分布的兩個參數(shù):和。 單樣本檢驗 :全部樣品都抽自一個總體, 檢驗的目的通常是或是否等于某一數(shù) 值 。 雙樣本檢驗:有分別抽自不同總體的兩 個樣本,檢驗的目的是看這兩個總體的 或是否相等。 第三章統(tǒng)計推斷 單樣本檢驗步驟 建立假設,包括H0與HA lH0 :表達式中應包含等號。數(shù)值來源: 經(jīng)驗、理論、實際要求 lHA :應包

9、括除H0外的一切可能值。應優(yōu)先 選取單側檢驗 。 選擇顯著性水平 最常用的數(shù)值是0.05 和0.01。 第三章統(tǒng)計推斷 選擇統(tǒng)計量及其分布 l統(tǒng)計量:均值: ;方差:S2 。 l檢驗均值: l總體方差2已知: l總體方差2未知: l檢驗方差: X ) 1 , 0( / 0 N n X u 1)-t(n / 0 ) 1( ) 1( 2 2 0 2 2 n Sn 第三章統(tǒng)計推斷 建立拒絕域 l確定是單側檢驗還是雙側檢驗 ; l根據(jù)統(tǒng)計量的分布和值查出分位數(shù)取值, 從而建立拒絕域 。 計算統(tǒng)計量,并對結果作出解釋 l把樣本觀測值代入統(tǒng)計量公式,求得統(tǒng)計量 取值 ; l檢查是否落入拒絕域 ,作出統(tǒng)計結

10、論; l對原問題作出明確回答。 第三章統(tǒng)計推斷 雙樣本檢驗步驟 目標:檢驗兩個總體參數(shù)是否相等。 步驟與單樣本基本相同 ,統(tǒng)計量和分布 都有所變化。 檢驗兩個方差是否相等檢驗兩個方差是否相等: F檢驗。 ) 1, 1( 2 2 2 1 nmF S S F 第三章統(tǒng)計推斷 檢驗兩個均值是否相等:檢驗兩個均值是否相等: l兩總體方差已知:u檢驗 若H0成立,則有: ) 1 , 0( 2 2 2 1 2121 N nm XX u ) 1 , 0( 2 2 1 21 N nm XX u 第三章統(tǒng)計推斷 兩總體方差未知,但它們相等(相當于第 一步F檢驗已通過的情況):t檢驗。 在H0:1=2成立的條件下

11、,有: n = m時,可簡化為: ) 2( ) 11 ( 2 ) 1() 1( 2 2 2 1 21 nmt nmnm SnSm XX t )22( )( 1 2 2 2 1 21 nT SS n XX t 第三章統(tǒng)計推斷 兩總體方差未知,且不等(相當于第一 步F檢驗未通過的情況):近似t檢驗。 近似服從t分布,其自由度為: 其中 n S m S XX t 2 2 2 1 21 1 22 ) 1 )(1 1 (df )( 2 2 2 1 2 1 n S m S m S k 第三章統(tǒng)計推斷 配對數(shù)據(jù)檢驗步驟 配對數(shù)據(jù):每對材料各種條件盡可能一 致,然后分別作不同處理。 檢驗方法:取每對材料測量值

12、的差為統(tǒng) 計對象,進行單樣本檢驗。H0 : d = 0 配對法與成組法的比較: iii iiii i ii i iid xxxxxxxx xxxx xxxxSn )()(2)()( )()( )()() 1( 2211 2 22 2 11 2 2211 2 2121 2 第三章統(tǒng)計推斷 由于 所以有 i i xx n S 2 11 2 1 )( 1 12 22 2 2 )( 1 1 i i xx n S 2 2 2 1 221112 )( )( 1 1 SSr xxxx n S i i i 2 2 2 1 2 2 2 1 2 2SSrSSS d 第三章統(tǒng)計推斷 百分數(shù)的檢驗 用途:檢驗大樣本、

13、兩點分布總體中概率p 是否相同 模型: ,欲檢驗H0: p1 = p2 方法:由中心極限定理,若H0成立, 應有: 故有: 近似服從N(0,1) 2 2 2 1 1 1 , n x p n x p pq nn xx p nn qpNpp1,), 11 ( , 0( 21 21 21 21 且近似服從 ) 11 ( 21 21 nn qp pp u 第三章統(tǒng)計推斷 3.4 3.4 參量估計參量估計 點估計:利用樣本構造一個統(tǒng)計量,用 它來作為總體參數(shù)的估計值。 l無偏性:即要求估計量的數(shù)學期望應等于所 求的總體參數(shù)。 l有效性:當樣本含量n相同時,方差小的估 計量稱為更有效。 l一致性。設Tn(

14、x1, x2, xn)為參數(shù)的估計量, 若對任意 0, 有 則稱Tn為的一致估計量。 0)(lim n n TP 第三章統(tǒng)計推斷 .點估計常用方法: l矩估計:總體分布的各階原點矩可視為參數(shù)1, 2,r的函數(shù)。用樣本的前r 階原點矩作為總 體分布的前r階原點矩的估計值,則可得到r個方 程,從而可解出各參數(shù)。 l極大似然估計 :定義樣本似然函數(shù)為: L(x1, x2, xn ;)= f (x1,) f (x2,) f (xn,)對于 一組固定的樣本觀測值x1 , x2 , xn來說,L是參 數(shù)的函數(shù)。使L達到極大的的取值就稱為該參 數(shù)的極大似然估計。它應滿足以下的似然方程: 0 )(ln d L

15、d 第三章統(tǒng)計推斷 區(qū)間估計 目標:確定未知參數(shù)以給定概率落入其 中的區(qū)間的邊界。 參數(shù)落入置信區(qū)間的概率稱為置信水平, 等于1。 正態(tài)總體與2的置信區(qū)間:根據(jù)接受域 對未知參量解不等式,即得到所求的置 信區(qū)間。 第三章統(tǒng)計推斷 二項分布中P的置信區(qū)間 : ln30, 且0.1 x/n 30, 且x/n=0.9時,可采 用泊松近似。近似公式為: 式中 , 為 分布的分位數(shù),依單側或雙側區(qū)間a 可取值或 /2. 1, 0, 12 2 接近當 接近當 n x xn xn n x xn P L 2)(2 2 1 ),2( 2 1 2 1 2 xnx aa 2 1 2 aa 和 2 第三章統(tǒng)計推斷 正

16、態(tài)總體區(qū)間估計 與顯著性檢驗的關系 來自于同一不等式,結果是一致的。 直觀上有一定差異。顯著性檢驗是把 H0:=0視為固定常數(shù),依據(jù)它建立理論 分布,再來判斷實際觀察值是否小概率 事件;區(qū)間估計則是把觀察值視為最可 能的的取值(點估計),再以它為中心建 立一個區(qū)間,并給出母體參數(shù)落入這一 區(qū)間的概率(置信水平)。 第三章統(tǒng)計推斷 3.5 非參數(shù)檢驗 : 2 2檢驗檢驗 Pearson定理:當(P1,P2,Pr)是總 體的真實概率分布時,統(tǒng)計量 隨n的增加漸近于自由度為r-1的2分布。 r i i ii np npn 1 2 2 )( 第三章統(tǒng)計推斷 Pearson統(tǒng)計量的另一種形式: 顯然,上

17、述數(shù)據(jù)應滿足: 使用條件: l各理論值均大于5。 l若自由度為1,則應作連續(xù)性矯正: r i i ii T TO 1 2 2 )( r i i r i i pnO 11 1, r i i ii T TO 1 2 2 )5 . 0( 第三章統(tǒng)計推斷 Pearson統(tǒng)計量只用上單側檢驗。 Pearson統(tǒng)計量的應用 : l吻合度檢驗:用于檢驗總體是否服從 某個指定分布。 l列聯(lián)表的獨立性檢驗 :用于檢驗兩個 事件是否獨立 。 注意當理論分布中用到估計量時, Pearson統(tǒng)計量的自由度應相應變化 第三章統(tǒng)計推斷 吻合度檢驗 方法為: l把x的值域分為r個不相重合的區(qū)間,再 計算在指定的分布下,x落

18、入每一區(qū)間 的概率pi l統(tǒng)計樣本含量為n的抽樣中,觀察值落 入各區(qū)間的次數(shù)Oi l用Pearson統(tǒng)計量進行檢驗 第三章統(tǒng)計推斷 列聯(lián)表的獨立性檢驗 例3.22 下表是對某種藥的試驗結果: 問給藥方式對藥效果是否有影響? 給藥方式有效無效 口服5840 注射6431 第三章統(tǒng)計推斷 算法:理論值Ti = (行總數(shù)列總數(shù))/總數(shù), 然后可用Pearson統(tǒng)計量對H0: OT = 0 (或行與列獨立)進行檢驗。 自由度:(總行數(shù)1)(總列數(shù)1)。 特殊單側檢驗:用2 分位數(shù)。 第三章統(tǒng)計推斷 離散分布的統(tǒng)計檢驗 離散分布尾區(qū)建立原則離散分布尾區(qū)建立原則:從實際觀察值 開始,把對H0成立不利的方向

19、上的概率 全加起來,作為尾區(qū)的概率。 第三章統(tǒng)計推斷 22列聯(lián)表的精確檢驗 22列聯(lián)表概率的計算方法列聯(lián)表概率的計算方法:設4個格的 取值分別為:a,b,c,d。令N=a+b+c+d, 事件E為保持各行,列總數(shù)不變,事件F 為各格取值為a,b,c,d,則有: ! )!()!()!()!( )( )( )( )( )( dcbaN dbcadcba CC CCC EP FP EP EFP EFP ca N ba N c dc b dcb a N 第三章統(tǒng)計推斷 尾區(qū)建立方法: l若a,b,c,d中任何一個為0,則可用上式算出 的P值與或/2比較。 l若各格取值均不為0,按離散分布建立尾區(qū), 進行

20、統(tǒng)計檢驗。 第三章統(tǒng)計推斷 3.6 3.6 非參數(shù)檢驗非參數(shù)檢驗 共同特點: l不要求總體服從正態(tài)分布。 l??捎糜诙ㄐ詳?shù)據(jù)。 秩和檢驗秩和檢驗 符號檢驗符號檢驗 游程檢驗游程檢驗 秩相關檢驗秩相關檢驗 第三章統(tǒng)計推斷 秩和檢驗秩和檢驗 用途:檢驗兩組或多組數(shù)據(jù)平均數(shù)是否 相等。 與t檢驗的不同點:不要求正態(tài)母體,只 要求樣本互相獨立。 方法:把全部數(shù)據(jù)放在一起,從小到大 排列,每個數(shù)據(jù)的位置編號就稱為秩。 然后再把數(shù)據(jù)按處理的不同分開,分別 計算各處理的秩和,并以它為統(tǒng)計量。 第三章統(tǒng)計推斷 兩總體秩和檢驗:H0:各處理效應相同。 P(n個秩的和為某值)= 當n時,T漸近正態(tài)分布 多總體秩和檢驗 l要求:每個總體的樣本含量ni5, 總樣本含量N15

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論