統(tǒng)計學第四章_第1頁
統(tǒng)計學第四章_第2頁
統(tǒng)計學第四章_第3頁
統(tǒng)計學第四章_第4頁
統(tǒng)計學第四章_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、第四章 推斷統(tǒng)計概述第一部分 概率論基本知識 一、概率的定義;二、概率的性質(zhì);三、概率的加法定理和乘法定理 四、概率分布類型四、概率分布類型 概率分布(probability distribution)是指對隨機變量取不同值時的概率的描述,一般用概率分布函數(shù)進行描述。 依不同的標準,對概率分布可作不同的分類。、離散型分布與連續(xù)型分布 依隨機變量的類型,可將概率分布分為離散型概率分布與連續(xù)型概率分布。 教育統(tǒng)計學中最常用的離散型分布是二項分布,最常用的連續(xù)型分布是正態(tài)分布。 、經(jīng)驗分布與理論分布 依分布函數(shù)的來源,可將概率分布分為經(jīng)驗分布與理論分布。 經(jīng)驗分布(empirical distrib

2、ution)是指根據(jù)觀察或?qū)嶒炈@得的數(shù)據(jù)而編制的次數(shù)分布或相對頻率分布。 理論分布(theoretical distribution)是按某種數(shù)學模型計算出的概率分布。 、基本隨機變量分布與抽樣分布 依所描述的數(shù)據(jù)的樣本特性,可將概率分布分為基本隨機變量分布與抽樣分布(sampling distribution)。 基本隨機變量分布是隨機變量各種不同取值情況的概率分布, 抽樣分布是從同一總體內(nèi)抽取的不同樣本的統(tǒng)計量的概率分布。第二部分 幾種常見的概率分布 一、二項分布 二項分布(binomial distribution)是一種具有廣泛用途的離散型隨機變量的概率分布,它是由貝努里創(chuàng)始的,因此

3、又稱為貝努里分布。 2二項分布函數(shù) 二項分布是一種離散型隨機變量的概率分布。 用 n 次方的二項展開式來表達在 n 次二項試驗中成功事件出現(xiàn)的不同次數(shù)(X0,1,n)的概率分布,叫做二項分布函數(shù)。 二項展開式的通式(即二項分布函數(shù)): 成功概率 p;樣本容量 n 在成功概率為p的總體中隨機抽樣,抽取樣本容量為n的樣本中,有X次為成功的概率: (X0,1,n) 稱X服從參數(shù)為n,p的二項分布,記為: XB(n,p) 其中,0p1 二項分布的性質(zhì) 二項分布有如下性質(zhì): 當p=q時,圖形是對稱的。 當pq時,直方圖呈偏態(tài)。pq與pq時的偏斜方向相反。 3二項分布的平均數(shù)和標準差 如果二項分布滿足pq

4、且 nq5(或者pq且 np5時,二項分布接近于正態(tài)分布??捎孟旅娴姆椒ㄓ嬎愣椃植嫉钠骄鶖?shù)和標準差。 二項分布的平均數(shù)為 二項分布的標準差為 4二項分布的應用 二項分布函數(shù)除了用來求成功事件恰好出現(xiàn)X次的概率之外,在教育中主要用來判斷試驗結(jié)果的機遇性與真實性的界限。 一個學生憑猜測做10個是非題,平均可以猜對5題。什么情況下可以說他是真會而不是猜測呢? 解:猜對與猜錯的概率:p=q=1/2。 猜對8的概率為0.044 猜對9題的概率為0.010 猜對10題的概率為0.001 猜對8題以上的概率為:0.044+0.010+0.001=0.055 一個教師對8個學生的作業(yè)成績進行猜測,如果教師猜

5、對的可能性為13,問: 平均能猜對幾個學生的成績? 假如規(guī)定猜對95,才算這個教師有一定的評判能力,那么這個教師至少要猜對幾個學生? (1)( 2) 這個教師至少要猜對5個學生,才有一定的評判能力正態(tài)分布 正態(tài)分布(normal distribution)也稱為常態(tài)分布,是連續(xù)型隨機變量概率分布的一種,是在數(shù)理統(tǒng)計的理論與實際應用中占有最重要地位的一種理論分布。 正態(tài)分布由棣莫弗于1733年發(fā)現(xiàn)的。拉普拉斯、高斯對正態(tài)分布的研究也做出了貢獻,故有時稱正態(tài)分布為高斯分布。1.正態(tài)分布曲線函數(shù)正態(tài)分布曲線函數(shù)又稱概率密度函數(shù)(即方程),其一般公式為公式所描述的正態(tài)曲線,由和兩個參數(shù)決定。XN(m,

6、s2), 將N改為頻率,正態(tài)曲線形態(tài)不變。正態(tài)曲線的特征 關于x=對稱。在x=處取得該概率密度函數(shù)的最大值,在 處有拐點,表現(xiàn)為鐘形曲線。 決定曲線在橫軸上的位置, 增大,曲線沿橫軸向右移;反之, 減小,曲線沿橫軸向左移。 決定曲線的形狀,當 恒定時, 越大,數(shù)據(jù)越分散,曲線越“矮胖”; 越小, 數(shù)據(jù)越集中,曲線越瘦高。曲線下面積為1。 正態(tài)曲線下的面積規(guī)律 正態(tài)曲線關于均數(shù)對稱;對稱的區(qū)域內(nèi)面積相等; 對任意正態(tài)曲線,按標準差為單位,對應的面積相等;正態(tài)曲線下面積的含義m-1.64s m+1.64s內(nèi)面積為90%; m-1.96s m+1.96s內(nèi)面積為95%; m-2.58s m+2.58

7、s內(nèi)面積為99%。 1.曲線下面積是全體數(shù)據(jù)落入某區(qū)間的概率; 2.曲線下面積是落入某區(qū)間的數(shù)據(jù)占全體數(shù)據(jù)的比例標準正態(tài)分布曲線將標準分數(shù)代入正態(tài)曲線函數(shù),則公式變換為標準正態(tài)分布函數(shù): 以為橫坐標,以為縱坐標,可繪制標準正態(tài)分布曲線。 標準正態(tài)分布曲線的縱線高度為概率密度,曲線下的面積為概率。3標準正態(tài)分布曲線的特點 曲線在處達到最高點 曲線以處為中心,雙側(cè)對稱 曲線從最高點向左右緩慢下降,向兩側(cè)無限延伸,但永不與基線相交。 標準正態(tài)分布曲線的平均數(shù)為,標準差為。 從3至3之間幾乎分布著全部數(shù)據(jù)(99.73%)。 曲線的拐點為正負一個標準差處。4.正態(tài)曲線的面積與縱線 1)累積正態(tài)分布函數(shù)

8、正態(tài)曲線與基線之間某一區(qū)間的面積,相當于能在該區(qū)間找到個體的概率。曲線下的面積,即累積概率是用積分表示的。 累積正態(tài)分布函數(shù)是:2)標準正態(tài)曲線下面積的求法 利用積分公式可求出正態(tài)曲線下任何區(qū)間的面積,但需要計算,非常麻煩。 統(tǒng)計學家已編制好了標準正態(tài)分布表,使用非常方便。 2)已知曲線下面積求Z值 求Z=0以上或以下某一面積相對應的Z值 求與正態(tài)曲線上端或下端某一面積相對應的Z值 求與正態(tài)曲線下中央部位某一面積相對應的Z值3)正態(tài)曲線的縱線 正態(tài)曲線的縱線高度Y是橫軸上某一Z值的頻率密度(即概率) (1)已知Z值求縱線高度 (2)已知面積求縱線高度三、正態(tài)分布的應用1以標準分數(shù)表示考試成績

9、比較學生的考試成績時,使用原始分數(shù)不合理 原始分制度沒有提示考生成績在考生團體成績中的位置。 由于各科命題難度不同,導致各科原始分之間不能直接比較,造成分數(shù)解釋上的困難。 各科原始分相加不合理。 2確定等級評定的人數(shù) 例:若有100人某種能力呈正態(tài)分布,欲將其分成五個等距的等級,問各等級應有多少人? 解:65=1.2。 每個等級應占1.2個標準差的距離。3、確定錄取分數(shù)線 例:某項職業(yè)錄取考試,準備在參加的1600考生中錄取200人,考試分數(shù)分布接近正態(tài)分布,平均分數(shù)為74,標準差為11,問錄取分數(shù)線是多少? 解:將200/1600=0.125作為正態(tài)分布上端的面積。 P=0.5-0.125=

10、0.375,則Z=1.15 錄取分數(shù)線為4.確定正態(tài)分布下特定分數(shù)段內(nèi)的人數(shù)或某面積下(或人數(shù))的分數(shù)段 例1:某地區(qū)某年高考物理科考生4.7萬,平均分為57.08,標準差為18.04。試問: 成績在90分以上有多少人? 成績在80分到90分之間有多少人? 成績在60分以下有多少人?解:先算出90分、80分、60分的標準分數(shù)。例2:某次測驗分數(shù)為正態(tài)分布,其平均分為72分,標準差為6分,問:95%的學生分數(shù)落在平均數(shù)上下多少分中間?99%的學生分數(shù)落在平均數(shù)上下多少分中間解:將95%和99%看作是正態(tài)曲線中央部分的面積。則, 第三部分 抽樣分布的基本原理一、抽樣的基本概念 1.總體與抽樣 2.

11、抽樣的基本方法1) 簡單隨機抽樣 2)等距抽樣 3)分層隨機抽樣二、抽樣分布區(qū)分三種不同性質(zhì)的分布: 總體分布:總體內(nèi)個體數(shù)值的頻數(shù)分布 樣本分布:樣本內(nèi)個體數(shù)值的頻數(shù)分布 抽樣分布:某一種統(tǒng)計量的概率分布1. 抽樣分布的概念2平均數(shù)抽樣分布的幾個定理(中心極限定理) 從總體中隨機抽出容量為n的一切可能樣本的平均數(shù)之平均數(shù)等于總體的平均數(shù)。 容量為n的平均數(shù)在抽樣分布上的標準差(即平均數(shù)的標準誤),等于總體標準差除以n的平方根。從正態(tài)總體中,隨機抽取的容量為n的一切可能樣本平均數(shù)的分布也呈正態(tài)分布;雖然總體不呈正態(tài)分布,如果樣本容量較大,也接近于正態(tài)分布二、標準誤 某種統(tǒng)計量在抽樣分布上的標準

12、差,稱為標準誤。如:平均數(shù)抽樣分布的標準差稱為平均數(shù)的標準誤;標準差抽樣分布的標準差稱為標準差的標準誤。 標準誤用來衡量抽樣誤差。 標準誤越小,表明樣本統(tǒng)計量與總體參數(shù)的值越接近,樣本對總體越有代表性,用樣本統(tǒng)計量推斷總體參數(shù)的可靠度越大。 因此,標準誤是統(tǒng)計推斷可靠性的指標平均數(shù)標準誤的計算1總體正態(tài),總體標準差已知(不管樣本容量大小),或總體非正態(tài),總體標準差已知,大樣本 平均數(shù)的標準誤為:平均數(shù)標準誤的計算2總體正態(tài),總體標準差未知(不管樣本容量大小),或總體非正態(tài),總體標準差未知,大樣本。當總體標準差未知,需要用樣本標準差來估計。 總體標準差的無偏估計量:平均數(shù)標準誤為: , 因為未知

13、,用S代替:因此,平均數(shù)標準誤的估計值為三平均數(shù)離差統(tǒng)計量的分布由樣本的平均數(shù)對總體平均數(shù)進行估計,首先要了解平均數(shù)離差統(tǒng)計量的分布,才能根據(jù)一定的概率,由樣本的平均數(shù)對總體的平均數(shù)做出估計1總體正態(tài),已知(不管樣本容量大?。?, 或總體非正態(tài),已知,大樣本平均數(shù)離差的抽樣分布呈正態(tài)分布2總體正態(tài),未知(不管樣本容量大小),或總體非正態(tài),未知,大樣本 平均數(shù)離差的抽樣分布呈t分布t分布的特點形狀與正態(tài)分布曲線相似t分布曲線隨自由度不同而有一簇曲線自由度的計算:自由度是指能夠獨立變化的數(shù)據(jù)個數(shù)或總體參數(shù)估計中變量值能夠獨立變化的個數(shù)。查t分布表時,需根據(jù)自由度及相應的顯著性水平,并要注意是單側(cè)數(shù)據(jù)

14、還是雙側(cè)。有關自由度的其他說明 統(tǒng)計學中:在統(tǒng)計模型中,自由度指樣本中可以自由變動的變量的個數(shù),當有約束條件時,自由度減少。 自由度計算公式:自由度=樣本個數(shù)-樣本數(shù)據(jù)受約束條件的個數(shù),即df = n - k(df自由度,n樣本個數(shù),k約束條件個數(shù))t分布表的查法 自由度df,t值和概率(面積或顯著性水平) 3總體未知,大樣本時的近似處理 樣本容量增大后,平均數(shù)的抽樣分布接近于正態(tài)分布,可用正態(tài)分布近似處理。 (注意:此時的分布仍然是t分布) 第四部分 參數(shù)估計的基本原理 根據(jù)樣本統(tǒng)計量對相應總體參數(shù)所作的估計叫作總體參數(shù)估計。 總體參數(shù)估計分為點估計和區(qū)間估計。 由樣本的標準差估計總體的標準

15、差即為點估計;而由樣本的平均數(shù)估計總體平均數(shù)的取值范圍則為區(qū)間估計2.區(qū)間估計 以樣本統(tǒng)計量的抽樣分布(概率分布)為理論依據(jù),按一定概率的要求,由樣本統(tǒng)計量的值估計總體參數(shù)值的所在范圍,稱為總體參數(shù)的區(qū)間估計。 對總體參數(shù)值進行區(qū)間估計,就是要在一定可靠度上求出總體參數(shù)的置信區(qū)間的上下限計算要求: 要知道與所要估計的參數(shù)相對應的樣本統(tǒng)計量的值,以及樣本統(tǒng)計量的理論分布; 要求出該種統(tǒng)計量的標準誤; 要確定在多大的可靠度(或置信度)上對總體參數(shù)作估計,再通過某種理論概率分布表,找出與某種可靠度相對應的該分布橫軸上記分的臨界值,才能計算出總體參數(shù)的置信區(qū)間的上下限。 置信區(qū)間(confidence

16、 interval) 置信度或可靠度,即置信概率,是作出某種推斷時正確的可能性(概率),即1-。 顯著性水平: 置信區(qū)間,也稱置信間距,是指在某一置信度時,總體參數(shù)所在的區(qū)域距離或區(qū)域長度。置信區(qū)間是帶有置信概率的取值區(qū)間。顯著性水平(significance level 對總體平均數(shù)進行區(qū)間估計時,置信概率表示做出正確推斷的可能性,但這種估計還是會有犯錯誤的可能。 顯著性水平就是指估計總體參數(shù)落在某一區(qū)間時,可能犯錯誤的概率,用符號表示。 .平均數(shù)區(qū)間估計的基本原理 通過樣本的平均數(shù)估計總體的平均數(shù) 首先假定該樣本是隨機取自一個正態(tài)分布的總體(或非正態(tài)總體中的n30的樣本),而計算出來的實際

17、平均數(shù)是無數(shù)容量為n的樣本平均數(shù)中的一個。 根據(jù)樣本平均數(shù)的分布理論,可以對總體平均數(shù)進行估計,并以概率說明其正確的可能性總體平均數(shù)的區(qū)間估計1總體平均數(shù)區(qū)間估計的基本步驟根據(jù)樣本的數(shù)據(jù),計算樣本的平均數(shù)和標準差;計算平均數(shù)抽樣分布的標準誤;確定置信概率或顯著性水平;根據(jù)樣本平均數(shù)的抽樣分布確定查何種統(tǒng)計表;計算置信區(qū)間;解釋總體平均數(shù)的置信區(qū)間。2平均數(shù)區(qū)間估計的計算總體正態(tài),已知(不管樣本容量大?。蚩傮w非正態(tài),已知,大樣本 2平均數(shù)區(qū)間估計的計算 平均數(shù)離差的的抽樣分布呈正態(tài),平均數(shù)的置信區(qū)間為:=0.05時,總體平均數(shù)區(qū)間估計為 =0.01時,總體平均數(shù)區(qū)間估計為例題:某小學10歲全

18、體女童身高歷年來標準差為6.25厘米,現(xiàn)從該校隨機抽27名10歲女童,測得平均身高為134.2厘米,試估計該校10歲全體女童平均身高的95和99置信區(qū)間。 解:10歲女童的身高假定是從正態(tài)總體中抽出的隨機樣本,并已知總體標準差為=6.25。無論樣本容量大小,一切樣本平均數(shù)的標準分數(shù)呈正態(tài)分布。于是可用正態(tài)分布來估計該校10歲女童身高總體平均數(shù)95和99的置信區(qū)間。其標準誤為當0.95時,1.96因此,該校10歲女童平均身高95的置信區(qū)間為: 當0.99時,2.58因此,該校10歲女童平均身高99的置信區(qū)間為: 總體正態(tài),未知(不管樣本容量大?。?,或總體非正態(tài),未知,大樣本平均數(shù)離差的抽樣分布為

19、t分布,平均數(shù)的置信區(qū)間為:例題2:從某小學三年級隨機抽取12名學生,其閱讀能力得分為28,32,36,22,34,30,33,25,31,33,29,26。試估計該校三年級學生閱讀能力總體平均數(shù)95和99的置信區(qū)間。 解:12名學生閱讀能力的得分假定是從正態(tài)總體中抽出的隨機樣本,而總體標準差未知,樣本的容量較?。?1230),t分布接近于正態(tài)分布,因此可用正態(tài)分布近似處理。樣本標準差:當0.95時,1.96因此,該年全部考生作文成績95的置信區(qū)間為:當0.99時,2.58因此,該年全部考生作文成績99的置信區(qū)間為: 總體非正態(tài),小樣本 不能進行參數(shù)估計,即不能根據(jù)樣本分布對總體平均數(shù)進行估計

20、。第五部分 假設檢驗的基本原理 利用樣本信息,根據(jù)一定概率,對總體參數(shù)或分布的某一假設作出拒絕或保留的決斷,稱為假設檢驗。1假設 假設檢驗一般有兩個互相對立的假設。 H0:零假設,或稱原假設、虛無假設(null hypothesis)、解消假設;是要檢驗的對象之間沒有差異的假設。 H1:備擇假設(alternative hypothesis),或稱研究假設、對立假設;是與零假設相對立的假設,即存在差異的假設。假設檢驗 進行假設檢驗時,一般是從零假設出發(fā),以樣本與總體無差異的條件計算統(tǒng)計量的值,并分析計算結(jié)果在抽樣分布上的概率,根據(jù)相應的概率判斷應接受零假設、拒絕研究假設還是拒絕零假設、接受研究假設。2小概率事件 樣本統(tǒng)計量的值在其抽樣分布上出現(xiàn)的概率小于或等于事先規(guī)定的水平,這時就認為小概率事件發(fā)生了。把出現(xiàn)概率很小的隨機事件稱為小概率事件。當概率足夠小時,可以作為從實際可能性上把零假設加以否定的理由。因為根據(jù)這個原理認為:在隨機抽樣的條件下,一次實驗竟然抽到與總

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論