應用統(tǒng)計方法(2014)-隨機變量與統(tǒng)計量_第1頁
應用統(tǒng)計方法(2014)-隨機變量與統(tǒng)計量_第2頁
應用統(tǒng)計方法(2014)-隨機變量與統(tǒng)計量_第3頁
應用統(tǒng)計方法(2014)-隨機變量與統(tǒng)計量_第4頁
應用統(tǒng)計方法(2014)-隨機變量與統(tǒng)計量_第5頁
已閱讀5頁,還剩32頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 第七章 應用統(tǒng)計方法應用統(tǒng)計方法包括概率論與數(shù)理統(tǒng)計兩個部分,其中概率論是研究隨機(或偶然)現(xiàn)象的統(tǒng)計規(guī)律性,數(shù)理統(tǒng)計是研究隨機數(shù)據(jù)的收集、整理、分析和推斷的方法。統(tǒng)計方法在科學研究與工程技術中具有廣泛的應用:如,面對大量的信息與數(shù)據(jù),如何分析處理,找出數(shù)據(jù)反映的規(guī)律和模型;在研制一種新產品時,影響產品的性能與質量的因素非常多,如何科學的安排試驗,才能找出影響性能的主要因素以及它們的數(shù)量關系,以降低成本,縮短研制時間;工廠每天生產一大批產品,如何進行質量管理與控制,如何預測未來產品的銷售量等等。數(shù)理統(tǒng)計將為這些問題提供具有啟發(fā)性的思維方法與強有力的工具。第一節(jié) 常用的隨機變量與統(tǒng)計量(1-2

2、)1隨機變量及其分布11隨機變量 隨機變量是概率論中的一個重要概念,所謂隨機變量就是隨試驗結果不同而能取不同值的變量,由于試驗結果的隨機性,故取值具有隨機性,稱其為隨機變量。 通常用大寫字母X,Y,Z等表示隨機變量,而用小寫字母x,y,z等表示隨機變量相應于某個試驗結果的值,又稱隨機變量的觀測值。隨機變量與實數(shù)間雖然沒有“自然”的聯(lián)系,但可以人為地給它們建立起一個對應關系。 引入隨機變量后,隨機試驗中各個事件就可以通過隨機變量的取值表達出來,如“在n重伯努利試驗中事件A出現(xiàn)的次數(shù)不超過2”的事件可用X£2表示;再如,在抽查新生嬰兒性別的試驗中“抽到男嬰”的時間可用Y=1表示。下面給隨

3、機變量一個確切的定義: 定義:設隨機試驗E的樣本空間為W,若存在一個函數(shù)X=X(w),對于每個,均有唯一確定的實數(shù)X(w)與之對應,則稱X=X(w)為一個隨機變量。 對于隨機變量,我們主要討論離散型隨機變量和連續(xù)型隨機變量兩大類。12離散型隨機變量的概率分布 在有些試驗中,隨機變量可能取到的值是有限個或可列無限個,這類隨機變量通常稱為離散型隨機變量。例1:設一實驗箱中裝有標號依次為-1,2,3,3,4五個形狀完全相同的白鼠,從中任取一只,則取到白鼠的標號X是一個隨機變量,它能取到-1,2,3,4四個值,它究竟取到哪個值,要隨試驗結果而定,故X是一個離散型隨機變量。例2:從一批次品為10%的產品

4、中逐漸抽取產品(有放回的),直到抽到次品為止,所需的抽取次數(shù)Y是一個隨機變量,它能取可列無窮多個值,所以Y也是一個離散型隨機變量。 再如n粒種子的發(fā)芽數(shù),n尾魚苗的成活數(shù)均為離散型隨機變量。 對于離散型隨機變量,我們除關心它取什么值之外,還應該搞清楚,它以多大的概率取這些值,即要了解其取值規(guī)律。 通常用表格來描述隨機變量X的取值規(guī)律,此表稱為離散型隨機變量的概率分布或分布率。一般的設隨機變量X的所有可能取值為(k=1,2,3,), X取這些值的概率,即事件PX=xk=pk, 則其概率分布為:XP 其中pk(k=1,2,3,)滿足條件:1) pk³ 0 (k=1,2,3,);2)只有p

5、k滿足上述兩個條件時,才能成為離散型隨機變量的分布;如例1的離散型隨機變量的概率分布分別為:X-1234P例2的離散型隨機變量的概率分布分別為:Y123kP0.10.9*0.1(0.9)2*0.1(0.9)k-1*0.1 離散型隨機變量的分布有兩點分布、二項分布、泊松分布、超幾何分布。下面分別進行介紹。121 兩點分布定義: 設隨機變量X只能取0,1兩個值,且P(X=1) = p, P(X=0) = 1- p ( 0 < p < 1)。即其分布律為:X10Pp1-p 則稱X服從參數(shù)為p的兩點分布或0-1分布。記作X0 1分布。 例;從裝有6只白球和4只紅球的口袋中任取一球,用X表示

6、“取到的白球數(shù)”,即X=1;表示取到白球; X=0; 表示取到紅球;P (X=1) = 0.6 P ( X=0 ) = 0.4一次試驗只有兩種可能結果的概率分布都可用兩點分布來描述。如在射擊中只考慮“命中”與“未命中”;對產品進行檢驗時,只關心產品“合格”與“不合格”等,都可用兩點分布來研究。122 二項分布定義:若隨機變量X的分布為 其中0<p<1, 則稱X服從參數(shù)為n,p的二項分布,又稱伯努利分布,記作XB(n,p)考慮二項分布: 按二項式展開,它的第k項為 ,當q=1-p時上式特別當n=1時,二項分布即化為兩點分布,這時, 例3:某小麥品種在田間出現(xiàn)自然變異植株的概率為0.0

7、045, 今調查100株,試計算獲得兩株和兩株以上變異植株的概率。解:用A表示“該株小麥出現(xiàn)自然變異”的事件,而用表示“該株小麥不出現(xiàn)自然變異”的事件。用X表示所調查的100株中出現(xiàn)自然變異的株數(shù),顯然XB(100, 0.0045)。于是獲得兩株和兩株以上變異植株的概率其中故有例4:有2500名從事某種職業(yè)的職工參加人壽保險,根據(jù)資料統(tǒng)計,這類人在一年內的死亡率為0.002。參加保險者當年向保險公司付12元保險費。若參加保險者死亡,家屬可獲得2000元補償,試求下列事件的概率。(1)一年中保險公司虧本;(2)一年中保險公司獲利不少于1萬元;(3)一年中保險公司獲利超過2萬元。解:保險公司的年收

8、入為30000元,在不考慮這筆保險金的利息的收入和保險業(yè)務的各項支出的情況下來考慮上述三個問題。 用X表示一年中參加保險死亡人數(shù),顯然 故解(1):若保險公司虧本,必須使X>15,故 (查泊松分布表,l=np=5) 結果表明,保險公司一年中虧本的概率很小,幾乎是不可能的。解(2):若公司獲利不少于1萬元,必須滿足故解(3):獲利超過2萬元,即滿足 X< 5 以上計算中用到下列Poisson近似公式來計算的近似值;其中:123泊松分布定義:若隨機變量X的分布為 其中,則稱X服從參數(shù)為的泊松分布,記為。泊松分布作為二項分布的近似,是法國數(shù)學家泊松于1837年引入的。在實際生活中,有很多

9、隨機變量服從泊松分布。如田間出現(xiàn)變異植株的株數(shù)、牧草種子中的雜草種子數(shù)、某段時間內放射性物質所放射的粒子數(shù)等,均可用泊松分布來描述。泊松分布是描述在一定空間(長度、面積和體積)或者在一定時間間隔內點子的散步狀態(tài)的理想化模型。例5:麥田中,平均每10平方米有一株雜草,現(xiàn)在問每100平方米麥田中無雜草、有一株雜草、以及有5株以上雜草的概率各為多少?解:該問題是研究一定面積內雜草散步狀態(tài)的,而一定面積內的雜草株數(shù)服從泊松分布?,F(xiàn)求每 100平方米 麥田中平均雜草數(shù)(這里是泊松分布中參數(shù)的最佳估計,即)由此可以得出,每100平方米麥田中有x株雜草的概率 x=0時,得到每100平方米麥田中無雜草的概率x

10、=1時,得到每100平方米麥田中有1株雜草的概率而有5株以上雜草的概率為124 超幾何分布 定義:若一個隨機變量X的分布規(guī)律為: 則稱X服從超幾何分布,記為有N件產品,K件次品,抽取n件,出現(xiàn)x件次品的概率;分析:N件產品中,抽取n件的所有情況為 在n件產品中出現(xiàn)x件次品的所有情況為 在考察野生動物時,常常需要了解野生動物種群的大小,一種常用的方法是,先捕捉一定數(shù)量的動物,作上記號,放回到原群體中。然后,再捕捉第二個樣本,記下其中有標記的動物數(shù)。根據(jù)以上資料可以估計該群種的大小。原理是;在捕捉第二個樣本時,捉到有標記的動物數(shù),是一個服從超幾何的隨機變量;再依據(jù)超幾何分布的平均數(shù),就可以估計該群

11、種的大小。N為種群所含個數(shù)的總體,K為有記號的個體數(shù),n為第二次抽樣中抽出的個體數(shù),x為容量為n的樣本中(即第二次抽樣中)有標記的個體數(shù)??梢宰C明,超幾何分布的平均數(shù)(或稱數(shù)學期望)如下:于是可以得出估計該群種大小的公式:1 3連續(xù)型隨機變量及其分布密度前面研究的離散型隨機變量的取值只限于有限或可列無窮多個值,具有很大的局限性,在許多隨機試驗中,如測量某種無線電元件的壽命、觀測某品種小麥的株高等,它們的取值充滿某個區(qū)間。對于這類可以在某個區(qū)間或整個數(shù)軸上取值的隨機變量,由于其取值不是集中在有限個或可列無窮多個點上,所以不能象離散型隨機變量那樣通過建立概率分布來描述它們。我們只有掌握了X取值落入

12、某個區(qū)間的概率,才能真正了解隨機變量X的取值規(guī)律。 定義: 對于隨機變量X,若存在非負可積函數(shù)使對于任意實數(shù)a, b(a<b)均有: 則稱X為連續(xù)型隨機變量,稱為X的分布密度或稱為概率密度。 分布密度與概率分布有類似的性質:(1)f(x)³0;(2) 例6: 設連續(xù)型隨機變量X的分布密度為試求:(1)常數(shù)k; (2)P(1<X<3) ; P(X<1)解(1) 由分布密度的性質得; (2)(3)下面介紹幾種常見的連續(xù)型分布。131 均勻分布定義: 若隨機變量X的分布密度為則稱X在區(qū)間a,b上服從均勻分布,記作顯然:(1)(2)若X在區(qū)間a,b上服從均勻分布,則對

13、于任意滿足a<c<d<b的c, d,均有這表明X在區(qū)間a,b的任一區(qū)間c,d內取值的概率與該區(qū)間的長度成正比,而與區(qū)間所處的位置無關。例7:公共汽車站每隔10分鐘有一輛汽車通過,乘客在任一時刻到達公共汽車站都是可能的,求乘客候車不超過2分鐘的概率。解:設乘客到達公共汽車站的時刻為T,乘客到站后,來站的第一輛汽車抵達時刻為t0。依題意,隨機變量T在t0-10,t0內服從均勻分布,即分布密度為“乘客候車不超過2分鐘”的事件,就是落入t0-2,t0的事件,其概率13,2 指數(shù)分布定義:若隨機變量X的分布密度為其中: 是常數(shù),則稱X服從參數(shù)為的指數(shù)分布,記為顯然:(1)(2) 指數(shù)分

14、布有著重要應用,如無限電元件的壽命、動植物的壽命,以及隨機服務系統(tǒng)中的服務時間等都可用指數(shù)分布來描述。例8: 設某種燈泡的使用壽命為X,其分布密度為(),求此種燈泡使用超過100小時的概率:解:133 正態(tài)分布在生產實踐和科學研究中所遇到的隨機變量,大量的服從或近似服從正態(tài)分布,如測量誤差,植株的高度,各種產品的質量指標(如零件的尺寸、材料的強度)動物的體重、人的高度、健康人紅細胞的數(shù)目、年降雨量、某班學生的考試成績等等。定義: 設隨機變量X的分布密度為其中和(是兩個常數(shù),則稱X服從參數(shù)為和的正態(tài)分布,記作,通常又稱X為正態(tài)變量。y=f(x)的圖形是一條鐘形曲線,該曲線具有如下性質:(1) 關

15、于對稱,當時,f(x)取得最大值(2)曲線以x軸為水平漸近線;(3)若固定值,改變值,則曲線y=f(x)沿x軸方向平移,而曲線的形狀不變;若固定,改變值,值越大,曲線越平坦,值越小,曲線越尖峭;(4)特別當時,稱X服從標準正態(tài)分布,記作XN(0,1), 其分布密度為習題一1設隨機變量X的分布列為 k=1,2,3,4,5試求:(1)P(X=1或X=2); (2) ; (3) 2設隨機變量X只能取5,6,7,, 16這12個值,且取每個值的機會均等。試求: (1) (2); (3)3 在相同條件下,相互獨立地射擊五次,每次射中目標的概率為0.6,求命中目標的次數(shù)X的概率分布。4 進行某種試驗,設成

16、功的概率為,失敗的概率為,以X表示首次試驗成功所需要的次數(shù),求X的概率分布。5 設隨機變量X的概率密度為求:(1) (2) (3)6 設隨機變量X的概率密度為求: (1)常數(shù)k; (2)7 設隨機變量M服從0,10均勻分布,求方程:有實根的概率。8設隨機變量M服從參數(shù)為=1 的指數(shù)分布,求方程:無實根的概率。9 設隨機變量X的概率密度 試求: (1)常數(shù)C; (2) )10 設隨機變量X的分布函數(shù)試求相應的概率密度,并求。14隨機變量的分布函數(shù)與隨機變量函數(shù)的分布 (3-4)141 隨機變量的分布函數(shù) 對于離散型隨機變量和連續(xù)型隨機變量的概率分布,我們分別用分布律和分布密度來描述,實際上,還存

17、在一種用來描述各類隨機變量概率分布的統(tǒng)一形式,這就是隨機變量的分布函數(shù)。 定義:設X為一隨機變量,稱函數(shù)為隨機變量的分布函數(shù)。F(x)是一個定義域為全體實數(shù),值域為區(qū)間0,1的普遍函數(shù),它的引入將使許多概率問題轉化為函數(shù)問題,從而得到簡化。分布函數(shù)具有如下性質:(1) (2)F(x)是x的的單調不減函數(shù)、右連續(xù);(3)(4)若X是連續(xù)型隨機變量,它的分布密度為,則X的分布函數(shù)有微積分的知識可以得到如下結論:(1)F(x)是x的連續(xù)函數(shù);(2)對于密度函數(shù)f(x)的連續(xù)點,有F(x)=f(x)例1:離散型隨機變量其分布率如下:X-1234p1/51/52/51/5試求:(1)X的分布函數(shù);(2)

18、(3)解:(1)X的分布函數(shù)為;(2)(3)例2: 設X在區(qū)間a,b上服從均勻分布,求X的分布函數(shù),計算;解:X的分布密度為則X的分布函數(shù)為:142 隨機變量函數(shù)的分布在實際問題中,經常需要研究隨機變量函數(shù)的分布。隨機變量X的函數(shù)仍然是一個隨機變量。現(xiàn)在的問題是如何由X的概率分布求出Y的概率分布。1421 離散型隨機變量函數(shù)的分布 設已知離散型隨機變量X的分布率為Xx1x2xkPp1p2pk 當隨機變量X取得它的某一可能值xi時,其函數(shù)取值,則隨機變量Y的分布律為Yg(x1)g(x2)g(xk)Pp1p2pk例3:設隨機變量的分布律為X0123P5/3015/309/301/30求:(1) Y

19、=2X+1的分布律; (2) Y=(X-1)2的分布律解(1) Y=2X+1的分布律為Y=2X+11357P5/3015/309/301/30(2)Y=(X-1)2的分布律為Y=(X-1)21014P5/3015/309/301/30把Y=1的兩個概率相加,得到;Y=(X-1)2014P15/3014/301/301422 連續(xù)型隨機變量函數(shù)的分布 對于連續(xù)型隨機變量,我們要由隨機變量X的分布密度去求隨機變量的分布密度。例4: 設隨機變量X的分布密度為,求Y=kX+b的分布密度。解:設隨機變量X與Y的分布函數(shù)分別為和,則若k>0,即函數(shù)Y=kX+b為單調增函數(shù)時,有兩端對y求導,得到若k

20、<0,即函數(shù)Y=kX+b為單調減函數(shù)時,有兩端對y求導,得到綜上所述,不論k>0,還是k<0,均有15正態(tài)變量的標準化 為了解決正態(tài)分布的概率計算問題,書后附錄了標準正態(tài)分布的分布函數(shù)函數(shù)值表,稱為標準正態(tài)分布表,可供查閱。具有以下性質:(1)(2)(3)(4)故對于標準正態(tài)分布的概率計算,只需查表即可。對于一般正態(tài)分布的概率計算,可以通過定積分的換元積分法化成標準正態(tài)分布,然后查表。設,則有于是得到若用表示的分布函數(shù),令,則有例5:設分布,試求:P(1<X<2), P(÷X÷< 1), P(X£-1), 解:該問題為正態(tài)分布,

21、可以直接查表; (1) P(1<X<2) = F(2) F(1) = 0.9772 0.8413 = 0.1359 (2) P(÷X÷< 1) = P ( -1 < X < 1) = F(1) F(-1) = 2F(1) 1= 0.6826 (3)P(X£-1) = F(-1) = 1 F(1)= 1 0.8413 = 0.1587 (4) = 1 - P(X£ 1.54) = 2 2F(1.54)= 2 2*0.9382 = 0.1236 例6:設分布,試求: 解:該問題為一般正態(tài)分布,將其轉化為標準正態(tài)分布;(1)P(X

22、£ -3.5) = (2)P(1< X < 3) = (3)1 6隨機變量的數(shù)字特征隨機變量的數(shù)字特征,就是刻畫隨機變量的某種特征(如平均值、偏差程度)的量,它雖然不一定能完整地描述隨機變量,但在理論和實踐上都具有重要意義。比如在檢查燈泡的質量時,我們關心的是燈泡的平均壽命;在農業(yè)上我們只關心某作物的平均產量;在評定棉花質量時,我們主要關心纖維的平均長度,以及纖維長度與平均長度的偏差等。161 數(shù)學期望 定義:設離散型隨機變量X的分布律為, (k=1,2,)若級數(shù)絕對收斂,則稱級數(shù)為隨機變量X的數(shù)學期望,簡稱為期望或均值,記作E(X),即 定義:設連續(xù)型隨機變量X的分布密

23、度為,若積分絕對收斂,則稱此積分值為X的數(shù)學期望,記作E(X),即例1:設隨機變量X服從參數(shù)為的泊松分布,試求其數(shù)學期望。解:此處,故 例2:已知某電子元件的壽命X服從參數(shù)為的指數(shù)分布(單位:h),即其概率密度為求這類電子元件的平均壽命。解:因為,故即這類電子元件的平均壽命為1000小時。162 隨機變量函數(shù)的數(shù)學期望 在許多實際工作中,常常需要求隨機變量函數(shù)的數(shù)學期望,若已知隨機變量X的分布,要求其函數(shù)的數(shù)學期望,我們可以先由X的分布求出Y的分布,然后按定義計算Y的期望。定理: 設是隨機變量X的函數(shù)(1)若X為離散型隨機變量,其分布律為 當級數(shù)收斂時,則有:(2) 若X為連續(xù)型隨機變量,其分

24、布密度為,則當收斂時,有例3:設風速X是一個隨機變量,在0,a上服從均勻分布,而飛機兩翼上所受的壓力Y與風速的平方成正比,即求。解:隨機變量X的分布密度為于是例4:假定國際市場每年對我國某產品的需求量X是一個隨機變量(單位:t),它在區(qū)間2000,4000上服從均勻分布。已知每售出一噸該產品,可賺外匯3萬美圓;若銷售不出去,則每噸需倉儲費一萬元。那么,外貿部門每年應組織多少噸貨源,才能使收益最大?解:收益多少是由銷售量和組織的貨源量共同決定的,以y表示組織的貨源量,以X表示需求量,它是一個隨機變量,收益量是X的函數(shù),記作Y。由題設條件而是隨機變量X的函數(shù),根據(jù)題意由于Y是隨機變量,要收益最大,

25、只需使其平均收益最大即可,也就是使Y的數(shù)學期望最大,而由微積分可知,當組織貨源時,可使收益最大。E(Y)=8250(美圓)163 數(shù)學期望的性質(1)設C為常數(shù),則E(C)=C;(2)設X是隨機變量,C為常數(shù),則E(CX)=CE(X);(3)E(X+C)=E(X)+C;(4)E(kX+b)=kE(X)+b (k,b為常數(shù))164 方差與標準差 隨機變量X是數(shù)學期望,用來描述隨機變量平均取值的情況,是隨機變量的一個重要的數(shù)字特征。然而在許多實際問題中,還需要了解隨機變量取值與其平均值的偏離程度。為此,我們引入方差的概念。 定義:設X為隨機變量,若存在,則稱它為隨機變量X的方差,記作D(X),即D

26、(X)=若X為離散型隨機變量,則 其中為X的分布律。若X為連續(xù)型隨機變量,其分布密度為則通常我們把稱為X的標準差或均方差,記作即方差D(X)是一個非負值,這個常數(shù)的大小反映隨機變量X取值的分散程度,方差越大,取值越分散;方差越小,取值越集中。 在方差的計算中,常用到的公式例5:設隨機變量X服從參數(shù)為的指數(shù)分布,即求D(X);解: 因為X的概率密度為故:又,所以165 方差的性質(1)設C為常數(shù),則D(C)= 0;(2)設X為隨機變量,C為常數(shù),則 D(CX)= C2D(X)(3)設X為隨機變量,C為常數(shù),則 D(X+C)= D(X)166 幾種常見分布的期望與方差習題二1 設隨機變量X服從標準

27、正態(tài)分布,求:(1);(2);(3)2 設XN(3,4),求;(1)(2)(3)3 設隨機變量的概率分布為: k=1,2,3,4,5試求:E(X)和D(X)。4設隨機變量Y具有分布; k=1,2,試求E(X)和D(X)。5 設在某一規(guī)定時間間隔內,電器設備用于最大負荷的時間是一連續(xù)型隨機變量,其概率密度為求:E(X)6 設隨機變量X的概率密度為求:的數(shù)學期望和方差。7 設隨機變量X的概率密度為:求X的期望和方差。8某射手每次擊中目標的概率為0.8, 現(xiàn)連續(xù)射擊30次,求擊中目標的次數(shù)的數(shù)學期望和方差。2 統(tǒng)計量及相關概念(5-6)21 總體與樣本211 樣本 如果我們要了解某工廠生產的燈泡的質

28、量,就要對燈泡的壽命進行測試,由于測試具有破壞性,所以我們只能從產品中抽取一部分進行壽命測試,然后根據(jù)這部分燈泡的壽命對整批燈泡的質量進行推斷。 在數(shù)理統(tǒng)計中,我們把研究對象的全體稱為總體,而把組成總體的每個基本單元稱為個體。在實際問題中,我們關心的往往不是研究對象的全部情況,而是它的某一個或某幾個質量指標。比如,對燈泡我們只要關心的是其使用壽命,而該批燈泡的使用壽命X取值的全體,就構成了研究對象的全體,即總體,顯然X是一個隨機變量。根據(jù)總體所含個體的多少,又可把總體區(qū)分為有限總體與無限總體兩類。要了解總體的規(guī)律性,必須對其中的個體進行統(tǒng)計、觀測,而統(tǒng)計觀測的方法一般分為兩類:一類是全面觀測,

29、即對全部個體逐個觀測,該方法全面但是不可行的;另一類是抽樣觀測,即從總體中抽取n個個體進行觀測,然后由n個個體的性質來推斷總體的性質或規(guī)律性。我們把被抽到的n個個體的集合稱為總體的一個樣本,n稱為該樣本的容量。 在總體X中每抽取一個個體,就是對隨機變量X進行一次觀測,抽取n個個體就是對X進行n次觀測,每次觀測的結果都得到X的一個個體的觀測值。把樣本的一個n維隨機變量記作,而把樣本觀測值記為。 若總體X的概率密度函數(shù)為,則樣本的聯(lián)合密度函數(shù)為若總體的分布函數(shù)為,則樣本的聯(lián)合分布函數(shù)為212 理論分布與樣本分布函數(shù) 我們知道,若總體是隨機變量X,則X的分布就是總體的分布(也叫理論分布),X的分布函

30、數(shù)便是總體的分布函數(shù)。要了解總體的情況,就要了解隨機變量X的分布或它的某些數(shù)字特征。問題是如何由樣本來推斷總體的分布。一般做法是作出樣本分布函數(shù)用以觀測理論分布的面貌,下面給出分布函數(shù)的定義:定義:若是總體X的n個獨立的觀測值,將這些觀測值由小到大排列為并作出函數(shù)稱為對總體X進行n次獨立觀測得到的樣本分布函數(shù)(或稱經驗分布函數(shù))。的圖形是一條躍遷上升的階梯形曲線,該分布函數(shù)具有如下性質:(1)(2)單調不減(3)處處右連續(xù)。213 分布密度的近似求法 我們可以由樣本觀測值作出頻率直方圖來近似找到分布密度函數(shù)。通過一個例子說明直方圖的畫法。例:為了了解某工廠產品重量的分布情況,從該廠生產的產品中

31、抽取容量為100的樣本,測得其重量如表所示:圖1 產品重量數(shù)據(jù)表 單位:g 試根據(jù)以上數(shù)據(jù),求出總體X的近似分布。近似描述X的概率分布的具體步驟是:(1) 對n個樣本值進行分組,組數(shù)記為k,一般要依據(jù)樣本容量n的大小決定分組數(shù)k,組數(shù)多少與n的關系可參考下表。表2-2樣本容量n組數(shù)k5010020030050010005108161020122415302040分組方法是:(a) 將n個樣本值按大小排列,找出最大值,最小值,本例中, , (b) 選取a(比略?。┖蚥(比略大),把區(qū)間(a,b)作為樣本的取值區(qū)間,并把(a,b)等分成k個小區(qū)間,每個區(qū)間的長度為組距,記為h,這里 本例中 h=0

32、.1(2) 數(shù)出樣本值落入第i個區(qū)間的個數(shù),稱為頻數(shù),記作(i=1,2,k),進而計算出樣本值落入第i個區(qū)間的頻率,記作,即(3)列出頻率分布表如下所示:(4)畫出頻率直方圖在頻率直方圖中,高: 從圖中可見,頻率直方圖中第i個矩形的面積等于樣本值落入第i個區(qū)間內的頻率, 且 即所有矩形面積之和等于1。22 統(tǒng)計量與抽樣分布 樣本是總體的代表和反映,但在抽取樣本之后,我們并不立即由樣本來推斷總體,而是要對樣本進行“加工”和“提煉”,把樣本中包含我們所關心的信息集中起來,這就是針對不同的問題構造出某種樣本的函數(shù),這種樣本的函數(shù)在統(tǒng)計學中稱為統(tǒng)計量。定義:設是來自總體X的一個樣本,是不包括任何未知參

33、數(shù)的樣本的函數(shù),則為統(tǒng)計量。 由于樣本是隨機變量,所以作為樣本函數(shù)的統(tǒng)計量也是一個隨機變量,若是樣本的一個觀測值,則就是的一個觀測值。 一般地,若是來自總體X的樣本,則稱統(tǒng)計量為樣本均值(表示總體平均取什么值);稱統(tǒng)計量為樣本方差(總體取值的分散程度);稱統(tǒng)計量為樣本標準差。稱為樣本的k階原點矩;稱為樣本的k階中心矩。 在統(tǒng)計中,為了客觀地比較兩個均值不等的樣本的變異程度而引入的變異系數(shù),為了度量曲線形狀而引入的偏度,以及峰度等等,均為統(tǒng)計量。222 抽樣分布 統(tǒng)計量是n維隨機變量的函數(shù),作為一個隨機變量,它也有自己的概率分布,通常把統(tǒng)計量的分布稱為抽樣分布。 設總體X的分布函數(shù)已知,如果對于

34、任意容量為n的樣本,能求出給定的統(tǒng)計量的分布函數(shù),則稱該分布函數(shù)為的精確分布,精確分布對于數(shù)理統(tǒng)計中的“小樣本問題”的研究很重要。下面就正態(tài)總體,求出樣本的幾個函數(shù)的精確分布。2221 樣本均值的分布 設,是來自總體X的樣本,由于正態(tài)變量的線性函數(shù)仍然是正態(tài)變量,故當為已知時,統(tǒng)計量通常稱為總體的標準誤,記作 在討論有關正態(tài)總體的問題時,經常用到標準正態(tài)分布的上側臨界值的概念。設,對于任意給定的滿足或稱為標準正態(tài)分布的上側臨界值,其集合解釋如下圖(左)所示。把滿足的稱為標準正態(tài)分布的雙側臨界值,其如下圖(由)所示。幾個常用的臨界值為2222 分布 設是來自總體N(0,1)的樣本,則服從自由度為

35、n的分布,記作分布的密度函數(shù)為 其圖形如下所示。為了使用方便起見,數(shù)學工作者對不同自由度、不同值按表達式計算出,稱為分布的上側臨界值,其幾何解釋如下圖所示。例如: n=30, 即 可以證明分布具有可加性:設且二者相互獨立,則 研究分布,經常用到下述定理:定理1: 設是來自正態(tài)總體的樣本,則(1) 樣本均值與樣本方差相互獨立;(2)2223 t分布 設X N(0,1),Y,且X與Y相互獨立,則隨機變量服從自由度為n的t分布,記為Tt(n)t分布的概率密度函數(shù)為 它的圖形如下所述。 類似標準正態(tài)分布的密度函數(shù),當n較大時,t分布近似于標準正態(tài)分布。研究t分布經常用到如下定理:定理2:設是來自正態(tài)總

36、體的樣本,則統(tǒng)計計算通常稱為樣本的標準誤,記作,定理3: 設和分別來自正態(tài)總體和的樣本,且二者相互獨立,則統(tǒng)計量對于給定的,我們稱滿足條件的為t分布的上側臨界值,如下圖(左)所示;而把滿足條件的為t分布的雙側臨界值,如下圖右所示。例如:當時, 2224 F分布設,且與相互獨立,則隨機變量服從第一自由度為,第二自由度為的F分布,記作F分布的密度函數(shù)為其中F分布的上側臨界值是指滿足 對于任意給定的和值,通過查F分布表可得臨界值若較大時,可由公式查F分布表得出。例如:,則查表可得, 研究F分布,經常用到如下定理:定理4 設是正態(tài)總體的樣本容量和樣本方差;是正態(tài)總體的樣本容量和樣本方差,且兩個樣本相互獨立,則統(tǒng)計量23 中心極限定理231 大數(shù)定律本節(jié)所講的大數(shù)定律將從理論上證實頻率具有穩(wěn)定性2311 切比雪夫不等式切比雪夫不等式:設 隨機變量X具有有限期望和方差,記,則對于任意正數(shù),恒

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論