第4章用概率分布描述隨機變量_第1頁
第4章用概率分布描述隨機變量_第2頁
第4章用概率分布描述隨機變量_第3頁
第4章用概率分布描述隨機變量_第4頁
第4章用概率分布描述隨機變量_第5頁
已閱讀5頁,還剩107頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第4章用概率分布描述隨機變量數(shù)學(xué)定律不能百分百確切地用在現(xiàn)實生活里;能百分百確切地用數(shù)學(xué)定理描述的,就不是現(xiàn)實生活。

——AlbertEinstein戶數(shù)比重(%)252015105按純收入分組(元)1000500←15002000250030003500400045005000→4.1度量事件發(fā)生的可能性

—概率probability明天降雨的可能性有多大?你買彩票中獎的可能性有多大?你購買一只股票周一上漲的可能性有多大?這些對事件發(fā)生可能性大小的度量就是概率什么是概率?

(probability)概率是對事件發(fā)生的可能性大小的度量你購買一只股票明天上漲的可能性有多大明天降水的概率是80%。這里的80%就是對降水這一事件發(fā)生的可能性大小的一種數(shù)值度量一個介于0和1之間的一個值事件A的概率記為P(A)怎樣獲得概率?重復(fù)試驗獲得概率當試驗的次數(shù)很多時,概率P(A)可以由所觀察到的事件A發(fā)生次數(shù)(頻數(shù))的比例來逼近在相同條件下,重復(fù)進行n次試驗,事件A發(fā)生了m次,則事件A發(fā)生的概率可以寫為

用類似的比例來逼近一家餐館將生存5年的概率,可以用已經(jīng)生存了5年的類似餐館所占的比例作為所求概率一個近似值主觀概率有人投擲一枚硬幣,隨著投擲次數(shù)n的增大,出現(xiàn)正面(或反面)的頻率穩(wěn)定在1/2左右。試驗的次數(shù)1.000.000.250.500.750255075100125正面/試驗次數(shù)利用概率知識幫助判案在瑞典的一次庭審中,管理泊車的警察作證說他記錄了一輛車某一邊的兩個輪胎氣閥的位置。后來等他重新回到該處時,氣閥還在原來的位置。(這個警察的做法是把氣閥的位置記成最接近的“鐘點”位置。例如在下圖中,氣閥是在“10:00”和“3:00”。)在這種情況下他開了一張超時泊車的罰單。但是車主卻聲稱他已經(jīng)在其間用過車子,只不過?;氐搅嗽瓉淼牟窜囄弧8怕实幕拘再|(zhì)1.P(Φ)=0,P(Ω)=12.有限可加性:當n個事件A1,A2,A3…,An兩兩互不相容時,P(A1∪...∪An)=P(A1)+...+P(An)。3.對于任意一個事件A:P(A)=1-P(非A)4.當事件A,B滿足A包含于B時:P(B-A)=P(B)-P(A),P(A)≤P(B)。5.對于任意一個事件A,有0≤P(A)≤1。6.對任意兩個事件A和B,P(B-A)=P(B)-P(AB).7.加法公式:對任意兩個事件A和B,P(A∪B)=P(A)+P(B)-P(AB)。當事件A和B互不相容時P(A∪B)=P(A)+P(B)這里:事件(AB)表示A和B同時發(fā)生。若A和B相互獨立:P(AB)=P(A)·P(B)【例題】

:據(jù)經(jīng)驗統(tǒng)計,甲運動員投籃命中(A)概率為80%,乙運動員投籃命中(B)概率為90%,若兩人各獨立投一次,有下列結(jié)果:

1)兩人都投中的概率:P(AB)=P(A)·P(B)=80%×90%=72%2)兩人都投不中的概率P(非A非B)=(1-P(A))(1-P(B))=20%*10% 3)甲投中乙投不中的概率P(A)·(1-P(B))=80%×10%=8%4)乙投中而甲投不中的概率(1-P(A))·P(B)=20%×90%=18%5)甲乙至少有一人投中的概率P(A∪B)=P(A)+P(B)-P(AB)=80%+90%-72%=98%4.2隨機變量的概率分布隨機變量是變量數(shù)值具有隨機性的變量。離散型隨機變量只能取有限多個數(shù)值.連續(xù)型隨機變量可以取某一區(qū)間范圍內(nèi)的任意值。4.2.1隨機變量(randomvariables)事先不知道會出現(xiàn)什么結(jié)果投擲兩枚硬幣出現(xiàn)正面的數(shù)量一座寫字樓,每平方米的出租價格一個消費者對某一特定品牌飲料的偏好一般用X,Y,Z來表示根據(jù)取值情況的不同分為離散型隨機變量和連續(xù)型隨機變量離散型隨機變量

(discreterandomvariables)隨機變量X

取有限個值或所有取值都可以逐個列舉出來x1,x2,…以確定的概率取這些不同的值離散型隨機變量的一些例子試驗隨機變量可能的取值抽查100個產(chǎn)品一家餐館營業(yè)一天電腦公司一個月的銷售銷售一輛汽車取到次品的個數(shù)顧客數(shù)銷售量顧客性別0,1,2,…,1000,1,2,…0,1,2,…男性為0,女性為1連續(xù)型隨機變量(continuousrandomvariables)可以取一個或多個區(qū)間中任何值所有可能取值不可以逐個列舉出來,而是取數(shù)軸上某一區(qū)間內(nèi)的任意點連續(xù)型隨機變量的一些例子試驗隨機變量可能的取值抽查一批電子元件新建一座住宅樓測量一個產(chǎn)品的長度使用壽命(小時)半年后工程完成的百分比測量誤差(cm)X00

X100X0離散型隨機變量的期望值(expectedvalue)描述離散型隨機變量取值的集中程度離散型隨機變量X的所有可能取值xi與其取相對應(yīng)的概率pi乘積之和記為或E(X)計算公式為離散型隨機變量的方差(variance)隨機變量X的每一個取值與期望值的離差平方和的數(shù)學(xué)期望,記為2或D(X)描述離散型隨機變量取值的分散程度計算公式為方差的平方根稱為標準差,記為或D(X)連續(xù)型隨機變量的期望和方差連續(xù)型隨機變量的期望值方差例如根據(jù)人口普查數(shù)據(jù),我國的出生嬰兒男、女性比重如表嬰兒的性別情況表

性別X0(男)1(女)概率P0.5170.4834.2.2離散型隨機變量概率分布一般地,假定隨機變量的所有取值為x1,x2,……,xk,對應(yīng)發(fā)生的概率分別為p(x1)p(x2)……p(xk),可以以下列分布列表示。離散型隨機變量概率分布的表格形式

Xx1x2……xk……p(X=xi)p(x1)p(x2)……(xk)……【實例】姚明每次罰球具有一定的隨機性,那么他三次罰球的得分結(jié)果可能是什么?1.投進零個球———0分2.投進一個球———1分3.投進兩個球———2分4.投進三個球———3分結(jié)果可用得分數(shù)這個隨機變量X進行描述,X的取值為0,1,2,3。其分布列可表示為:X0123p(X)p1p2p3p4【實例】每次拋兩個硬幣,記錄正、反面結(jié)果。結(jié)果可記錄為:1.硬幣1正面朝上,硬幣2正面朝上:2個正面2.硬幣1正面朝上,硬幣2反面朝上:1個正面3.硬幣1反面朝上,硬幣2正面朝上:1個正面4.硬幣1反面朝上,硬幣2反面朝上:0個正面在此,正面數(shù)是一個隨機變量,記為X,我們通常對X的每個取值的概率感興趣。X的取值為0、1、2。其分布列可表示為:X012p(X)0.250.50.25離散型隨機變量分布的性質(zhì)(1)(2)掌握隨機變量概率分布的好處:只要確知一個離散隨機變量的概率分布并用一定的公式表達出來,就能根據(jù)這一分布計算隨機變量取任一值的概率二項試驗

(伯努利試驗)

二項分布與伯努利試驗有關(guān)貝努里試驗滿足下列條件一次試驗只有兩個可能結(jié)果,即“成功”和“失敗”“成功”是指我們感興趣的某種特征一次試驗“成功”的概率為p,失敗的概率為q=1-p,且概率p對每次試驗都是相同的

試驗是相互獨立的,并可以重復(fù)進行n次

在n次試驗中,“成功”的次數(shù)對應(yīng)一個離散型隨機變量X

二項分布

(Binomialdistribution)重復(fù)進行

n次試驗,出現(xiàn)“成功”的次數(shù)的概率分布稱為二項分布,記為X~B(n,p)設(shè)X為n次重復(fù)試驗中出現(xiàn)成功的次數(shù),X取x的概率為二項分布

(期望值和方差)期望值

=E(X)=np方差2

=D(X)=npq0.00.20.40.6012345XP(X)n=5p=0.50.20.40.6012345XP(X)n=5p=0.1二項分布

(例題分析)【例】已知一批產(chǎn)品的次品率為4%,從中任意有放回地抽取5個。求5個產(chǎn)品中(1)沒有次品的概率是多少?(2)恰好有1個次品的概率是多少?(3)有3個以下次品的概率是多少?二項分布

(用Excel計算概率)第1步:進入Excel表格界面,將鼠標停留在某一空白單元格第2步:在Excel工作表中,直接點擊【fx】(粘貼函數(shù))命令第3步:在復(fù)選框“函數(shù)分類”中點擊【統(tǒng)計】選項,在“函數(shù)名”中點擊【BINOMDIST】選項,然后確定第4步:在【Number_s】后填入試驗成功次數(shù)(本例為1)在【Trials】后填入總試驗次數(shù)(本例為5)在【Probability_s】后填入試驗的成功概率(本例為0.04)在【Cumulative】后填入0(或FALSE),表示計算成功次數(shù)恰好等于指定數(shù)值的概率(填入1或TRUE表示計算成功次數(shù)小于或等于指定數(shù)值的累積概率值)

用Excel計算概率Excel二項分布函數(shù)BINOMDIST

一個推銷員打了六個電話,每次推銷成功的概率是0.3,建立推銷成功次數(shù)的概率分布圖表。泊松分布

(Poissondistribution)1837年法國數(shù)學(xué)家泊松(D.Poisson,1781—1840)首次提出用于描述在一指定時間范圍內(nèi)或在一定的長度、面積、體積之內(nèi)每一事件出現(xiàn)次數(shù)的分布泊松分布的例子一定時間段內(nèi),某航空公司接到的訂票電話數(shù)一定時間內(nèi),到車站等候公共汽車的人數(shù)一定路段內(nèi),路面出現(xiàn)大損壞的次數(shù)一定時間段內(nèi),放射性物質(zhì)放射的粒子數(shù)一匹布上發(fā)現(xiàn)的疵點個數(shù)一定頁數(shù)的書刊上出現(xiàn)的錯別字個數(shù)

泊松分布

(概率分布函數(shù))—給定的時間間隔、長度、面積、體積內(nèi)“成功”的平均數(shù)e=2.71828x—給定的時間間隔、長度、面積、體積內(nèi)“成功”的次數(shù)泊松分布

(期望值和方差)期望值

E(X)=方差

D(X)=

0.00.20.40.6012345XP(X)0.00.20.40.60246810XP(X)l

=6l

=0.5泊松分布

(例題分析)【例】假定某航空公司預(yù)訂票處平均每小時接到42次訂票電話,那么10分鐘內(nèi)恰好接到6次電話的概率是多少?解:設(shè)X=10分鐘內(nèi)航空公司預(yù)訂票處接到的電話次數(shù)

泊松分布

(用Excel計算概率)第1步:進入Excel表格界面,將鼠標停留在某一空白單元格第2步:在Excel表格界面中,直接點擊【f(x)】命令第3步:在復(fù)選框“函數(shù)分類”中點擊【統(tǒng)計】選項,并在“函數(shù)名”中點擊【POISSON】選項,然后【確定】第4步:在【X】后填入事件出現(xiàn)的次數(shù)(本例為6)在【Means】后填入泊松分布的均值(本例為7)在【Cumulative】后填入0(或FALSE),表示計算成功次數(shù)恰好等于指定數(shù)值的概率(填入1或TRUE表示計算成功次數(shù)小于或等于指定數(shù)值的累積概率值)

用Excel計算概率超幾何分布

(hypergeometricdistribution)采用不重復(fù)抽樣,各次試驗并不獨立,成功的概率也互不相等總體元素的數(shù)目N很小,或樣本容量n相對于N來說較大時,樣本中“成功”的次數(shù)則服從超幾何概率分布概率分布函數(shù)為超幾何分布

(例題分析)【例】假定有10支股票,其中有3支購買后可以獲利,另外7支購買后將會虧損。如果你打算從10支股票中選擇4支購買,但你并不知道哪3支是獲利的,哪7支是虧損的。求(1)有3支能獲利的股票都被你選中的概率有多大?(2)3支可獲利的股票中有2支被你選中的概率有多大?

解:設(shè)N=10,M=3,n=4超幾何分布

(用Excel計算概率)第1步:進入Excel表格界面,將鼠標停留在某一空白單元格第2步:在Excel工作表中,直接點擊【f(x)】(插入函數(shù))命令第3步:在復(fù)選框“函數(shù)分類”中點擊【統(tǒng)計】選項,并在“函數(shù)名”中點擊【HYPGEOMDIST】選項,然后【確定】第4步:在【Sample_s】后填入樣本中成功的次數(shù)x(本例為3)

在【Number_sample】后填入樣本容量n(本例為4)

在【Population_s】后填入總體中成功的次數(shù)M(本例為3)

在【Number_pop】后填入總體中的個體總數(shù)N

(本例為10)

用Excel計算概率4.2.3連續(xù)型概率分布4.2隨機變量的概率分布調(diào)查某市150戶家庭,獲得家庭人均收入數(shù)據(jù)如下(上組限不在內(nèi)):

:上表數(shù)據(jù)的直方圖如果樣本量很大,組段很多,矩形頂端組成的階梯型曲線可變成光滑的分布曲線。

可采用一個函數(shù)擬合這一光滑曲線。這種函數(shù)稱為概率密度函數(shù)。

戶數(shù)比重(%)252015105按純收入分組(元)1000500←15002000250030003500400045005000→連續(xù)型隨機變量的概率分布連續(xù)型隨機變量的概率分布連續(xù)型隨機變量可以取某一區(qū)間或整個實數(shù)軸上的任意一個值它取任何一個特定的值的概率都等于0不能列出每一個值及其相應(yīng)的概率通常研究它取某一區(qū)間值的概率用概率密度函數(shù)的形式和分布函數(shù)的形式來描述常用連續(xù)型概率分布正態(tài)分布

(normaldistribution)由C.F.高斯(CarlFriedrichGauss,1777—1855)作為描述誤差相對頻數(shù)分布的模型而提出描述連續(xù)型隨機變量的最重要的分布許多現(xiàn)象都可以由正態(tài)分布來描述可用于近似離散型隨機變量的分布例如:二項分布經(jīng)典統(tǒng)計推斷的基礎(chǔ)xf(x)概率密度函數(shù)

f(x)=隨機變量X的頻數(shù)

=正態(tài)隨機變量X的均值

=正態(tài)隨機變量X的方差

=3.1415926;e=2.71828

x=隨機變量的取值(-<x<+)正態(tài)分布函數(shù)的性質(zhì)圖形是關(guān)于x=對稱鐘形曲線,且峰值在x=處均值和標準差一旦確定,分布的具體形式也惟一確定,不同參數(shù)正態(tài)分布構(gòu)成一個完整的“正態(tài)分布族”均值可取實數(shù)軸上的任意數(shù)值,決定正態(tài)曲線的具體位置;標準差決定曲線的“陡峭”或“扁平”程度。越大,正態(tài)曲線扁平;越小,正態(tài)曲線越高陡峭當X的取值向橫軸左右兩個方向無限延伸時,曲線的兩個尾端也無限漸近橫軸,理論上永遠不會與之相交正態(tài)隨機變量在特定區(qū)間上的取值概率由正態(tài)曲線下的面積給出,而且其曲線下的總面積等于1

和對正態(tài)曲線的影響xf(x)CAB=1/212=1正態(tài)分布的概率概率是曲線下的面積!abxf(x)標準正態(tài)分布

(standardizenormaldistribution)標準正態(tài)分布的概率密度函數(shù)隨機變量具有均值為0,標準差為1的正態(tài)分布任何一個一般的正態(tài)分布,可通過下面的線性變換轉(zhuǎn)化為標準正態(tài)分布標準正態(tài)分布的分布函數(shù)標準正態(tài)分布Xms一般正態(tài)分布=1Z標準正態(tài)分布正態(tài)分布

(用Excel計算概率)第1步:進入Excel表格界面,將鼠標停留在某一空白單元格第2步:在Excel表格界面中,直接點擊【f(x)】(粘貼函數(shù))命令第3步:在復(fù)選框“函數(shù)分類”中點擊【統(tǒng)計】選項,并在“函數(shù)名”中點擊【NORMDIST】選項,然后【確定】第4步:在【X】后填入正態(tài)分布函數(shù)計算的區(qū)間點(本例為40)在【Mean】后填入正態(tài)分布的均值(本例為50)

在【PStandard_dev】后填入標準差

(本例為10)

在【Cumulative】后填入1(或TRUE)表示計算事件出現(xiàn)次數(shù)小于或等于指定數(shù)值的累積概率值正態(tài)分布

(例題分析)【例】計算以下概率(1)

X~N(50,102),求和(2)

Z~N(0,1),求和(3)正態(tài)分布概率為0.05時,求標準正態(tài)累積分布函數(shù)的反函數(shù)值z

用Excel的統(tǒng)計函數(shù)計算概率

數(shù)據(jù)正態(tài)性的評估對數(shù)據(jù)畫出頻數(shù)分布的直方圖或莖葉圖若數(shù)據(jù)近似服從正態(tài)分布,則圖形的形狀與上面給出的正態(tài)曲線應(yīng)該相似求出樣本數(shù)據(jù)的四分位差Qd和標準差s,然后計算比值Qd/s。若數(shù)據(jù)近似服從正態(tài)分布,則有

Qd/s1.3繪制正態(tài)概率圖正態(tài)概率圖的繪制

(normalprobabilityplots)正態(tài)概率圖可以在概率紙上繪制,也可以在普通紙上繪制。在普通紙上繪制正態(tài)概率圖的步驟第1步:將樣本觀察值從小到大排列第2步:求出樣本觀察值的標準正態(tài)分數(shù)zi。標準正態(tài)分數(shù)滿足第3步:將zi作為縱軸,xi作為橫軸,繪制圖形,即為標準正態(tài)概率圖正態(tài)概率圖的繪制

(例題分析)【例】一家電腦公司連續(xù)10天的銷售額(單位:萬元)分表為176,191,214,,220,205,192,201,190,183,185。繪制正態(tài)概率圖,判斷該組數(shù)據(jù)是否服從正態(tài)分布用SPSS繪制正態(tài)概率圖

用SPSS繪制正態(tài)概率圖第1步:選擇【Graphs】下拉菜單,并選擇【Q-Q】選項進入主對話框第2步:在主對話框中將變量選入【Variables】,點擊【OK】正態(tài)概率圖的繪制

(例題分析)電腦公司銷售額的正態(tài)概率圖

正態(tài)概率圖的繪制

(SPSS繪制的例2.3的正態(tài)概率圖)正態(tài)概率圖的分析

(normalprobabilityplots)正態(tài)概率圖有時也稱為分位數(shù)—分位數(shù)圖,或稱Q-Q圖實際應(yīng)用中,只有樣本數(shù)據(jù)較多時正態(tài)概率圖的效果才比較好。當然也可以用于小樣本,但此時可能會出現(xiàn)與正態(tài)性有較大偏差的情況在分析正態(tài)概率圖時,最好不要用嚴格的標準去衡量數(shù)據(jù)點是否在一條直線上,只要近似在一條直線上即可對于樣本點中數(shù)值最大或最小的點也可以不用太關(guān)注,除非這些點偏離直線特別遠,因為這些點通常會與直線有偏離。如果某個點偏離直線特別遠,而其他點又基本上在直線上時,這個點可能是離群點,可不必考慮Excel正態(tài)分布函數(shù)

NORMDIST已知某國男性的身高X~N(170,2^2),請問:身高為166至174的男性占男性的比率有多大?=NORMDIST(166,170,2,1)

=NORMDIST(174,170,2,1)

=NORMDIST(65,50,10,1)

=NORMDIST(65,60,4,1)

由甲地到乙地有兩條路線可供選擇。第一條路線路程較短,但交通擁擠,所需時間X~N(50,10^2);另一條路線路程較長,但較通暢,所需時間Y~N(60,4^2)(單位min)。如果要求在65分鐘內(nèi)從甲地到達乙地,應(yīng)走哪條路線?解:由于而故從走概率較大而保險的角度看,應(yīng)該走第一條路線。4.3由正態(tài)分布導(dǎo)出的幾個重要分布

2分布

t分布

F分布由阿貝(Abbe)

于1863年首先給出,后來由海爾墨特(Hermert)和卡·皮爾遜(K·Pearson)

分別于1875年和1900年推導(dǎo)出來設(shè),則令,則y服從自由度為1的2分布,即對于n個正態(tài)隨機變量y1,y2,yn,則隨機變量稱為具有n個自由度的2分布,記為4.3.1c2-分布(2-distribution)分布的變量值始終為正分布的形狀取決于其自由度n的大小,通常為不對稱的正偏分布,但隨著自由度的增大逐漸趨于對稱期望為:E(2)=n,方差為:D(2)=2n(n為自由度)可加性:若U和V為兩個獨立的2分布隨機變量,U~2(n1),V~2(n2),則U+V這一隨機變量服從自由度為n1+n2的2分布c2-分布

(性質(zhì)和特點)不同自由度的c2-分布c2n=1n=4n=10n=20c2-分布

(用Excel計算c2分布的概率)利用Excel提供的【CHIDIST】統(tǒng)計函數(shù),計算c2分布右單尾的概率值語法:CHIDIST(x,degrees_freedom)

,其中df為自由度,x,是隨機變量的取值利用【CHIINV】函數(shù)則可以計算給定右尾概率和自由度時相應(yīng)的反函數(shù)值

語法:CHIINV(probability,degrees_freedom)

用Excel計算c2分布的概率4.3.3t-分布

(t-distribution)提出者是WilliamGosset,也被稱為學(xué)生分布(student’st)

t分布是類似正態(tài)分布的一種對稱分布,通常要比正態(tài)分布平坦和分散。一個特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布xt

分布與標準正態(tài)分布的比較t分布標準正態(tài)分布t不同自由度的t分布標準正態(tài)分布t(df=13)t(df=5)zt-分布

(用Excel生成t分布的臨界值表)利用Excel中的【TDIST】統(tǒng)計函數(shù),可以計算給定值和自由度時分布的概率值語法:TDIST(x,degrees_freedom,tails)

利用【TINV】函數(shù)則可以計算給定概率和自由度時的相應(yīng)

語法:TINV(probability,degrees_freedom)

用Excel生成t分布的臨界值表為紀念統(tǒng)計學(xué)家費希爾(R.A.Fisher)

以其姓氏的第一個字母來命名則設(shè)若U為服從自由度為n1的2分布,即U~2(n1),V為服從自由度為n2的2分布,即V~2(n2),且U和V相互獨立,則稱F為服從自由度n1和n2的F分布,記為4.3.3F-分布(F

distribution)不同自由度的F分布(圖示)F(1,10)(5,10)(10,10)F-分布

(用Excel計算F分布的概率)利用Excel提供的【FDIST】統(tǒng)計函數(shù),計算分布右單尾的概率值語法:FDIST(x,degrees_freedom1,degrees_freedom2)利用【FINV】函數(shù)則可以計算給定單尾概率和自由度時的相應(yīng)

語法:FINV(probability,degrees_freedom1,degrees_freedom2)

用Excel計算F分布的概率3.4樣本統(tǒng)計量的抽樣分布

3.4.1樣本均值的抽樣分布3.4.2其他統(tǒng)計量的抽樣分布3.4.3統(tǒng)計量的標準誤差第3章用概率分布描述隨機變量樣本統(tǒng)計量的概率分布,是一種理論分布在重復(fù)選取樣本量為n的樣本時,由該統(tǒng)計量的所有可能取值形成的相對頻數(shù)分布

隨機變量是樣本統(tǒng)計量樣本均值,樣本比例,樣本方差等結(jié)果來自容量相同的所有可能樣本提供了樣本統(tǒng)計量長遠而穩(wěn)定的信息,是進行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù) 抽樣分布

(samplingdistribution)3.4.1樣本均值的抽樣分布3.4樣本統(tǒng)計量的抽樣分布在重復(fù)選取容量為n的樣本時,由樣本均值的所有可能取值形成的相對頻數(shù)分布一種理論概率分布推斷總體均值的理論基礎(chǔ) 樣本均值的抽樣分布樣本均值的抽樣分布

(例題分析)【例】設(shè)一個總體,含有4個元素(個體),即總體單位數(shù)N=4。4個個體分別為x1=1,x2=2,x3=3,x4=4??傮w的均值、方差及分布如下總體分布14230.1.2.3均值和方差樣本均值的抽樣分布

(例題分析)

現(xiàn)從總體中抽取n=2的簡單隨機樣本,在重復(fù)抽樣條件下,共有42=16個樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)樣本均值的抽樣分布

(例題分析)計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)x樣本均值的抽樣分布1.000.10.20.3P

(x)1.53.04.03.52.02.5樣本均值的分布與總體分布的比較

(例題分析)=2.5σ2=1.25總體分布14230.1.2.3抽樣分布P(x)1.00.1.2.31.53.04.03.52.02.5x樣本均值的抽樣分布

與中心極限定理=50

=10X總體分布n=4抽樣分布xn=16當總體服從正態(tài)分布N(μ,σ2)時,來自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布,x的期望值為μ,方差為σ2/n。即x~N(μ,σ2/n)中心極限定理

(centrallimittheorem)當樣本容量足夠大時(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布從均值為,方差為

2的一個任意總體中抽取容量為n的樣本,當n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個任意分布的總體x中心極限定理

(centrallimittheorem)x的分布趨于正態(tài)分布的過程3.4.2其他統(tǒng)計量的抽樣分布3.4樣本統(tǒng)計量的抽樣分布總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比不同性別的人與全部人數(shù)之比合格品(或不合格品)與全部產(chǎn)品總數(shù)之比總體比例可表示為樣本比例可表示為

樣本比例的抽樣分布

(proportion)在重復(fù)選取容量為n的樣本時,由樣本比例的所有可能取值形成的相對頻數(shù)分布一種理論概率分布當樣本容量很大時,樣本比例的抽樣分布可用正態(tài)分布近似,即

樣本比例的抽樣分布樣本方差的分布在重復(fù)選取容量為n的樣本時,由樣本方差的所有可能取值形成的相對頻數(shù)分布對于來自正態(tài)總體的簡單隨機樣本,則比值的抽樣分布服從自由度為(n-1)的2分布,即樣本方差的分布在重復(fù)選取容量為n的樣本時,由樣本方差的所有可能取值形成的相對頻數(shù)分布對于來自正態(tài)總體的簡單隨機樣本,則比值的抽樣分布服從自由度為(n-1)的2分布,即重要概率分布連續(xù)型隨機變量正態(tài)分布

分布t分布F分布離散型隨機變量二項分布泊松分布超幾何分布μ不同時的正態(tài)分布

σ不同時的正態(tài)分布

正態(tài)概率密度曲線圖性質(zhì)1.關(guān)于x=μ對稱2.在x=μ曲線最高3.在x=μ±σ處各有一個拐點4.曲線下面積(以x軸為界)為15.若σ固定,隨μ值不同,曲線位置不同,故稱μ為位置參數(shù)6.若μ固定,σ大時,曲線矮而胖;小時,曲線瘦而高,故稱為形狀參數(shù)正態(tài)分布表示方法若隨機變量X服從均值為μ方差為的正態(tài)分布,記:X~N(μ,)標準正態(tài)分布Z~N(0,1)一般正態(tài)分布隨機變量X可標準化為標準正態(tài)分布的隨機變量Z:Z=(X-μ)/σ正態(tài)分布曲線下的面積若隨機變量X~N(μ,)

密度曲線下的總面積為1(這是所有密度函數(shù)的性質(zhì))-Zα/21-aa/2Zα/2a/2μ正態(tài)分布置信度落在正態(tài)分布圖尾部區(qū)域的X是小概率事件。其概率我們記為α。而稱1-α為可信程度或置信度。通常置信度取90%,95%,99%正態(tài)分布曲線下的面積與臨界值正態(tài)分布模型的概率計算當X~N(0,1)時,有其中Φ(x)是標準正態(tài)分布密度函數(shù),取值可在Excel里得到。因為只給出X>0的結(jié)果,所以當X<0時,可用Φ(-x)=1-Φ(x)求出。若隨機變量X~N(μ,)時,樣本統(tǒng)計量的抽樣分布樣本均值的分布樣本比例的分布樣本方差的分布抽樣分布正態(tài)或t分布Χ2分布正態(tài)或t分布樣本均值的分布

設(shè)X1,X2,…,Xn是來自正態(tài)總體N~(μ,σ2)的一個樣本,則樣本均值服從均值為μ方差為σ^2/n的正態(tài)分布。

設(shè)X1,X2,…,Xn是來自任總體的一個大(n>30)樣本,則樣本均值近似服從均值為μ方差為s^2/n的正態(tài)分布。樣本均值的分布

設(shè)X1,X2,…,Xn是來自非正態(tài)總體的一個

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論