版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
數(shù)據(jù)分析
(方法與案例)
作者賈俊平統(tǒng)計學統(tǒng)
計
學
Statisticsyyyy-M-數(shù)學定律不能百分之百確切地用在現(xiàn)實生活里;能百分之百確切地用數(shù)學定律描述的,就不是現(xiàn)實生活
——AlberEinstein統(tǒng)計名言第4
章概率分布4.1度量事件發(fā)生的可能性3.2隨機變量概率分布3.3由正態(tài)分布導出的幾個重要分布3.4樣本統(tǒng)計量的概率分布probabilityyyyy-M-學習目標度量事件發(fā)生的可能性—概率離散型概率分布二項分布,泊松分布,超幾何分布連續(xù)型概率分布正態(tài)分布由正態(tài)分布導出的幾個重要分布c2-分布,t-分布,F(xiàn)-分布樣本統(tǒng)計量的概率分布yyyy-M-神州七號飛船遭遇空間碎片的概率有多大?2008年9月25日21:10分,搭載著神舟七號載人飛船的長征二號F型運載火箭,在酒泉衛(wèi)星發(fā)射中心成功發(fā)射升空,并在完成中國航天員首次太空行走和各項科學試驗任務后,于2008年9月28日17時38分安全返回
太空中充斥著難以計數(shù)的空間碎片,隨時會給飛船帶來致命的沖擊。據(jù)中國科學院空間環(huán)境研究預報中心預測,神州七號載人航天飛船在飛行期間遭遇空間碎片的概率在百萬分之一以下yyyy-M-神州七號飛船遭遇空間碎片的概率有多大?空間碎片是人類空間活動的產物,包括完成任務的火箭箭體和衛(wèi)星本體、火箭的噴射物、航天員的拋棄物、空間物體之間碰撞產生的碎塊等,是空間環(huán)境的主要污染源??臻g碎片的飛行速度平均每秒10公里,最高時速達每秒16公里。在這樣的速度下,一個1厘米的碎片就可以把擁有各種防護功能的飛船打穿一個洞。航天員的艙外航天服更經不起碰撞據(jù)中國科學院空間環(huán)境研究預報中心預測專家說,世界各國聯(lián)合起來對10厘米至30厘米的大塊碎片進行監(jiān)測,是能夠發(fā)現(xiàn)它的軌跡的。但對于較小的碎片,人類的觀測設備沒有辦法觀測得到,因此還沒有辦法較為準確地掌握它的運行軌跡,只能通過它碰撞、破碎的演化規(guī)律來盡可能多地了解它的運行yyyy-M-神州七號飛船遭遇空間碎片的概率有多大?目前可被地面觀測設備觀測并測定其軌道的空間物體超過9000個,其中只有6%是仍在工作的航天器,其余為空間碎片在神舟七號載人航天飛行期間,預計將有10個左右的危險時段可能會遭遇空間碎片的碰撞,只要避開這些危險時段,碰撞的概率都是在百萬分之一以下。即使是在那幾個危險的時段,飛船或航天員與空間碎片碰撞的概率也在萬分之一以下
據(jù)中國科學院空間環(huán)境研究預報中心專家稱,這種小概率事件意味著我們幾乎可以保證飛船不會與空間碎片相撞4.1度量事件發(fā)生的可能性概率是什么?怎樣獲得概率?怎樣理解概率?第4章概率分布yyyy-M-什么是概率?
(probability)概率是對事件發(fā)生的可能性大小的度量明天降水的概率是80%。這里的80%就是對降水這一事件發(fā)生的可能性大小的一種數(shù)值度量你購買一只股票明天上漲的可能性是30%,這也是一個概率一個介于0和1之間的一個值,事件A的概率記為P(A)yyyy-M-怎樣獲得概率?重復試驗(要求事件發(fā)生是獨立的、等概率的)當試驗的次數(shù)很多時,概率P(A)可以由所觀察到的事件A發(fā)生次數(shù)(頻數(shù))的比例來逼近在相同條件下,重復進行n次試驗,事件A發(fā)生了m次,則事件A發(fā)生的概率可以寫為
用類似的比例來逼近一家餐館將生存5年的概率,可以用已經生存了5年的類似餐館所占的比例作為所求概率一個近似值主觀概率yyyy-M-怎樣理解概率?
投擲一枚硬幣,出現(xiàn)正面和反面的頻率,隨著投擲次數(shù)n的增大,出現(xiàn)正面和反面的頻率穩(wěn)定在1/2左右(注意:拋擲完成后,其結果就是一個數(shù)據(jù),要么一定是正面,要么一定是反面,就不是概率問題了)試驗的次數(shù)正面/試驗次數(shù)1.000.000.250.500.7502550751001254.2隨機變量的概率分布
4.2.1隨機變量及其概括性度量
4.2.2離散型概率分布
4.2.3連續(xù)型概率分布第4章概率分布4.2.1隨機變量及其概括性度量4.2隨機變量的概率分布yyyy-M-隨機變量
(randomvariables)從樣本空間映射到實數(shù)的函數(shù)稱為隨機變量(例:摸有顏色的球)樣本空間:隨機試驗中出現(xiàn)的所有可能的結果的集合,記為S={e}。為研究隨機現(xiàn)象,需要對隨機試驗的結果進行賦值,記為X=X(e)隨機變量一般用X,Y,Z來表示,隨機變量的取值用x,y,z表示。隨機變量X取值為x的概率記為yyyy-M-離散型隨機變量
(discreterandomvariables)隨機變量X
取有限個值或所有取值都可以逐個列舉出來x1,x2,…以確定的概率取這些不同的值離散型隨機變量的一些例子試驗隨機變量可能的取值抽查100個產品一家餐館營業(yè)一天電腦公司一個月的銷售銷售一輛汽車取到次品的個數(shù)顧客數(shù)銷售量顧客性別0,1,2,…,1000,1,2,…0,1,2,…男性為0,女性為1yyyy-M-累積分布函數(shù)
(cumulativedistributionfunction)考慮隨機變量X落在某個區(qū)間(x1,x2)的概率,
(餐館一天的顧客在100-200的概率)累積分布函數(shù)(cdf)
yyyy-M-連續(xù)型隨機變量
(continuousrandomvariables)可以取一個或多個區(qū)間中任何值所有可能取值不可以逐個列舉出來,而是取數(shù)軸上某一區(qū)間內的任意點概率密度函數(shù)(probabilitydensityfunction)yyyy-M-連續(xù)型隨機變量的概率概率是曲線下的面積!abxf(x)yyyy-M-連續(xù)型隨機變量
(continuousrandomvariables)連續(xù)型隨機變量的一些例子試驗隨機變量可能的取值抽查一批電子元件新建一座住宅樓測量一個產品的長度使用壽命(小時)半年后完工的百分比測量誤差(cm)X
00
X100X
0yyyy-M-離散型隨機變量的期望值
(expectedvalue)描述離散型隨機變量取值的集中程度離散型隨機變量X的所有可能取值xi與其取相對應的概率pi乘積之和記為
或E(X),計算公式為yyyy-M-離散型隨機變量的方差
(variance)隨機變量X的每一個取值與期望值的離差平方的數(shù)學期望,記為
2
或D(X),描述離散型隨機變量取值的分散程度計算公式為方差的平方根稱為標準差,記為
或
D(X)yyyy-M-離散型數(shù)學期望和方差
(例題分析)
【例4-1】一家電腦配件供應商聲稱,他所提供的配件100個中擁有次品的個數(shù)及概率如下表。求該供應商次品數(shù)的數(shù)學期望和標準差次品數(shù)X=xi0123概率P(X=xi)
pi0.750.120.080.05yyyy-M-連續(xù)型隨機變量的期望和方差連續(xù)型隨機變量的期望值方差yyyy-M-連續(xù)型隨機變量的期望和方差隨機變量的期望不一定存在
柯西隨機變量,概率密度函數(shù)為
期望不存在。期望不存在,方差也就不存在。
方差不存在,期望可能存在,也可能不存在。
yyyy-M-隨機變量的期望與方差的關系
(variance)數(shù)據(jù)的均值、方差與隨機變量的期望、方差的區(qū)別
隨機變量
獨立的定義
證明
4.2.2離散型概率分布4.2隨機變量的概率分布yyyy-M-離散型隨機變量的概率分布列出離散型隨機變量X的所有可能取值列出隨機變量取這些值的概率通常用下面的表格來表示X=xix1,x2
,…
,xnP(X=xi)=pip1,p2
,…
,pn
P(X=xi)=pi稱為離散型隨機變量的概率函數(shù)pi0;常用的有二項分布、泊松分布、超幾何分布等yyyy-M-二項試驗
(Bernoulli試驗)
二項分布建立在Bernoulli試驗基礎上貝努里試驗滿足下列條件(例:拋硬幣)一次試驗只有兩個可能結果,即
“成功”和“失敗”“成功”是指我們感興趣的某種特征一次試驗“成功”的概率為p,失敗的概率為q=1-p,且概率p對每次試驗都是相同的
試驗是相互獨立的,并可以重復進行n次
在n次試驗中,“成功”的次數(shù)對應一個離散型隨機變量X
yyyy-M-二項分布
(Binomialdistribution)重復進行
n
次試驗,出現(xiàn)“成功”的次數(shù)的概率分布是二項分布,記為X~B(n,p)相互獨立的n個事件都發(fā)生的概率是每個事件發(fā)生的概率的乘積(例,擲2個硬幣都為正面的概率)。n重伯努利試驗都是獨立的,其中x次試驗成功的概率是,n-x試驗失敗的概率是
,所以,n重伯努利試驗出現(xiàn)x次成功的概率是yyyy-M-二項分布
(Binomialdistribution)只考慮出現(xiàn)次數(shù),不考慮排序,這種結果共有次。所以,n次重復試驗中成功次數(shù)為x
的概率yyyy-M-二項分布
(期望值和方差)期望值
1次伯努利試驗的期望
n次獨立的伯努利試驗的期望:方差
1次伯努利試驗的方差
n次獨立的伯努利試驗的方差:
yyyy-M-二項分布
(例題分析)
【例4-2】已知一批產品的次品率為4%,從中任意有放回地抽取5個。求5個產品中
(1)沒有次品的概率是多少?
(2)恰好有1個次品的概率是多少?
(3)有3個以下次品的概率是多少?yyyy-M-二項分布
(用Excel計算概率)第1步:在Excel表格界面,直接點擊【fx】(插入函數(shù))命令
第2步:在【選擇類別】中點擊【統(tǒng)計】,并在【選擇函數(shù)】
中點擊【BINOMDIST】,然后單擊【確定】第3步:在【Number_s】后填入試驗成功次數(shù)(本例為1)
在【Trials】后填入總試驗次數(shù)(本例為5)
在【Probability_s】后填入試驗的成功概率(本例為
0.04)
在【Cumulative】后填入0(或FALSE),表示計算成功次數(shù)恰好等于指定數(shù)值的概率(填入1或TRUE表示計算成功次數(shù)小于或等于指定數(shù)值的累積概率值)計算二項分布的概率Excelyyyy-M-泊松分布
(Poissondistribution)1837年法國數(shù)學家泊松(D.Poisson,1781—1840)首次提出用于描述在一指定時間范圍內或在一定的長度、面積、體積之內每一事件出現(xiàn)次數(shù)的分布泊松分布的例子一定時間段內,某航空公司接到的訂票電話數(shù)一定時間內,到車站等候公共汽車的人數(shù)一定路段內,路面出現(xiàn)大損壞的次數(shù)一定時間段內,放射性物質放射的粒子數(shù)一匹布上發(fā)現(xiàn)的疵點個數(shù)一定頁數(shù)的書刊上出現(xiàn)的錯別字個數(shù)
yyyy-M-泊松分布
(概率分布函數(shù))
—給定的時間間隔、長度、面積、體積內“成功”的強度參數(shù)e=2.71828x—給定的時間間隔、長度、面積、體積內“成功”的次數(shù)yyyy-M-泊松分布
(期望值和方差)期望值
E(X)=
方差
D(X)=
0.00.20.40.6012345XP(X)0.00.20.40.60246810XP(X)l
=6l
=0.5yyyy-M-泊松分布
(期望值和方差)
yyyy-M-泊松分布
(期望值和方差)
yyyy-M-泊松分布
(期望值和方差)
yyyy-M-泊松分布
(例題分析)【例4-3】假定某航空公司預訂票處平均每小時接到42次訂票電話,那么10分鐘內恰好接到6次電話的概率是多少?解:設X=10分鐘內航空公司預訂票處接到的電話次數(shù)
yyyy-M-泊松分布
(用Excel計算概率)第1步:在Excel表格界面,直接點擊【fx】(插入函數(shù))命令
第2步:在【選擇類別】中點擊【統(tǒng)計】,并在【選擇函數(shù)】
中點擊【POISSON
】,然后單擊【確定】第3步:在【X】后填入事件出現(xiàn)的次數(shù)(本例為6)
在【Means】后填入泊松分布的均值
(本例為7)
在【Cumulative】后填入0(或FALSE),表示計算成功次數(shù)恰好等于指定數(shù)值的概率(填入1或TRUE表示計算成功次數(shù)小于或等于指定數(shù)值的累積概率值)計算泊松分布的概率Excelyyyy-M-超幾何分布
(hypergeometricdistribution)采用不重復抽樣,各次試驗并不獨立,成功的概率也互不相等總體元素的數(shù)目N很小,或樣本容量n相對于N來說較大時,樣本中“成功”的次數(shù)則服從超幾何概率分布,以摸雙色球解釋:
盒子里N個球,其中M個紅球,N-M個黑球,摸出n個球,其中紅球個數(shù)為x的概率服從超幾何分布。yyyy-M-超幾何分布
(hypergeometricdistribution)概率分布函數(shù)為yyyy-M-超幾何分布
(例題分析)【例4-4】假定有10支股票,其中有3支購買后可以獲利,另外7支購買后將會虧損。如果你打算從10支股票中選擇4支購買,但你并不知道哪3支是獲利的,哪7支是虧損的。求
(1)有3支能獲利的股票都被你選中的概率有多大?
(2)3支可獲利的股票中有2支被你選中的概率有多大?解:設N=10,M=3,n=4yyyy-M-超幾何分布
(用Excel計算概率)第1步:在Excel表格界面,直接點擊【fx】(插入函數(shù))命令
第2步:在【選擇類別】中點擊【統(tǒng)計】,并在【選擇函數(shù)】
中點擊【HYPGEOMDIST】,然后單擊【確定】第3步:在【Sample_s】后填入樣本中成功的次數(shù)x(本例為3)
在【Number_sample】后填入樣本容量n(本例為4)
在【Population_s】后填入總體中成功的次數(shù)M(本例為3)
在【Number_pop】后填入總體中的個體總數(shù)N
(本例為10)計算超幾何分布的概率Excel4.2.3連續(xù)型概率分布4.2隨機變量的概率分布yyyy-M-連續(xù)型隨機變量的概率分布連續(xù)型隨機變量可以取某一區(qū)間或整個實數(shù)軸上的任意一個值它取任何一個特定的值的概率都等于0不能列出每一個值及其相應的概率通常研究它取某一區(qū)間值的概率用概率密度函數(shù)的形式和分布函數(shù)的形式來描述yyyy-M-常用連續(xù)型概率分布yyyy-M-正態(tài)分布
(normaldistribution)由C.F.高斯(CarlFriedrichGauss,1777—1855)作為描述誤差相對頻數(shù)分布的模型而提出描述連續(xù)型隨機變量的最重要的分布許多現(xiàn)象都可以由正態(tài)分布來描述可用于近似離散型隨機變量的分布例如:二項分布經典統(tǒng)計推斷的基礎xf(x)yyyy-M-概率密度函數(shù)f(x)=隨機變量X的頻數(shù)
=正態(tài)隨機變量X的均值
=正態(tài)隨機變量X的方差
=3.1415926;e=2.71828x=隨機變量的取值(-
<x<+
)yyyy-M-正態(tài)分布函數(shù)的性質圖形是關于x=
對稱鐘形曲線,且峰值在x=
處均值
和標準差
一旦確定,分布的具體形式也惟一確定,不同參數(shù)正態(tài)分布構成一個完整的“正態(tài)分布族”均值
可取實數(shù)軸上的任意數(shù)值,決定正態(tài)曲線的具體位置;標準差決定曲線的“陡峭”或“扁平”程度。
越大,正態(tài)曲線扁平;
越小,正態(tài)曲線越高陡峭當X的取值向橫軸左右兩個方向無限延伸時,曲線的兩個尾端也無限漸近橫軸,理論上永遠不會與之相交正態(tài)隨機變量在特定區(qū)間上的取值概率由正態(tài)曲線下的面積給出,而且其曲線下的總面積等于1
yyyy-M-
和
對正態(tài)曲線的影響xf(x)CAB
=1/2
1
2
=1yyyy-M-正態(tài)分布的概率概率是曲線下的面積!abxf(x)yyyy-M-標準正態(tài)分布
(standardizenormaldistribution)
標準正態(tài)分布的概率密度函數(shù)隨機變量具有均值為0,標準差為1的正態(tài)分布任何一個一般的正態(tài)分布,可通過下面的線性變換轉化為標準正態(tài)分布
標準正態(tài)分布的分布函數(shù)yyyy-M-正態(tài)分布
(用Excel計算正態(tài)分布的概率)第1步:在Excel表格界面中,點擊“fx
”(插入函數(shù))命令第2步:在【選擇類別】中點擊【統(tǒng)計】,并在【選擇函數(shù)】
中點擊【NORMDIST】,然后單擊【確定】第3步:在【X】后輸入正態(tài)分布函數(shù)計算的區(qū)間點(即x值)
在【Mean】后輸入正態(tài)分布的均值在【Standard_dev】后輸入正態(tài)分布的標準差在【Cumulative】后輸入1(或TRUE)表示計算事件出現(xiàn)次數(shù)小于或等于指定數(shù)值的累概率單擊【確定】yyyy-M-正態(tài)分布
(計算標準正態(tài)分布的概率和反函數(shù)值)第1步:在Excel表格界面中,點擊“fx
”(插入函數(shù))命令第2步:在【選擇類別】中點擊【統(tǒng)計】,并在【選擇函數(shù)】中點擊
【NORMSDIST】,單擊【確定】第3步:在【Z】后輸入Z的值。單擊【確定】第1步:在Excel表格界面中,點擊“fx
”(插入函數(shù))命令第2步:在【選擇類別】中點擊【統(tǒng)計】,并在【選擇函數(shù)】中點擊
【NORMSINV】,然后單擊【確定】第3步:在【Probability】后輸入給定的概率值。單擊【確定】計算概率計算z值yyyy-M-正態(tài)分布
(例題分析)【例4-5】計算以下概率
(1)
X~N(50,102),求和
(2)
Z~N(0,1),求和
(3)正態(tài)分布概率為0.05時,求標準正態(tài)累積分布函數(shù)的反函數(shù)值z
(4)X~N(50,102),求
=1-正態(tài)分布的計算概率
Excelyyyy-M-正態(tài)分布經驗法則:
正態(tài)隨機變量
落入期望加減1個標準差的概率是68.27%
落入期望加減2個標準差的概率是95.45%
落入期望加減3個標準差的概率是99.73%yyyy-M-數(shù)據(jù)正態(tài)性的評估對數(shù)據(jù)畫出頻數(shù)分布的直方圖或莖葉圖若數(shù)據(jù)近似服從正態(tài)分布,則圖形的形狀與上面給出的正態(tài)曲線應該相似繪制正態(tài)概率圖。有時也稱為分位數(shù)—分位數(shù)圖或稱Q-Q圖或稱為P-P圖用于考察觀測數(shù)據(jù)是否符合某一理論分布,如正態(tài)分布、指數(shù)分布、t分布等等P-P圖是根據(jù)觀測數(shù)據(jù)的累積概率與理論分布(如正態(tài)分布)的累積概率的符合程度繪制的Q-Q圖則是根據(jù)觀測值的實際分位數(shù)與理論分布(如正態(tài)分布)的分位數(shù)繪制的使用非參數(shù)檢驗中的Kolmogorov-Smirnov檢驗(K-S檢驗)yyyy-M-用SPSS繪制正態(tài)概率圖
第1步:選擇【Graphs】下拉菜單,并選擇【P-P】
或【Q-Q】選項進入主對話框第2步:在主對話框中將變量選入【Variables】
,點擊【OK】繪制正態(tài)概率圖SPSSyyyy-M-正態(tài)概率圖的繪制
(例題分析)P-P圖Q-Q圖
【例4-6】第2章中電腦銷售額的正態(tài)概率圖yyyy-M-正態(tài)概率圖的分析
(normalprobabilityplots)實際應用中,只有樣本數(shù)據(jù)較多時正態(tài)概率圖的效果才比較好。當然也可以用于小樣本,但此時可能會出現(xiàn)與正態(tài)性有較大偏差的情況在分析正態(tài)概率圖時,最好不要用嚴格的標準去衡量數(shù)據(jù)點是否在一條直線上,只要近似在一條直線上即可對于樣本點中數(shù)值最大或最小的點也可以不用太關注,除非這些點偏離直線特別遠,因為這些點通常會與直線有偏離。如果某個點偏離直線特別遠,而其他點又基本上在直線上時,這個點可能是離群點,可不必考慮4.3由正態(tài)分布導出的幾個重要分布
4.3.1t
分布
4.3.2
2
分布
4.3.3F
分布第4章概率分布4.3.2
2
分布4.3由正態(tài)分布導出的幾個重要分布yyyy-M-由阿貝(Abbe)
于1863年首先給出,后來由海爾墨特(Hermert)和卡·皮爾遜(K·Pearson)
分別于1875年和1900年推導出來隨機變量,則隨機變量
相互獨立,且,則c2-分布
(
2-distribution)yyyy-M-分布的變量值始終為正分布的形狀取決于其自由度n的大小,通常為不對稱的正偏分布,但隨著自由度的增大逐漸趨于對稱,
時,
2
分布趨于正態(tài)分布。期望為:E(
2)=n,方差為:D(
2)=2n(n為自由度)可加性:若U和V為兩個獨立的
2分布隨機變量,U~
2(n1),V~
2(n2),則U+V這一隨機變量服從自由度為n1+n2的
2分布c2-分布
(性質和特點)yyyy-M-不同自由度的c2-分布c2n=1n=4n=10n=20yyyy-M-c2-分布
(用Excel計算c2分布的概率)利用Excel提供的【CHIDIST】統(tǒng)計函數(shù),計算c2分布右單尾的概率值語法:CHIDIST(x,degrees_freedom)
,其中df為自由度,x,是隨機變量的取值利用【CHIINV】函數(shù)則可以計算給定右尾概率和自由度時相應的反函數(shù)值語法:CHIINV(probability,degrees_freedom)
計算c2
分布的概率Excel4.3.1t
分布4.3由正態(tài)分布導出的幾個重要分布yyyy-M-t-分布
(t-distribution)提出者是WilliamGosset,也被稱為學生分布(student’st)
隨機變量
,且XY相互獨立,
則
的分布稱為t分布,記為t(n),n為自由度。n=1,分布為柯西分布,無期望,無方差。
n=2,E(t)=0,無方差。
n>=3,E(t)=0,D(t)=n/(n-2)。yyyy-M-t-分布
(t-distribution)t
分布是類似正態(tài)分布的一種對稱分布,通常要比正態(tài)分布平坦和分散,尾部比正態(tài)分布厚。一個特定的t分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布xt
分布與標準正態(tài)分布的比較t分布標準正態(tài)分布t不同自由度的t分布標準正態(tài)分布t(df=13)t(df=5)zyyyy-M-t-分布
(t-distribution)t
分布的一個重要應用
X1X2……Xn是來自于正態(tài)總體
的樣本,則
yyyy-M-t-分布
(用Excel計算t分布的概率和臨界值)利用Excel中的【TDIST】統(tǒng)計函數(shù),可以計算給定值和自由度時分布的概率值語法:TDIST(x,degrees_freedom,tails)
利用【TINV】函數(shù)則可以計算給定概率和自由度時的相應
語法:TINV(probability,degrees_freedom)計算t分布的臨界值Excel4.3.3F
分布4.3由正態(tài)分布導出的幾個重要分布yyyy-M-為紀念統(tǒng)計學家費希爾(R.A.Fisher)
以其姓氏的第一個字母來命名則設若U為服從自由度為n1的
2分布,即U~
2(n1),V為服從自由度為n2的
2分布,即V~
2(n2),且U和V相互獨立,則稱F為服從自由度n1和n2的F分布,記為F-分布
(F
distribution)yyyy-M-不同自由度的F分布F(1,10)(5,10)(10,10)yyyy-M-F分布的期望和方差
設
,則
F分布與t分布的關系
F-分布的性質
(F
distribution)yyyy-M-F-分布
(用Excel計算F分布的概率和臨街值)利用Excel提供的【FDIST】統(tǒng)計函數(shù),計算分布右單尾的概率值語法:FDIST(x,degrees_freedom1,degrees_freedom2)利用【FINV】函數(shù)則可以計算給定單尾概率和自由度時的相應
語法:
FINV(probability,degrees_freedom1,degrees_freedom2)
計算F分布的概率Excel4.4樣本統(tǒng)計量的概率分布
4.4.1統(tǒng)計量及其分布
4.4.2樣本均值的分布
4.4.3其他統(tǒng)計量的分布
4.4.4統(tǒng)計量的標準誤差第4章概率分布4.4.1統(tǒng)計量及其分布4.4樣本統(tǒng)計量的概率分布yyyy-M-參數(shù)和統(tǒng)計量參數(shù)(parameter)描述總體特征的概括性數(shù)字度量,是研究者想要了解的總體的某種特征值一個總體的參數(shù):總體均值(
)、標準差(
)、總體比例(
);兩個總體參數(shù):(
1-2)、(
1-2)、(
1/2)總體參數(shù)通常用希臘字母表示統(tǒng)計量(statistic)用來描述樣本特征的概括性數(shù)字度量,它是根據(jù)樣本數(shù)據(jù)計算出來的一些量,是樣本的函數(shù)一個總體參數(shù)推斷時的統(tǒng)計量:樣本均值(
x)、樣本標準差(s)、樣本比例(p)等;兩個總體參數(shù)推斷時的統(tǒng)計量:(
x1-
x2)、(p1-p2)、(s1/s2)樣本統(tǒng)計量通常用小寫英文字母來表示yyyy-M-樣本統(tǒng)計量是隨機變量,樣本統(tǒng)計量的概率分布—抽樣分布,是一種理論分布在重復選取容量為n的樣本時,由該統(tǒng)計量的所有可能取值形成的相對頻數(shù)分布統(tǒng)計量的抽樣分布可以度量用統(tǒng)計量推斷總體參數(shù)的可靠性,構成了統(tǒng)計推斷的理論基礎。 抽樣分布
(samplingdistribution)yyyy-M-抽樣分布的形成過程
(samplingdistribution)總體樣本計算樣本統(tǒng)計量如:樣本均值、比例、方差4.4.2樣本均值的分布4.4樣本統(tǒng)計量的概率分布yyyy-M-在重復選取容量為n的樣本時,由樣本均值的所有可能取值形成的相對頻數(shù)分布總體為N,重復抽樣,可能的樣本數(shù)為Nn
,不重復抽樣為,不可能全部抽出,
所以是一種理論分布。推斷總體均值
的理論基礎 樣本均值的分布yyyy-M-樣本均值的分布
(例題分析)【例4-10】設一個總體,含有4個元素(個體)
,即總體單位數(shù)N=4。4
個個體分別為x1=1,x2=2,x3=3,x4=4
??傮w的均值、方差及分布如下總體分布14230.1.2.3均值和方差yyyy-M-樣本均值的分布
(例題分析)
現(xiàn)從總體中抽取n=2的簡單隨機樣本,在重復抽樣條件下,共有42=16個樣本。所有樣本的結果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)yyyy-M-樣本均值的分布
(例題分析)
計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)x樣本均值的抽樣分布1.000.10.20.3P
(x)1.53.04.03.52.02.5yyyy-M-樣本均值的分布與總體分布的比較
(例題分析)
=2.5σ2=1.25總體分布樣本均值分布yyyy-M-樣本均值的分布樣本均值的期望值和方差樣本均值的分布
(數(shù)學期望與方差)
yyyy-M-證明
隨機樣本X1、X2、……,Xn取自
總體
,則樣本均值的分布的證明yyyy-M-
樣本均值的分布的證明yyyy-M-
樣本均值的分布的證明yyyy-M-樣本均值的分布
與中心極限定理
=50
=10X總體分布n=4抽樣分布xn=16當總體服從正態(tài)分布N(μ,σ2)時,來自該總體的所有容量為n的樣本的均值
x也服從正態(tài)分布,
x
的期望值為μ,方差為σ2/n。即
x~N(μ,σ2/n)yyyy-M-中心極限定理
(centrallimittheorem)當樣本容量足夠大時(n
30),樣本均值的抽樣分布逐漸趨于正態(tài)分布從均值為
,方差為
2的一個任意總體中抽取容量為n的樣本,當n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個任意分布的總體xyyyy-M-中心極限定理
(centrallimittheorem)嚴格的表述:林德伯格-列維(Lindeberg-Levy)中心極限定理
設隨機變量X1,X2,...,Xn獨立同分布,且具有有限的數(shù)學期望和方差E(Xi)=μ,D(Xi)=σ2≠0(i=1,2,...n)。則:
其中Φ(z)是標準正態(tài)分布的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 萬達商業(yè)廣場2024年物業(yè)綜合管理協(xié)議版B版
- 論文答辯精要解析
- 2025年度拆遷安置住房租賃及物業(yè)管理合同4篇
- 二零二五年度建筑工程項目建造師勞動合同范本9篇
- 2025年度產教融合校企產學研合作項目執(zhí)行框架協(xié)議4篇
- 二零二五年度餐廳經理勞動合同范本:服務質量提升3篇
- 二零二四年事業(yè)單位委托第三方社保代繳與員工績效獎勵協(xié)議3篇
- 二零二五年度大米產品綠色包裝與環(huán)保材料應用合同2篇
- 2024飼料行業(yè)客戶數(shù)據(jù)共享協(xié)議
- 2025年度商業(yè)地產項目場地租賃及物業(yè)管理合同12篇
- 國家自然科學基金項目申請書
- 電力電纜故障分析報告
- 中國電信網絡資源管理系統(tǒng)介紹
- 2024年浙江首考高考選考技術試卷試題真題(答案詳解)
- 《品牌形象設計》課件
- 倉庫管理基礎知識培訓課件1
- 藥品的收貨與驗收培訓課件
- GH-T 1388-2022 脫水大蒜標準規(guī)范
- 高中英語人教版必修第一二冊語境記單詞清單
- 政府機關保潔服務投標方案(技術方案)
- HIV感染者合并慢性腎病的治療指南
評論
0/150
提交評論