第4章 抽樣分布_第1頁
第4章 抽樣分布_第2頁
第4章 抽樣分布_第3頁
第4章 抽樣分布_第4頁
第4章 抽樣分布_第5頁
已閱讀5頁,還剩51頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第4

章概率分布4.1度量事件發(fā)生的可能性4.2隨機變量概率分布4.3由正態(tài)分布導出的幾個重要分布4.4樣本統(tǒng)計量的概率分布18:28:014.1度量事件發(fā)生的可能性第4章概率分布18:28:0118:28:01什么是概率?

(probability)概率是對事件發(fā)生的可能性大小的度量明天降水的概率是80%一只股票明天上漲的可能性是30%一個介于0和1之間的一個值事件A的概率記為P(A)18:28:01怎樣獲得概率?重復試驗獲得概率當試驗的次數(shù)很多時,概率P(A)可以由所觀察到的事件A發(fā)生次數(shù)(頻數(shù))的比例來逼近在相同條件下,重復進行n次試驗,事件A發(fā)生了m次,則事件A發(fā)生的概率可以寫為

4.2隨機變量的概率分布

4.2.1隨機變量及其概括性度量

4.2.2離散型概率分布

4.2.3連續(xù)型概率分布第4章概率分布18:28:0118:28:01什么是隨機變量?

(randomvariables)事先不知道會出現(xiàn)什么結果投擲兩枚硬幣出現(xiàn)正面的數(shù)量一座寫字樓每平方米的出租價格一個消費者對某一特定品牌飲料的偏好一般用X,Y,Z來表示根據(jù)取值情況的不同分為:離散型隨機變量和連續(xù)型隨機變量18:28:01離散型隨機變量

(discreterandomvariables)隨機變量X

取有限個值或所有取值都可以逐個列舉出來x1,x2,…以確定的概率取這些不同的值離散型隨機變量的一些例子試驗隨機變量可能的取值抽查100個產品一家餐館營業(yè)一天電腦公司一個月的銷售銷售一輛汽車取到次品的個數(shù)顧客數(shù)銷售量顧客性別0,1,2,…,1000,1,2,…0,1,2,…男性為0,女性為118:28:01連續(xù)型隨機變量

(continuousrandomvariables)可以取一個或多個區(qū)間中任何值所有可能取值不可以逐個列舉出來,而是取數(shù)軸上某一區(qū)間內的任意點連續(xù)型隨機變量的一些例子試驗隨機變量可能的取值抽查一批電子元件新建一座住宅樓測量一個產品的長度使用壽命(小時)半年后完工的百分比測量誤差(cm)X00

X100X04.2.2離散型概率分布4.2隨機變量的概率分布18:28:0118:28:01離散型隨機變量的概率分布列出離散型隨機變量X的所有可能取值列出隨機變量取這些值的概率通常用下面的表格來表示X=xix1,x2

,…

,xnP(X=xi)=pip1,p2

,…

,pn

P(X=xi)=pi稱為離散型隨機變量的概率函數(shù)pi0;常用的有二項分布、泊松分布、超幾何分布等18:28:01二項分布

(Bernoulli試驗)

二項分布建立在Bernoulli試驗基礎上貝努里試驗滿足下列條件一次試驗只有兩個可能結果,即“成功”和“失敗”“成功”是指我們感興趣的某種特征一次試驗“成功”的概率為p,失敗的概率為q=1-p,且概率p對每次試驗都是相同的

試驗是相互獨立的,并可以重復進行n次

在n次試驗中,“成功”的次數(shù)對應一個離散型隨機變量X

18:28:01二項分布

(Binomialdistribution)重復進行

n

次試驗,出現(xiàn)“成功”的次數(shù)的概率分布稱為二項分布,記為X~B(n,p)設X為n次重復試驗中出現(xiàn)成功的次數(shù),X取x

的概率為期望值4.方差=E(X)=np2

=D(X)=npq18:28:01泊松分布

(Poissondistribution)用于描述在一指定時間范圍內或在一定的長度、面積、體積之內某一事件出現(xiàn)次數(shù)的分布計數(shù)數(shù)據(jù)的概率分布泊松分布的例子一定時間段內,某航空公司接到的訂票電話數(shù)一定時間內,到車站等候公共汽車的人數(shù)一定路段內,路面出現(xiàn)大損壞的次數(shù)一定時間段內,放射性物質放射的粒子數(shù)一匹布上發(fā)現(xiàn)的疵點個數(shù)一定頁數(shù)的書刊上出現(xiàn)的錯別字個數(shù)

18:28:01泊松分布

(概率分布函數(shù))—給定的時間間隔、長度、面積、體積內“成功”的平均數(shù)e=2.71828x—給定的時間間隔、長度、面積、體積內“成功”的次數(shù)期望值

E(X)=方差

D(X)=

4.2.3連續(xù)型概率分布4.2隨機變量的概率分布18:28:0118:28:01連續(xù)型隨機變量的概率分布連續(xù)型隨機變量可以取某一區(qū)間或整個實數(shù)軸上的任意一個值它取任何一個特定的值的概率都等于0不能列出每一個值及其相應的概率通常研究它取某一區(qū)間值的概率用概率密度函數(shù)的形式和分布函數(shù)的形式來描述常見的分布類型有正態(tài)分布、指數(shù)分布等18:28:01正態(tài)分布

(normaldistribution)由C.F.高斯(CarlFriedrichGauss,1777—1855)作為描述誤差相對頻數(shù)分布的模型而提出描述連續(xù)型隨機變量的最重要的分布許多現(xiàn)象都可以由正態(tài)分布來描述可用于近似離散型隨機變量的分布例如:二項分布經典統(tǒng)計推斷的基礎18:28:01正態(tài)分布函數(shù)的性質圖形是關于x=對稱鐘形曲線,且峰值在x=處均值和標準差一旦確定,分布的具體形式也惟一確定,不同參數(shù)正態(tài)分布構成一個完整的“正態(tài)分布族”均值可取實數(shù)軸上的任意數(shù)值,決定正態(tài)曲線的具體位置;標準差決定曲線的“陡峭”或“扁平”程度。越大,正態(tài)曲線扁平;越小,正態(tài)曲線越高陡峭當X的取值向橫軸左右兩個方向無限延伸時,曲線的兩個尾端也無限漸近橫軸,理論上永遠不會與之相交正態(tài)隨機變量在特定區(qū)間上的取值概率由正態(tài)曲線下的面積給出,而且其曲線下的總面積等于1

18:28:01標準正態(tài)分布

(standardizenormaldistribution)隨機變量具有均值為0,標準差為1的正態(tài)分布任何一個一般的正態(tài)分布,可通過下面的線性變換轉化為標準正態(tài)分布18:28:01標準正態(tài)分布的分位點概率是曲線下的面積:xf(x)18:28:01數(shù)據(jù)正態(tài)性的評估用于考察觀測數(shù)據(jù)是否符合某一理論分布,如正態(tài)分布、指數(shù)分布、t分布等等;可以通過繪制正態(tài)概率圖來評估樣本的正態(tài)性;有的稱為P-P圖,有的稱為Q-Q圖;P-P圖是根據(jù)觀測數(shù)據(jù)的累積概率與理論分布(如正態(tài)分布)的累積概率的符合程度繪制的;Q-Q圖則是根據(jù)觀測值的實際分位數(shù)與理論分布(如正態(tài)分布)的分位數(shù)繪制的;18:28:01正態(tài)概率圖的繪制

(例題分析)P-P圖Q-Q圖

【例4-6】第2章中電腦銷售額的正態(tài)概率圖18:28:01正態(tài)概率圖的分析

(normalprobabilityplots)只有樣本數(shù)據(jù)較多時正態(tài)概率圖的效果才比較好;用于小樣本可能會出現(xiàn)與正態(tài)性有較大偏差的情況只要近似在一條直線上即可;對于樣本點中數(shù)值最大或最小的點也可以不用太關注,除非這些點偏離直線特別遠;如果某個點偏離直線特別遠,而其他點又基本上在直線上時,這個點可能是離群點,可不必考慮。4.3由正態(tài)分布導出的幾個重要分布

4.3.12分布

4.3.2

t分布

4.3.3F

分布第4章概率分布18:28:01設,則;令,則Y服從自由度為1的2分布,即:

當總體,從中抽取容量為n的樣本,則:2分布

(2

distribution)2分布

(性質和特點)卡方分布的變量值始終為正;分布的形狀取決于其自由度n的大小,通常為不對稱的正偏分布,但隨著自由度的增大逐漸趨于對稱;可加性:若U和V為兩個獨立的2分布隨機變量,U~2(n1),V~2(n2),則(U+V)這一隨機變量服從自由度為(n1+n2)的2分布:卡方分布的期望值為:E(2)=n,方差為:D(2)=2n。c2分布

(舉例)選擇容量為n的簡單隨機樣本計算樣本方差S2計算卡方值2=(n-1)S2/σ2計算出所有的

2值不同容量樣本的卡方分布c2n=1n=4n=10n=20ms總體例:t

分布設X~N(0,1)

,Y~

2(n),且X,Y獨立,則稱統(tǒng)計量:服從自由度為n的t分布,記為t

~t

(n)。對于來自于的一個樣本,則有:t分布的形態(tài)Xt

分布與正態(tài)分布的比較正態(tài)分布t分布t不同自由度的t分布正態(tài)分布t(df=13)t(df=5)Zt分布設U為服從自由度為n1的2分布,即U~2(n1),V為服從自由度為n2的2分布,即V~2(n2),且U和V相互獨立,則:

稱統(tǒng)計量F為服從自由度n1和n2的F分布,記為:F分布

(F

distribution)F分布

(圖示)

不同自由度的F分布F(1,10)(5,10)(10,10)F4.4樣本統(tǒng)計量的概率分布

4.4.1統(tǒng)計量及其分布

4.4.2樣本均值的分布

4.4.3其他統(tǒng)計量的分布

4.4.4統(tǒng)計量的標準誤差第4章概率分布18:28:014.4.1統(tǒng)計量及其分布4.4樣本統(tǒng)計量的概率分布18:28:0118:28:01參數(shù)和統(tǒng)計量參數(shù)(parameter)描述總體特征的概括性數(shù)字度量,是研究者想要了解的總體的某種特征值;一個總體的參數(shù):總體均值()、標準差()、總體比例();兩個總體參數(shù):(1-2)、(1-2)、(1/2);總體參數(shù)通常用希臘字母表示;統(tǒng)計量(statistic)用來描述樣本特征的概括性度量,它是根據(jù)樣本數(shù)據(jù)計算出來的一些量,是樣本的函數(shù);一個總體參數(shù)推斷時的統(tǒng)計量:樣本均值(x)、樣本標準差(s)、樣本比例(p)等;兩個總體參數(shù)推斷時的統(tǒng)計量:(x1-x2)、(p1-p2)、(s1/s2)樣本統(tǒng)計量通常用小寫英文字母來表示。18:28:01樣本統(tǒng)計量的概率分布,是一種理論分布;在重復選取容量為n的樣本時,由該統(tǒng)計量的所有可能取值形成的相對頻數(shù)分布;樣本統(tǒng)計量是隨機變量;如樣本均值,樣本比例,樣本方差等結果來自容量相同的所有可能樣本;提供了樣本統(tǒng)計量長遠而穩(wěn)定的信息,是進行推斷的理論基礎,也是抽樣推斷科學性的重要依據(jù)。抽樣分布

(samplingdistribution)18:28:01在重復選取容量為n的樣本時,由樣本均值的所有可能取值形成的頻數(shù)分布;一種理論概率分布;推斷總體均值的理論基礎。

樣本均值的分布18:28:01樣本均值的分布

(例題分析)【例4-10】設一個總體,含有4個元素(個體)

,即總體單位數(shù)N=4。4個個體分別為x1=1,x2=2,x3=3,x4=4

??傮w的均值、方差及分布如下:總體分布14230.1.2.3均值和方差:18:28:01樣本均值的分布

(例題分析)

現(xiàn)從總體中抽取n=2的簡單隨機樣本,在重復抽樣條件下,共有42=16個樣本。所有樣本的結果為:3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)18:28:01樣本均值的分布

(例題分析)計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)x樣本均值的抽樣分布1.000.10.20.3P

(x)1.53.04.03.52.02.518:28:01樣本均值的分布與總體分布的比較

(例題分析)總體分布樣本均值分布18:28:01中心極限定理

(centrallimittheorem)當樣本容量足夠大時(n

>30),樣本均值的抽樣分布逐漸趨于正態(tài)分布。從均值為,方差為

2的一個任意總體中抽取容量為n的樣本,當n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布;一個任意分布的總體x18:28:01樣本均值的抽樣分布與總體分布的關系總體分布正態(tài)分布非正態(tài)分布大樣本小樣本樣本均值正態(tài)分布樣本均值正態(tài)分布樣本均值非正態(tài)分布18:28:01樣本均值的分布樣本均值的期望值和方差樣本均值的抽樣分布

(正態(tài)總體、方差已知)樣本均值的抽樣分布

(方差未知、小樣本)1.假定條件總體服從正態(tài)分布,但方差(2)

未知小樣本(n<30)樣本均值服從t

分布:那么,方差未知大樣本時該怎么辦?18:284.4.3其他統(tǒng)計量的分布4.4樣本統(tǒng)計量的概率分布18:28:0118:28:01總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比;某種性別的人與全部人數(shù)之比;合格品(或不合格品)與全部產品總數(shù)之比;總體比例可表示為:樣本比例可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論