極限定理和抽樣分布_第1頁
極限定理和抽樣分布_第2頁
極限定理和抽樣分布_第3頁
極限定理和抽樣分布_第4頁
極限定理和抽樣分布_第5頁
已閱讀5頁,還剩22頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

極限定理和抽樣分布第1頁,共27頁,2023年,2月20日,星期五切貝謝夫定理:Chebyshev’sTheorem如果k=2,則至少有75%的個案分布在2倍的標(biāo)準(zhǔn)差之內(nèi);如果k=3,則至少有89%但個案分布在3倍的標(biāo)準(zhǔn)差之內(nèi)。第2頁,共27頁,2023年,2月20日,星期五切貝謝夫不等式我們知道一個分布的特征值(如均值和方差)去推算這個分布的情況第3頁,共27頁,2023年,2月20日,星期五當(dāng)不知道總體分布而只知道總體特征值的時候,對概率分布做最保守的估計。注意:(1)這是保守的估計,因為不知道總體的分布;(2)由于這里指的是絕對離差,所以我們難以推知一端數(shù)據(jù)的概率,除非我們知道這個分布是對稱分布。第4頁,共27頁,2023年,2月20日,星期五極限定理:研究觀察次數(shù)趨向無限次時,隨機(jī)事件的變化方式。分類:1大數(shù)定理:在什么條件下,隨機(jī)事件可以轉(zhuǎn)化為不可能事件或必然事件。(特征值)(LawofLargeNumbers)2中心極限定理:在什么條件下,隨機(jī)變量之和的分布可以近似為正態(tài)分布。(CentralLimitTheory)第5頁,共27頁,2023年,2月20日,星期五一、貝努里大數(shù)定理(N變大時,諸隨機(jī)變量的均值逐步接近總體的均值)樣本成數(shù),實際上是指的樣本頻率。在講離散型隨機(jī)變量的概率分布時,我們將隨機(jī)變量X定義為“A類事件出現(xiàn)的次數(shù)”。我們將出現(xiàn)的實際次數(shù)(m)除以總試驗次數(shù)(n),得到的A類實際出現(xiàn)的頻率,我們叫做樣本成數(shù):,這是一個已知的、固定的值。樣本均值,是指將每一次獨立試驗的X的實際取值取平均數(shù),得到的是樣本均值:第6頁,共27頁,2023年,2月20日,星期五在趨于極限時,離散變量的特征值行為:頻率值趨近于概率值,或者說樣本成數(shù)無限趨近于總體成數(shù)。(可以看作n次獨立實驗,就有n個獨立同分布的隨機(jī)變量,每一個都是二點分布,數(shù)學(xué)期望p方差pq)第7頁,共27頁,2023年,2月20日,星期五二、切貝謝夫大數(shù)定理(N變大時,諸隨機(jī)變量的均值逐步接近總體的均值)在趨于極限時,連續(xù)變量的特征值行為:平均值趨近于數(shù)學(xué)期望,或者說樣本均值無限趨近于總體均值。第8頁,共27頁,2023年,2月20日,星期五三、中心極限定理第9頁,共27頁,2023年,2月20日,星期五幾種等效的公式:第10頁,共27頁,2023年,2月20日,星期五抽樣分布1總體分布populationdistributionX的所有取值形成的分布。我們在分析中往往不能知道總體分布的情況。2樣本分布

Sampledistribution

3抽樣分布第11頁,共27頁,2023年,2月20日,星期五理解抽樣分布(1)設(shè)想我們從一個總體中抽取一個樣本容量為n的樣本;(2)抽取之后我們得到了樣本;(3)我們現(xiàn)在把這個樣本均值也看作是一個隨機(jī)變量(它的確是個隨機(jī)變量);(4)樣本均值的概率分布就是當(dāng)我們重復(fù)不斷抽取n個樣本時,我們得到的不同的樣本均值出現(xiàn)的可能性是不同的,也就是說它會有一個概率分布。我們把這個分布叫做樣本均值的抽樣分布;(5)當(dāng)樣本容量增大時,無論總體是什么分布,根據(jù)中心極限定理,樣本均值的抽樣分布是一個正態(tài)分布。樣本均值的數(shù)學(xué)期望就是總體的均值,而它的方差是總體方差的1/n。第12頁,共27頁,2023年,2月20日,星期五第13頁,共27頁,2023年,2月20日,星期五樣本均值的抽樣分布(連續(xù)型變量)樣本均值是什么形式,與兩個因素有關(guān)系:(1)總體分布(2)樣本容量當(dāng)n>=50時,不論總體分布如何,樣本均值均服從正態(tài)分布。(這里也可以寫出均值的均值)(注意這里用S表示樣本的標(biāo)準(zhǔn)差)樣本方差在樣本容量逐漸增大時和總體方差一樣了。是以總體為期望值的。第14頁,共27頁,2023年,2月20日,星期五則當(dāng)n很大時,t分布的方差為1,接近標(biāo)準(zhǔn)正態(tài)分布。為了查表方便,n>30時,當(dāng)成正態(tài)分布第15頁,共27頁,2023年,2月20日,星期五當(dāng)總體為有限總體時且不放回抽樣時,n>=50樣本的均值服從正態(tài)分布這里需要方差已知校正系數(shù)當(dāng)總體為有限正態(tài)總體時且不放回抽樣時,n<50樣本的均值服從正態(tài)分布,必須是方差已知

第16頁,共27頁,2023年,2月20日,星期五總結(jié)樣本均值的抽樣分布:抽樣誤差/標(biāo)準(zhǔn)誤第17頁,共27頁,2023年,2月20日,星期五樣本方差的抽樣分布統(tǒng)計證明,當(dāng)總體分布為正態(tài)分布時,則比值:當(dāng)n變大時,卡方分布變成正態(tài)分布。第18頁,共27頁,2023年,2月20日,星期五當(dāng)n逐漸增大時,我們將隨機(jī)變量X看作是n個獨立同分布的二點分布中事件A出現(xiàn)的次數(shù),這樣X實際上是n個二點隨機(jī)變量之和。根據(jù)中心極限定理,X~N(np,npq)樣本成數(shù)的抽樣分布第19頁,共27頁,2023年,2月20日,星期五二項分布的極限行為:在這里,我們討論在何種情況下,二項分布會趨近于正態(tài)分布呢?取決于兩個條件:1、二項分布的偏度p(總體分布)2、樣本容量nP的取值為什么很重要?因為p還涉及到總體分布的方差??傮w分布方差越大,就要求n越大才會形成正態(tài)分布第20頁,共27頁,2023年,2月20日,星期五若p取值偏小,則雖然n比較大,以正態(tài)分布模擬二項分布誤差太大:第21頁,共27頁,2023年,2月20日,星期五按二項分布計算第22頁,共27頁,2023年,2月20日,星期五按樣本成數(shù)計算第23頁,共27頁,2023年,2月20日,星期五若x~B(10,0.5)第24頁,共27頁,202

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論