統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)_第1頁
統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)_第2頁
統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)_第3頁
統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)_第4頁
統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)_第5頁
已閱讀5頁,還剩73頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第1頁,共78頁,2023年,2月20日,星期二總體——具有共同性質(zhì)的個(gè)體所組成的集團(tuán),稱為總體;特征:(1)同質(zhì)性;(2)變異性;(3)大量性。

總體中的一個(gè)成員稱為個(gè)體;

含有有限個(gè)個(gè)體的總體稱為有限總體;

包含有無限多個(gè)個(gè)體的總體叫無限總體;樣本——從總體中隨機(jī)抽取一部分個(gè)體所組成的集合。第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第一節(jié)基本概念一、總體與樣本第2頁,共78頁,2023年,2月20日,星期二

為了能可靠地從樣本來估計(jì)總體,要求樣本必須能夠代表總體,才能正確估計(jì)總體。只有從總體中隨機(jī)抽取的樣本才具有代表性。

隨機(jī)抽取的樣本——是指總體中的每一個(gè)個(gè)體都有同等的機(jī)會(huì)被抽取組成樣本。(等可能性)

總體中所包含的每個(gè)總體單元都是相互獨(dú)立、相互無依存關(guān)系,被抽取的每個(gè)個(gè)體必須具有偶然性,這是隨機(jī)抽樣應(yīng)遵守的基本原理。第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第一節(jié)基本概念第3頁,共78頁,2023年,2月20日,星期二樣本中所包含的個(gè)體數(shù)目叫樣本容量或大小(samplesize),常記為n。小樣本:

n≤30的樣本;大樣本:

n>30的樣本。◆劃分大樣本和小樣本是必要的,因?yàn)槎叩慕y(tǒng)計(jì)方法不同。

研究的目的是要了解總體,然而能觀測到的卻是樣本,通過樣本來推斷總體是統(tǒng)計(jì)分析的基本特點(diǎn)。第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第一節(jié)基本概念第4頁,共78頁,2023年,2月20日,星期二二、隨機(jī)變量第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第一節(jié)基本概念

按變量的性質(zhì)不同,一般可以分為數(shù)量性狀資料、質(zhì)量性狀資料和半定量(等級(jí))資料(一)數(shù)量性狀資料(quantitativetrait)數(shù)量性狀——是指測試、調(diào)查的對象具有可度量或計(jì)數(shù)的性質(zhì),觀察測定數(shù)量性狀而獲得的數(shù)據(jù)就是數(shù)量狀資料。

連續(xù)型變量——又稱計(jì)量資料,能用量測手段直接測定。

離散型變量(不連續(xù)性或間斷性)——若某變量各變量之間只能以整數(shù)斷開而不能表現(xiàn)為小數(shù)的。它只能用計(jì)數(shù)的方法取得。第5頁,共78頁,2023年,2月20日,星期二(二)質(zhì)量性狀資糧質(zhì)量性狀——是指能觀察到而不能之間測量的性狀。

如葉片的顏色,麥芒的有無等;污染水體的顏色、污染物的氣味等。賦值法——統(tǒng)計(jì)分析。第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第一節(jié)基本概念(三)半定量或等級(jí)資料半定量或等級(jí)資料——是指觀察單位按所考察的性狀或指標(biāo)的等級(jí)順序分組,然后清點(diǎn)各組觀察單位的次數(shù)而得到的資料。第6頁,共78頁,2023年,2月20日,星期二三、參數(shù)與統(tǒng)計(jì)數(shù)第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第一節(jié)基本概念

在同質(zhì)性的前提下,總體具有變異性和大量性的特性。用于反映總體內(nèi)部個(gè)體間的變異程度或集中性趨勢等特征的指標(biāo)為總體參數(shù),簡稱參數(shù)。常用希臘字母表示參數(shù),例如用μ表示總體平均數(shù),用σ2表示總體方差;參數(shù)是反映某類事物的總體規(guī)律的數(shù)值,科研上目的就在于求得對總體參數(shù)的了解,總體參數(shù)是常數(shù),但不易獲得。

利用樣本資料計(jì)算得到的用于描述樣本內(nèi)部個(gè)體間的變異程度或集中趨勢等特征的一些指標(biāo),如樣本的平均數(shù)x、樣本的標(biāo)準(zhǔn)差S等成為樣本統(tǒng)計(jì)數(shù),簡稱統(tǒng)計(jì)數(shù),它是總體參數(shù)的估計(jì)值。第7頁,共78頁,2023年,2月20日,星期二四、誤差與錯(cuò)誤(一)誤差系統(tǒng)誤差:由某種確定的原因所引起的誤差。特點(diǎn)是在相同條件下重復(fù)測定時(shí),可重復(fù)出現(xiàn)。是可以測定并校正或消除的。來源:(1)方法誤差;(2)儀器誤差;(3)試劑誤差;(4)操作誤差;(5)環(huán)境條件的變化誤差。偶然誤差:是由很多不可避免且無法控制的偶然因素引起的誤差。產(chǎn)生的原因不確定,其誤差大小無規(guī)律性,不具“單向性”和“重現(xiàn)性”。偶然誤差雖不可避免,也不能校正,但若在同樣條件下對同一試樣進(jìn)行多次測定,就會(huì)發(fā)現(xiàn)隨機(jī)誤差的出現(xiàn)是服從統(tǒng)計(jì)規(guī)律的??梢岳脭?shù)理統(tǒng)計(jì)方法對試驗(yàn)數(shù)據(jù)進(jìn)行分析處理,增加重復(fù)次數(shù)。第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第一節(jié)基本概念第8頁,共78頁,2023年,2月20日,星期二四、誤差與錯(cuò)誤(二)錯(cuò)誤由于工作人員的粗心大意或不負(fù)責(zé)任(如儀器使用不當(dāng),錯(cuò)讀數(shù)據(jù),記錄不準(zhǔn),任意涂改,憑空杜撰等)所產(chǎn)生的測定值與真值的偏差,稱為錯(cuò)誤。◆

錯(cuò)誤不是統(tǒng)計(jì)學(xué)的研究內(nèi)容◆在試驗(yàn)和調(diào)查中,錯(cuò)誤應(yīng)當(dāng)、同時(shí)也可以加以消滅第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第一節(jié)基本概念第9頁,共78頁,2023年,2月20日,星期二五、準(zhǔn)確性與精確性準(zhǔn)確性——是指觀測對象的觀察值與其真值的偏離程度,偏離越小則試驗(yàn)越準(zhǔn)確。精確性——是指同一觀測對象的重復(fù)觀察值之間的彼些相符程度,即試驗(yàn)誤差的大小,誤差越小則試驗(yàn)越精確。在統(tǒng)計(jì)工作中,常用樣本的統(tǒng)計(jì)數(shù)來估計(jì)總體參數(shù)。因此,我們用統(tǒng)計(jì)數(shù)接近參數(shù)的程度來衡量統(tǒng)計(jì)數(shù)的準(zhǔn)確性高低,而用統(tǒng)計(jì)數(shù)的變異程度來衡量統(tǒng)計(jì)數(shù)的精確性高低。可見,準(zhǔn)確性與精確性是不同的概念。在一般試驗(yàn)中真值為未知數(shù),所以試驗(yàn)的準(zhǔn)確性難以確定。精確性一般是指試驗(yàn)誤差,是可以估計(jì)的。如何正確估計(jì)試驗(yàn)誤差,并減小試驗(yàn)誤差以提高試驗(yàn)精度是試驗(yàn)方法設(shè)計(jì)的主要內(nèi)容。第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第一節(jié)基本概念第10頁,共78頁,2023年,2月20日,星期二一、隨機(jī)現(xiàn)象與隨機(jī)事件(一)確定性現(xiàn)象與隨機(jī)現(xiàn)象根據(jù)客觀現(xiàn)象的特征,一般將其分為兩類:一類是在一定條件下必然出現(xiàn)(或不出現(xiàn))某種結(jié)果的現(xiàn)象,稱之為確定性現(xiàn)象。另一類現(xiàn)象是在一定條件下具有多種可能過結(jié)果,具體出現(xiàn)哪一種結(jié)果事先是不能確定的,這種在給定條件下不能確定哪一種結(jié)果會(huì)出現(xiàn)的現(xiàn)象,稱之為隨機(jī)現(xiàn)象。隨機(jī)現(xiàn)象是概率論中的主要研究對象。第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第二節(jié)概率基礎(chǔ)第11頁,共78頁,2023年,2月20日,星期二對隨機(jī)現(xiàn)象進(jìn)行觀測稱作隨機(jī)試驗(yàn)。隨機(jī)試驗(yàn)應(yīng)具下列有三個(gè)特性:可重復(fù)性:即可以在相同的條件下重復(fù)進(jìn)行試驗(yàn);非唯一性:即每次試驗(yàn)的可能結(jié)果不止一個(gè),并且事先能明確試驗(yàn)的所有可能結(jié)果;隨機(jī)性:即進(jìn)行一次試驗(yàn)之前,不能確定哪一個(gè)結(jié)果會(huì)出現(xiàn)。隨機(jī)試驗(yàn)的每一種結(jié)果或隨機(jī)現(xiàn)象的每一種表現(xiàn)稱作隨機(jī)事件,簡稱為事件。一般用字母A,B,C,……(必要時(shí)加下標(biāo))表示事件。有時(shí)也可用{……}表示事件,括號(hào)中寫明事件的內(nèi)容。

第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第二節(jié)概率基礎(chǔ)(二)隨機(jī)試驗(yàn)與隨機(jī)事件第12頁,共78頁,2023年,2月20日,星期二二、概率的概念及其計(jì)算對于一個(gè)隨機(jī)事件來說,它在一次試驗(yàn)中,可能發(fā)生,也可能不發(fā)生。既然是可能性,就有可能性的大小問題。第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第二節(jié)概率基礎(chǔ)(一)概率的概念在相同條件下,重復(fù)進(jìn)行統(tǒng)一隨機(jī)試驗(yàn),A是這個(gè)試驗(yàn)的一個(gè)結(jié)果(事件)。設(shè)試驗(yàn)的次數(shù)為n,在n次重復(fù)試驗(yàn)中A出現(xiàn)的次數(shù)為m,則事件A的頻率為:第13頁,共78頁,2023年,2月20日,星期二二、概率的概念及其計(jì)算(一)概率的概念當(dāng)試驗(yàn)次數(shù)n較小時(shí),頻率的數(shù)值有較大的波動(dòng);當(dāng)n充分大時(shí),頻率數(shù)值的波動(dòng)明顯減小,并且隨著n的增大會(huì)趨于穩(wěn)定在某個(gè)常數(shù)P。通過大量觀測可以發(fā)現(xiàn),隨機(jī)試驗(yàn)的頻率具有隨試驗(yàn)次數(shù)增加而趨向穩(wěn)定的性質(zhì),而頻率的穩(wěn)定值可以用來反映事件發(fā)生的可能性的大小。因此,可以說頻率的穩(wěn)定值P是隨機(jī)事件A的概率。即第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第二節(jié)概率基礎(chǔ)第14頁,共78頁,2023年,2月20日,星期二二、概率的概念及其計(jì)算設(shè)事件A的概率為P(A),它則具有如下性質(zhì):非負(fù)性,即0≤P(A)≤1規(guī)范性,即P(Ω)=1(必然事件)

P(Φ)=0(不可能事件)對于兩兩互不相容事件Ai(i=1,2,…),則有(二)概率的性質(zhì)第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第二節(jié)概率基礎(chǔ)第15頁,共78頁,2023年,2月20日,星期二小概率事件:隨機(jī)事件的概率很小。例如小于0.05、0.01、0.001,這樣的時(shí)間被稱為小概率事件。小概率原理:把小概率事件在一次試驗(yàn)中看成是實(shí)際不可能發(fā)生的事件稱為小概率事件實(shí)際不可能性原理,亦稱為小概率原理。小概率事件實(shí)際不可能性原理是統(tǒng)計(jì)學(xué)上進(jìn)行假設(shè)檢驗(yàn)(顯著性檢驗(yàn))的基本依據(jù)。(二)概率的性質(zhì)二、概率的概念及其計(jì)算第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第二節(jié)概率基礎(chǔ)第16頁,共78頁,2023年,2月20日,星期二例1:袋中盛有除顏色外其他完全相同的50個(gè)不同顏色的小球,其中有10個(gè)白球,充分混勻后隨意摸出一球。求所摸為白球的概率。(三)概率的計(jì)算1、古典型概率——如果一項(xiàng)隨機(jī)試驗(yàn)的全部基本事件總數(shù)有限,并且各基本事件出現(xiàn)的可能性都相同,事件A由若干基本事件所組成,則A的概率可用下式計(jì)算第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第二節(jié)概率基礎(chǔ)第17頁,共78頁,2023年,2月20日,星期二2、概率的加法公式(1)任意事件加法公式任意兩個(gè)事件和(并)的概率,等于兩事件概率的和再減去兩事件同時(shí)發(fā)生的概率。即P(A+B)=P(A)+P(B)-P(AB)(2)互斥事件的加法公式兩個(gè)互斥事件A與B之和的概率,等于這兩個(gè)事件的概率之和。即P(A+B)=P(A)+P(B)(三)概率的計(jì)算第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第二節(jié)概率基礎(chǔ)第18頁,共78頁,2023年,2月20日,星期二3、條件概率和乘法公式在實(shí)際問題中,除了要知道事件A發(fā)生概率外,有時(shí)還需要知道在“事件B已發(fā)生”的條件下,事件A發(fā)生的概率,這種概率成為條件概率,記作P(A︱B)。(三)概率的計(jì)算例2:在某廠一天兩個(gè)班次生產(chǎn)的350件產(chǎn)品中,第一班生產(chǎn)200件,含次品9件;第二班生產(chǎn)150件,含次品4件?,F(xiàn)隨機(jī)抽出一件產(chǎn)品,發(fā)現(xiàn)它是次品。問這件產(chǎn)品出自第一班的概率是多少?第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第二節(jié)概率基礎(chǔ)第19頁,共78頁,2023年,2月20日,星期二把上式的分子、分母同時(shí)除以350,得這里AB={所抽產(chǎn)品是第一班生產(chǎn)的次品}。解:記A={所抽產(chǎn)品是第一班生產(chǎn)的},B={所抽產(chǎn)品是次品}。顯然有但在已知事件B發(fā)生的條件下,A發(fā)生的概率就不同了,可以直觀的寫出條件概率為:把第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第二節(jié)概率基礎(chǔ)第20頁,共78頁,2023年,2月20日,星期二由這個(gè)定義,可得到概率的乘法公式:設(shè)A與B是任意兩個(gè)事件,且P(A)>0,P(B)>0,則P(AB)=P(B)P(A︱B)P(AB)=P(A)P(B︱A)■這就導(dǎo)出了條件概率下列一般定義:設(shè)A,B是任意兩個(gè)事件,且P(B)>0,則稱為“在事件B發(fā)生的條件下,事件A發(fā)生的條件概率”,簡稱“A關(guān)于B的條件概率”。第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第二節(jié)概率基礎(chǔ)第21頁,共78頁,2023年,2月20日,星期二例3:設(shè)一批產(chǎn)品共N件,其中有M件次品,不放回地抽取2件,求事件{第一件抽到的是正品,第二件抽到的是次品}的概率。解:記A={第一件是正品},B={第二件是次品},所求事件為AB。根據(jù)乘法公式,有P(AB)=P(A)P(B︱A)

=第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第二節(jié)概率基礎(chǔ)第22頁,共78頁,2023年,2月20日,星期二4、全概率公式當(dāng)計(jì)算比較復(fù)雜事件的概率時(shí),如果可以把它分解成互不相容的一些簡單事件,就可以用全概率公式計(jì)算其概率。

全概率公式表述如下:設(shè)B1,B2,…,Bn為n個(gè)互不相容事件,且P(Bi)>0(i=1,2,…,n)。則任一事件A的概率為:第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第二節(jié)概率基礎(chǔ)第23頁,共78頁,2023年,2月20日,星期二例4:有3個(gè)工人被指定制作一批產(chǎn)品。第一個(gè)人制作這批產(chǎn)品的40%,第二個(gè)人制作35%,第三個(gè)人制作25%。第一個(gè)人廢品率為0.04,第二個(gè)人廢品率為0.06,第三個(gè)人廢品率為0.03。現(xiàn)隨機(jī)抽取一件產(chǎn)品,問這件產(chǎn)品為廢品的概率是多少?解:記A={抽出的一件產(chǎn)品是次品},

Bi

={抽出的產(chǎn)品是第i個(gè)工人制作的},(i=1,2,3)。顯然,B1+B2+B3=Ω,且B1,B2,B3兩兩互不相容。所以可以用全概率公式算出所抽一件是廢品的概率。第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第二節(jié)概率基礎(chǔ)第24頁,共78頁,2023年,2月20日,星期二5、貝葉斯公式

由全概率公式可導(dǎo)出另一個(gè)重要公式——貝葉斯公式,它是由英國數(shù)學(xué)家貝葉斯(BayesThomas)在1763年發(fā)表的,其陳述如下:設(shè)B1,B2,…,Bn為n個(gè)互不相容事件,且P(Bi)>0(i=1,2,…,n)。A是任一事件,且P(A)>0。則對任一Bi(i=1,2,…,n),有第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第二節(jié)概率基礎(chǔ)第25頁,共78頁,2023年,2月20日,星期二例5:在例4中,若隨機(jī)抽出的一件產(chǎn)品為廢品,那么,這件產(chǎn)品由第一個(gè)、第二個(gè)、第三個(gè)工人所制作的概率各是多少?解:

第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第二節(jié)概率基礎(chǔ)第26頁,共78頁,2023年,2月20日,星期二貝葉斯公式的意義在于:設(shè)事件A已發(fā)生,我們需要判斷引起A發(fā)生的“原因”。如果已知A發(fā)生的可能“原因”共有n個(gè):B1,B2,?,Bn且兩兩互不相容。那么我們希望知道其中某個(gè)“Bi”的概率,也就是條件概率P(Bi/A)

。在實(shí)際應(yīng)用中,我們往往要求出每一個(gè)P(Bi/A)(i=1,2,?,n),然后找出其中最大的一個(gè)P(Bi/A),則Bi就是引起事件A發(fā)生的最可能的“原因”。貝葉斯公式在“風(fēng)險(xiǎn)決策”、“模式識(shí)別”等中有著廣泛的應(yīng)用。第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第二節(jié)概率基礎(chǔ)第27頁,共78頁,2023年,2月20日,星期二6、事件的獨(dú)立性對于兩個(gè)事件A和B,假若事件B的發(fā)生會(huì)對事件A發(fā)生的概率產(chǎn)生影響,即P(A︱B)≠P(A),稱事件A與B之間統(tǒng)計(jì)相依。假若事件B的發(fā)生并不影響事件A發(fā)生的概率,稱事件A與B之間統(tǒng)計(jì)獨(dú)立?!鲈谑录嗀與B獨(dú)立時(shí),顯然有P(A︱B)=P(A),這時(shí),乘法公式成為:

P(AB)=P(B)P(A︱B))=P(A)P(B)通常把這個(gè)關(guān)系式作為事件獨(dú)立性的定義。即設(shè)A與B是任意兩個(gè)事件,如果滿足

P(AB)=P(A)P(B)

則稱事件A與B獨(dú)立,否則稱事件A與B相依。第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第二節(jié)概率基礎(chǔ)第28頁,共78頁,2023年,2月20日,星期二(一)隨機(jī)變量的概率分布隨機(jī)變量的概率——隨機(jī)變量的一切可能值的集合(值域)及其相應(yīng)的概率。在隨機(jī)試驗(yàn)中,隨機(jī)變量的各種取值是由一定的概率規(guī)律的,這種規(guī)律就是隨機(jī)變量的概率分布。隨機(jī)變量有離散型隨機(jī)變量和連續(xù)型隨機(jī)變量兩類,因而,其概率分布也也分為離散型概率分布和連續(xù)型概率分布。三、隨機(jī)變量的概率分布第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第二節(jié)概率基礎(chǔ)第29頁,共78頁,2023年,2月20日,星期二離散型隨機(jī)變量x的每一個(gè)可能取值xi和隨機(jī)變量取該值的概率p(xi)之間所確立的對應(yīng)關(guān)系稱作這個(gè)離散型隨機(jī)變量的概率分布。這里x通過點(diǎn)數(shù)取得,其取值是離散的。P(x=xi)=pi(i=1,2,3,…)稱作離散型隨機(jī)變量x的概率分布或概率函數(shù)。三、隨機(jī)變量及其概率分布(二)離散型隨機(jī)變量的概率分布概率分布的性質(zhì)第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第二節(jié)概率基礎(chǔ)第30頁,共78頁,2023年,2月20日,星期二離散型隨機(jī)變量的分布律也可表示為第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第二節(jié)概率基礎(chǔ)第31頁,共78頁,2023年,2月20日,星期二連續(xù)型隨機(jī)變量其概率用概率分布密度函數(shù)來確定。即經(jīng)測度取得的數(shù)值分布于某一數(shù)值區(qū)間,無法一一列舉,只能列出隨機(jī)變量的取值區(qū)間及其相應(yīng)概率,或列出隨機(jī)變量取值小于某一值的累積概率;連續(xù)型隨機(jī)變量的概率分布可以用對應(yīng)于一定區(qū)間的函數(shù)曲線下的面積來表示概率。對應(yīng)于一連續(xù)型隨機(jī)變量的整個(gè)取值區(qū)間,函數(shù)曲線下的面積設(shè)為1,該區(qū)建制內(nèi)的某段對應(yīng)的函數(shù)曲線下的面積為大于0且小于1的一個(gè)數(shù)值。(三)連續(xù)型隨機(jī)變量的概率分布第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第二節(jié)概率基礎(chǔ)第32頁,共78頁,2023年,2月20日,星期二概率分布的性質(zhì)分布密度函數(shù)綜述大于或等于0,即f(x)≥0當(dāng)隨機(jī)變量取某一特定值時(shí),其概率等于0;即在一次試驗(yàn)中,隨機(jī)變量的取值必在-∞<x<+∞范圍內(nèi),為一必然事件。所以上式表示分布密度曲線下、橫軸上的全部面積為1。第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第二節(jié)概率基礎(chǔ)(三)連續(xù)型隨機(jī)變量的概率分布第33頁,共78頁,2023年,2月20日,星期二1、正態(tài)分布的重要性⑶正態(tài)分布可以作為許多分布的近似分布.⑴正態(tài)分布是自然界及工程技術(shù)中最常見的分布之一,大量的隨機(jī)現(xiàn)象都是服從或近似服從正態(tài)分布的??梢宰C明,如果一個(gè)隨機(jī)指標(biāo)受到諸多因素的影響,但其中任何一個(gè)因素都不起決定性作用,則該隨機(jī)指標(biāo)一定服從或近似服從正態(tài)分布.⑵正態(tài)分布有許多良好的性質(zhì),這些性質(zhì)是其它許多分布所不具備的.一、正態(tài)分布第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第三節(jié)幾種常見的概率分布第34頁,共78頁,2023年,2月20日,星期二2、正態(tài)分布的定義

正態(tài)分布又稱高斯(Gauss)分布,是一種連續(xù)型隨機(jī)變量的概率分布,應(yīng)用非常廣泛。它的分布狀態(tài)是多數(shù)變量都圍繞在均值左右,由均值到分布的兩側(cè),變量數(shù)減少。一、正態(tài)分布第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第三節(jié)幾種常見的概率分布第35頁,共78頁,2023年,2月20日,星期二正態(tài)分布的概率密度函數(shù)為:則稱隨機(jī)變量x服從參數(shù)μ,σ2的正態(tài)分布,記作x~N(μ,σ2)。f(x)是一給定變量值x的概率密度。

第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第三節(jié)幾種常見的概率分布第36頁,共78頁,2023年,2月20日,星期二3、正態(tài)分布的特征正態(tài)分布密度曲線是單峰、對稱的懸鐘形曲線,對稱軸為x=μ。f(x)在x=μ處達(dá)到極大,極大值f(x)是非負(fù)函數(shù),以x軸為漸近線,分布從-∞至+∞。曲線在x=μ±σ處各有一個(gè)拐點(diǎn),即曲線在(-∞,μ-σ)和(μ+σ,+∞)區(qū)間上是下凸的,在[μ-σ,μ+σ]區(qū)間內(nèi)是上凸的;正態(tài)分布有兩個(gè)參數(shù),即平均數(shù)μ和標(biāo)準(zhǔn)差σ。μ是位置參數(shù),確定它在x軸上的位置;σ是變異度參數(shù),確定正態(tài)分布的變異度。分布密度曲線與橫軸所夾的面積為1,即:第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第三節(jié)幾種常見的概率分布第37頁,共78頁,2023年,2月20日,星期二

μ值不同σ值相同的三條正態(tài)曲線μ值相同σ值不同的三條正態(tài)曲線第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第三節(jié)幾種常見的概率分布第38頁,共78頁,2023年,2月20日,星期二4、標(biāo)準(zhǔn)正態(tài)分布一個(gè)正態(tài)分布,μ確定了它的中心位置,σ確定了它的變異度。但不同的正態(tài)分布有不同的μ和σ,所以N(μ,σ2)不是一條曲線,而是一個(gè)曲線系統(tǒng)。為了便于一般化的應(yīng)用,需將正態(tài)分布標(biāo)準(zhǔn)化。首先,將隨機(jī)變量x標(biāo)準(zhǔn)化,令:

u稱為標(biāo)準(zhǔn)正態(tài)變量或標(biāo)準(zhǔn)正態(tài)離差,它表示離開均值μ有幾個(gè)標(biāo)準(zhǔn)差σ。第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第三節(jié)幾種常見的概率分布第39頁,共78頁,2023年,2月20日,星期二正態(tài)分布的概率密度函數(shù)即可標(biāo)準(zhǔn)化為:

φ(u)為標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù),即縱坐標(biāo)高度。根據(jù)u

的不同取值,就可繪出標(biāo)準(zhǔn)正態(tài)分布的圖形:標(biāo)準(zhǔn)正態(tài)分布曲線

通過標(biāo)準(zhǔn)化,使正態(tài)分布的均值μ=0,標(biāo)準(zhǔn)差σ=1。因此,標(biāo)準(zhǔn)正態(tài)分布可記作N(0,1)。第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第三節(jié)幾種常見的概率分布4、標(biāo)準(zhǔn)正態(tài)分布第40頁,共78頁,2023年,2月20日,星期二第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第三節(jié)幾種常見的概率分布5、正態(tài)分布的概率計(jì)算對任何一個(gè)服從正態(tài)分布N(μ,σ2)的隨機(jī)變量x,通過標(biāo)準(zhǔn)變換后,如果u為任意實(shí)數(shù),可按下式計(jì)算:Φ0(u)=直接查表u>00.5u=01-Φ0(-u)

u<0第41頁,共78頁,2023年,2月20日,星期二對標(biāo)準(zhǔn)正態(tài)分布的區(qū)間概率計(jì)算方法如下:第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第三節(jié)幾種常見的概率分布第42頁,共78頁,2023年,2月20日,星期二例:已知某河段的懸浮物濃度服從正態(tài)分布,其平均值為600mg/L,標(biāo)準(zhǔn)差為100mg/L,求該河段懸浮物濃度在小于800mg/L和大于400mg/L區(qū)間的概率?并求大于800mg/L的發(fā)生概率?第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第三節(jié)幾種常見的概率分布第43頁,共78頁,2023年,2月20日,星期二在數(shù)理統(tǒng)計(jì)分析中,不僅注意隨機(jī)變量x落在平均數(shù)加減不同倍數(shù)標(biāo)準(zhǔn)差區(qū)間(μ-kσ,μ+kσ)之內(nèi)的概率,更關(guān)心的是x落在此區(qū)間之外的概率。把隨機(jī)變量x落在平均數(shù)μ加減不同倍數(shù)標(biāo)準(zhǔn)差σ區(qū)間之外的概率稱為雙側(cè)概率(兩尾概率),記作α。第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第三節(jié)幾種常見的概率分布

對應(yīng)于雙側(cè)概率,也可以求得隨機(jī)變量x小于μ-kσ或大于μ+kσ的概率,稱為單側(cè)概率(一尾概率),記作α/2。

6、單側(cè)概率與雙側(cè)概率第44頁,共78頁,2023年,2月20日,星期二第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第三節(jié)幾種常見的概率分布二、二項(xiàng)分布1、貝努利試驗(yàn)及其概率公式將某隨機(jī)試驗(yàn)重復(fù)進(jìn)行n次,若各次試驗(yàn)結(jié)果互不影響,即每次試驗(yàn)結(jié)果出現(xiàn)的概率都不依賴于其它各次試驗(yàn)的結(jié)果,則稱這n次試驗(yàn)是獨(dú)立的。在生物學(xué)研究中,我們經(jīng)常碰到的一類離散型隨機(jī)變量,如入孵n枚種蛋的出雛數(shù)、n頭病畜治療后的治愈數(shù)、n尾魚苗的成活數(shù)等,可用貝努利試驗(yàn)來概括。第45頁,共78頁,2023年,2月20日,星期二在n重貝努利試驗(yàn)中,事件A可能發(fā)生0,1,2,…,n次,現(xiàn)在我們來求事件A恰好發(fā)生k(0≤k≤n)次的概率Pn(k)。第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第三節(jié)幾種常見的概率分布二、二項(xiàng)分布1、貝努利試驗(yàn)及其概率公式先取n=4,k=2來討論。在4次試驗(yàn)中,事件A發(fā)生2次的方式第46頁,共78頁,2023年,2月20日,星期二第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第三節(jié)幾種常見的概率分布二、二項(xiàng)分布1、貝努利試驗(yàn)及其概率公式第47頁,共78頁,2023年,2月20日,星期二第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第三節(jié)幾種常見的概率分布二、二項(xiàng)分布2、二項(xiàng)分布的定義及性質(zhì)第48頁,共78頁,2023年,2月20日,星期二第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第三節(jié)幾種常見的概率分布二、二項(xiàng)分布2、二項(xiàng)分布的定義及性質(zhì)第49頁,共78頁,2023年,2月20日,星期二二項(xiàng)分布由n和p兩個(gè)參數(shù)決定:(1)當(dāng)p值較小且n不大時(shí),分布是偏倚的。但隨著n的增大,分布逐漸趨于對稱;(2)當(dāng)p值趨于0.5時(shí),分布趨于對稱;n值不同的二項(xiàng)分布比較p值不同的二項(xiàng)分布比較第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第三節(jié)幾種常見的概率分布二、二項(xiàng)分布2、二項(xiàng)分布的定義及性質(zhì)(3)對于固定的n及p,當(dāng)k增加時(shí),Pn(k)先隨之增加并達(dá)到其極大值,以后又下降。(4)此外,在n較大,np、nq較接近時(shí),二項(xiàng)分布接近于正態(tài)分布;當(dāng)n→∞時(shí),二項(xiàng)分布的極限分布是正態(tài)分布2、二項(xiàng)分布的定義及性質(zhì)第50頁,共78頁,2023年,2月20日,星期二第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第三節(jié)幾種常見的概率分布二、二項(xiàng)分布3、二項(xiàng)分布的平均數(shù)和標(biāo)準(zhǔn)差統(tǒng)計(jì)學(xué)證明,服從二項(xiàng)分布B(n,p)的隨機(jī)變量x的平均數(shù)μ、標(biāo)準(zhǔn)差σ與參數(shù)n、p有如下關(guān)系。設(shè)x~B(n,p),那么,二項(xiàng)分布的總體特征數(shù)為:均值μ=np標(biāo)準(zhǔn)差σ=方差σ2=npq第51頁,共78頁,2023年,2月20日,星期二例:在毒理學(xué)試驗(yàn)中,試驗(yàn)金魚染毒后,死亡率為20%,求5條金魚染毒后死亡數(shù)各可能值相應(yīng)的概率。第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第三節(jié)幾種常見的概率分布二、二項(xiàng)分布4、二項(xiàng)分布的概率計(jì)算及應(yīng)用條件解:設(shè)5條金魚染毒后死亡數(shù)為x,則x服從二項(xiàng)分布(5,0.2),其所有可能取值為0,1,2,…,5,則計(jì)算概率用分布列表示如下:第52頁,共78頁,2023年,2月20日,星期二二項(xiàng)分布的應(yīng)用條件有三:(1)各觀察單位只具有互相對立的一種結(jié)果,如陽性或陰性,生存或死亡等,屬于二項(xiàng)分類資料;(2)已知發(fā)生某一結(jié)果(如死亡)的概率為p,其對立結(jié)果的概率則為1-p=q,實(shí)際中要求p是從大量觀察中獲得的比較穩(wěn)定的數(shù)值;(3)n個(gè)觀察單位的觀察結(jié)果互相獨(dú)立,即每個(gè)觀察單位的觀察結(jié)果不會(huì)影響到其它觀察單位的觀察結(jié)果。第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第三節(jié)幾種常見的概率分布二、二項(xiàng)分布4、二項(xiàng)分布的概率計(jì)算及應(yīng)用條件第53頁,共78頁,2023年,2月20日,星期二第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第三節(jié)幾種常見的概率分布三、泊松分布波松分布是一種可以用來描述和分析隨機(jī)地發(fā)生在單位空間或時(shí)間里的稀有事件的概率分布。要觀察到這類事件,樣本含量n必須很大。在生物、醫(yī)學(xué)研究中,服從泊松分布的隨機(jī)變量是常見的。如,一定畜群中某種患病率很低的非傳染性疾病患病數(shù)或死亡數(shù),畜群中遺傳的畸形怪胎數(shù),每升飲水中大腸桿菌數(shù),計(jì)數(shù)器小方格中血球數(shù),單位空間中某些野生動(dòng)物或昆蟲數(shù),醫(yī)院門診單位時(shí)間內(nèi)就診患者數(shù)等,都是服從波松分布的。第54頁,共78頁,2023年,2月20日,星期二泊松分布的背景及應(yīng)用二十世紀(jì)初盧瑟福和蓋克兩位科學(xué)家在觀察與分析放射性物質(zhì)放出的粒子個(gè)數(shù)的情況時(shí),他們做了2608次觀察(每次時(shí)間為7.5秒)發(fā)現(xiàn)放射性物質(zhì)在規(guī)定的一段時(shí)間內(nèi),其放射的粒子數(shù)X服從泊松分布.第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第三節(jié)幾種常見的概率分布第55頁,共78頁,2023年,2月20日,星期二電話呼喚次數(shù)交通事故次數(shù)商場接待的顧客數(shù)地震火山爆發(fā)特大洪水第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第三節(jié)幾種常見的概率分布第56頁,共78頁,2023年,2月20日,星期二第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第三節(jié)幾種常見的概率分布三、泊松分布1、定義若隨機(jī)變量x(x=k)只取零和正整數(shù)值0,1,2,…,且其概率分布為k=0,1,……,其中λ>0;則稱x服從參數(shù)為λ的波松分布

,記為x~P(λ)。波松分布作為一種離散型隨機(jī)變量的概率分布有一個(gè)重要的特征,這就是它的平均數(shù)和方差相等,都等于常數(shù)λ,即μ=σ2=λ。利用這一特征,可以初步判斷一個(gè)離散型隨機(jī)變量是否服從波松分布。第57頁,共78頁,2023年,2月20日,星期二波松分布的意義λ是波松分布所依賴的唯一參數(shù)。λ值愈小分布愈偏倚,隨著λ的增大,分布趨于對稱。當(dāng)λ=20時(shí)分布接近于正態(tài)分布;當(dāng)λ=50時(shí),可以認(rèn)為波松分布呈正態(tài)分布。所以在實(shí)際工作中,當(dāng)λ≥20時(shí)就可以用正態(tài)分布來近似地處理波松分布的問題。不同λ的波松分布第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第三節(jié)幾種常見的概率分布三、泊松分布第58頁,共78頁,2023年,2月20日,星期二波松分布的概率計(jì)算,依賴于參數(shù)λ的確定,只要參數(shù)λ確定了,把k=0,1,2,…代入公式即可求得各項(xiàng)的概率。但是在大多數(shù)服從波松分布的實(shí)例中,分布參數(shù)λ往往是未知的,只能從所觀察的隨機(jī)樣本中計(jì)算出相應(yīng)的樣本平均數(shù)作為λ的估計(jì)值,將其代替式中的λ,計(jì)算出k=0,1,2,…時(shí)的各項(xiàng)概率。第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第三節(jié)幾種常見的概率分布三、泊松分布2、泊松分布的概率計(jì)算第59頁,共78頁,2023年,2月20日,星期二第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第三節(jié)幾種常見的概率分布三、泊松分布2、泊松分布的概率計(jì)算例:為監(jiān)測飲用水的污染情況,檢驗(yàn)了某社區(qū)每毫升飲用水中細(xì)菌總數(shù),共得400個(gè)記錄,結(jié)果見下表。試分析飲用水中細(xì)菌數(shù)的分布是否服從泊松分布。若服從,按泊松分布計(jì)算每毫升水中細(xì)菌數(shù)的概率及理論次數(shù)并將次數(shù)分布與泊松分布作直觀比較。1ml水中細(xì)菌數(shù)012≥3合計(jì)次數(shù)f243120316400經(jīng)計(jì)算得每毫升水中平均細(xì)菌數(shù)=0.5,方差S2=0.496第60頁,共78頁,2023年,2月20日,星期二第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第三節(jié)幾種常見的概率分布三、泊松分布2、泊松分布的概率計(jì)算1ml水中細(xì)菌數(shù)012≥3合計(jì)實(shí)際次數(shù)243120316400頻率概率理論次數(shù)第61頁,共78頁,2023年,2月20日,星期二第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第三節(jié)幾種常見的概率分布三、泊松分布2、泊松分布的概率計(jì)算1ml水中細(xì)菌數(shù)012≥3合計(jì)實(shí)際次數(shù)243120316400頻率0.60750.30000.07750.01501.00概率0.060650.30330.07580.01441.00理論次數(shù)242.60121.3230.325.76400第62頁,共78頁,2023年,2月20日,星期二前面討論的三個(gè)重要的概率分布中,前1個(gè)屬連續(xù)型隨機(jī)變量的概率分布,后2個(gè)屬離散型隨機(jī)變量的概率分布。三者間的關(guān)系如下:對于二項(xiàng)分布,在n→∞,p→0,且np=λ(較小常數(shù))情況下,二項(xiàng)分布趨于波松布。在這種場合,波松分布中的參數(shù)λ用二項(xiàng)分布的np代之;在n→∞,p→0.5時(shí),二項(xiàng)分布趨于正態(tài)分布。在這種場合,正態(tài)分布中的μ、σ2用二項(xiàng)分布的np、np

q代之。在實(shí)際計(jì)算中,當(dāng)p<0.1且n很大時(shí),二項(xiàng)分布可由波松分布近似;當(dāng)p>0.1且n很大時(shí),二項(xiàng)分布可由正態(tài)分布近似。對于波松分布,當(dāng)λ→∞時(shí),波松分布以正態(tài)分布為極限。在實(shí)際計(jì)算中,當(dāng)λ≥20(也有人認(rèn)為λ≥6)時(shí),用波松分布中的λ代替正態(tài)分布中的μ及σ2,即可由后者對前者進(jìn)行近似計(jì)算。第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第三節(jié)幾種常見的概率分布第63頁,共78頁,2023年,2月20日,星期二第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第四節(jié)抽樣分布

研究總體與所抽取的樣本之間的關(guān)系是統(tǒng)計(jì)學(xué)的中心內(nèi)容。對這種關(guān)系的研究從兩方面著手:一是從總體到樣本,這就是研究抽樣分布(samplingdistribution)的問題;二是從樣本到總體,這就是統(tǒng)計(jì)推斷(statisticalinference)問題。第64頁,共78頁,2023年,2月20日,星期二第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第四節(jié)抽樣分布★總體隨機(jī)抽樣(randomsampling)的方法可分為有返置抽樣和不返置抽樣兩種。★前者指每次抽出一個(gè)個(gè)體后,這個(gè)個(gè)體應(yīng)返置回原總體;后者指每次抽出的個(gè)體不返置回原總體?!飳τ跓o限總體,返置與否都可保證各個(gè)體被抽到的機(jī)會(huì)相等。對于有限總體,就應(yīng)該采取返置抽樣,否則各個(gè)體被抽到的機(jī)會(huì)就不相等。第65頁,共78頁,2023年,2月20日,星期二第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第四節(jié)抽樣分布由總體中隨機(jī)地抽取若干個(gè)體組成樣本,即使每次抽取的樣本含量相等,其統(tǒng)計(jì)量(如,S)也將隨著樣本的不同而有所不同,因而樣本統(tǒng)計(jì)量也是隨機(jī)變量,也有其概率分布。我們把統(tǒng)計(jì)量的概率分布稱為抽樣分布?!▁1,x2,…xn)(x1,x2,…xn)(x1,x2,…xn)樣本值1樣本值2樣本值nX1,X2,…,Xn隨抽機(jī)樣樣本總體X…………第66頁,共78頁,2023年,2月20日,星期二第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)第四節(jié)抽樣分布樣本平均數(shù)也是一個(gè)隨機(jī)變量,其概率分布叫做樣本平均數(shù)的抽樣分布。由樣本平均數(shù)構(gòu)成的總體稱為樣本平均數(shù)的抽樣總體。其平均數(shù)和標(biāo)準(zhǔn)差分別記為和。是樣本平均數(shù)抽樣總體的標(biāo)準(zhǔn)差,簡稱標(biāo)準(zhǔn)誤,它表示平均數(shù)抽樣誤差的大小。統(tǒng)計(jì)學(xué)上已證明:=μ,一、u分布1、從單個(gè)正態(tài)總體中抽出的隨

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論