第3章+概率、概率分布與抽樣分布.ppt_第1頁(yè)
第3章+概率、概率分布與抽樣分布.ppt_第2頁(yè)
第3章+概率、概率分布與抽樣分布.ppt_第3頁(yè)
第3章+概率、概率分布與抽樣分布.ppt_第4頁(yè)
第3章+概率、概率分布與抽樣分布.ppt_第5頁(yè)
已閱讀5頁(yè),還剩104頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第3章 概率、概率分布與抽樣分布,3.1 事件及其概率,3.1.1 試驗(yàn)、事件與樣本空間 3.1.2 事件的概率 3.1.3 概率的性質(zhì)與運(yùn)算法則 3.1.4 條件概率與事件的獨(dú)立性 3.1.5 全概率公式與逆概率公式,3.1.1 試驗(yàn)、事件與樣本空間,必然現(xiàn)象與隨機(jī)現(xiàn)象,必然現(xiàn)象(確定性現(xiàn)象) 變化結(jié)果是事先可以確定的,一定的條件必然導(dǎo)致某一結(jié)果 這種關(guān)系通??梢杂霉交蚨蓙?lái)表示 隨機(jī)現(xiàn)象(偶然現(xiàn)象、不確定現(xiàn)象) 在一定條件下可能發(fā)生也可能不發(fā)生的現(xiàn)象 個(gè)別觀察的結(jié)果完全是偶然的、隨機(jī)會(huì)而定 大量觀察的結(jié)果會(huì)呈現(xiàn)出某種規(guī)律性 (隨機(jī)性中寓含著規(guī)律性) 統(tǒng)計(jì)規(guī)律性,十五的夜晚能看見月亮?,十

2、五的月亮比初十圓!,隨機(jī)試驗(yàn),嚴(yán)格意義上的隨機(jī)試驗(yàn)滿足三個(gè)條件: 試驗(yàn)可以在系統(tǒng)條件下重復(fù)進(jìn)行; 試驗(yàn)的所有可能結(jié)果是明確可知的; 每次試驗(yàn)前不能肯定哪一個(gè)結(jié)果會(huì)出現(xiàn)。 廣義的隨機(jī)試驗(yàn)是指對(duì)隨機(jī)現(xiàn)象的觀察(或?qū)嶒?yàn))。 實(shí)際應(yīng)用中多數(shù)試驗(yàn)不能同時(shí)滿足上述條件,常常從廣義角度來(lái)理解。,隨機(jī)事件(事件),隨機(jī)事件(簡(jiǎn)稱事件) 隨機(jī)試驗(yàn)的每一個(gè)可能結(jié)果 常用大寫英文字母A、B、 、來(lái)表示 基本事件(樣本點(diǎn)) 不可能再分成為兩個(gè)或更多事件的事件 樣本空間() 基本事件的全體(全集),隨機(jī)事件(續(xù)),復(fù)合事件 由某些基本事件組合而成的事件 樣本空間中的子集 隨機(jī)事件的兩種特例 必然事件 在一定條件下,每次

3、試驗(yàn)都必然發(fā)生的事件 只有樣本空間 才是必然事件 不可能事件 在一定條件下,每次試驗(yàn)都必然不會(huì)發(fā)生的事件 不可能事件是一個(gè)空集(),3.1.2 事件的概率,1. 古典概率 2. 統(tǒng)計(jì)概率 3. 主觀概率,隨機(jī)事件的概率,概率 用來(lái)度量隨機(jī)事件發(fā)生的可能性大小的數(shù)值 必然事件的概率為1,表示為P ( )=1 不可能事件發(fā)生的可能性是零,P( )=0 隨機(jī)事件A的概率介于0和1之間,0P(A)1 概率的三種定義,給出了確定隨機(jī)事件概率的三條途經(jīng)。,1.概率的古典定義,古典概型(等可能概型) 具有以下兩特點(diǎn) 每次試驗(yàn)的可能結(jié)果有限(即樣本空間中基本事件總數(shù)有限) 每個(gè)試驗(yàn)結(jié)果出現(xiàn)的可能性相同 它是概

4、率論的發(fā)展過(guò)程中人們最早研究的對(duì)象,概率的古典定義,概率的古典定義 前提:古典概型 定義(公式),計(jì)算古典概率常用到排列組合知識(shí),【例3-1】,設(shè)有50件產(chǎn)品,其中有5件次品,現(xiàn)從這50件中任取2件,求抽到的兩件產(chǎn)品均為合格品的概率是多少?抽到的兩件產(chǎn)品均為次品的概率又是多少? 解:任一件被抽到的機(jī)會(huì)均等,而且從50件產(chǎn)品中抽出2件相當(dāng)于從50個(gè)元素中取2個(gè)進(jìn)行組合,共有C502種可能,所以這是一個(gè)古典概型。,概率的統(tǒng)計(jì)定義,當(dāng)試驗(yàn)次數(shù) n 很大時(shí),事件A發(fā)生頻率m/n 穩(wěn)定地在某一常數(shù) p 上下波動(dòng),而且這種波動(dòng)的幅度一般會(huì)隨著試驗(yàn)次數(shù)增加而縮小,則定義 p 為事件A發(fā)生的概率,當(dāng)n相當(dāng)大時(shí)

5、,可用事件發(fā)生的頻率m/n作為其概率的一個(gè)近似值計(jì)算概率的統(tǒng)計(jì)方法(頻率方法),例(補(bǔ)充),根據(jù)古典概率定義可算出,拋一枚質(zhì)地均勻的硬幣,出現(xiàn)正面與出現(xiàn)反面的概率都是0.5。歷史上有很多人都曾經(jīng)做過(guò)拋硬幣試驗(yàn)。,【例3-2】,某地區(qū)幾年來(lái)新生兒性別的統(tǒng)計(jì)資料如下表所示,由此可判斷該地區(qū)新生兒為男嬰的概率是多少?,3. 主觀概率,有些隨機(jī)事件發(fā)生的可能性,既不能通過(guò)等可能事件個(gè)數(shù)來(lái)計(jì)算,也不能根據(jù)大量重復(fù)試驗(yàn)的頻率來(lái)近似 主觀概率依據(jù)人們的主觀判斷而估計(jì)的隨機(jī)事件發(fā)生的可能性大小 例如某經(jīng)理認(rèn)為新產(chǎn)品暢銷的可能性是80 人們的經(jīng)驗(yàn)、專業(yè)知識(shí)、對(duì)事件發(fā)生的眾多條件或影響因素的分析等等,都是確定主觀

6、概率的依據(jù),3.1.3 概率的基本性質(zhì),非負(fù)性: 對(duì)任意事件A,有 0 P(A) 1。 規(guī)范性: 必然事件的概率為1,即: P()=1 不可能事件的概率為0 ,即:P()=0。 可加性: 若A與B互斥,則:P ( AB ) = P ( A ) + P ( B ) 對(duì)于多個(gè)兩兩互斥事件A1,A2,An,則有: P ( A1A2 An) = P ( A1 ) + P (A2 ) + + P (An ) 上述三條基本性質(zhì),也稱為概率的三條公理。,(補(bǔ)充)關(guān)于概率的公理化定義,概率的以上三種定義,各有其特定的應(yīng)用范圍,也存在局限性,都缺乏嚴(yán)密性。 古典定義要求試驗(yàn)的基本事件有限且具有等可能性 統(tǒng)計(jì)定義

7、要求試驗(yàn)次數(shù)充分大,但試驗(yàn)次數(shù)究竟應(yīng)該取多大、頻率與概率有多么接近都沒(méi)有確切說(shuō)明 主觀概率的確定又具有主觀隨意性 蘇聯(lián)數(shù)學(xué)家柯爾莫哥洛夫于1933年提出了概率的公理化定義:三條公理 通過(guò)規(guī)定應(yīng)具備的基本性質(zhì)來(lái)定義概率 公理化定義為概率論嚴(yán)謹(jǐn)?shù)倪壿嬐评泶蛳铝藞?jiān)實(shí)的基礎(chǔ)。,1. 加法公式,用于求P(AB)“A發(fā)生或B發(fā)生”的概率 互斥事件(互不相容事件) 不可能同時(shí)發(fā)生的事件 沒(méi)有公共樣本點(diǎn),P ( AB ) = P ( A ) + P ( B ),互斥事件的加法公式,P ( A1A2 An) = P ( A1 ) + P (A2 ) + + P (An ),【例3-3】,設(shè)有50件產(chǎn)品,其中有5

8、件次品,現(xiàn)從這50件中任取2件,若問(wèn)至少抽到一件次品的概率? 解:“至少抽到一件次品”這一事件實(shí)質(zhì)上就是“抽取的2件產(chǎn)品中有一件次品”(記為A)與“抽取的兩件產(chǎn)品均為次品”(記為B)這兩個(gè)事件的和。由于A與B是兩個(gè)互斥事件,故計(jì)算 “至少抽到一件次品”的概率采用公式: P(AB) =P(A)+P(B),互補(bǔ)事件,互補(bǔ)事件 不可能同時(shí)發(fā)生而又必然有一個(gè)會(huì)發(fā)生的兩個(gè)事件 互補(bǔ)事件的概率之和等于1,A,A,例如:擲一個(gè)骰子,“出現(xiàn)2點(diǎn)”的概率是1/6,則“不出現(xiàn)2點(diǎn)”的概率就是5/6 。,相容事件的加法公式,相容事件 兩個(gè)事件有可能同時(shí)發(fā)生 存在公共樣本點(diǎn) 相容事件的加法公式 (廣義加法公式 ),P

9、 ( AB ) = P ( A ) + P ( B ) - P ( AB ),事件的積(交)AB,事件的和(并),【例3-4】,將分別寫有0至9這十個(gè)號(hào)碼的小球裝入一容器中,反復(fù)攪拌之后任意搖出一個(gè)小球,觀察其號(hào)碼。試求出現(xiàn)“奇數(shù)或大于等于4的數(shù)”的概率。 解:所求事件 奇數(shù)(A)大于等于4的數(shù)(B) 0,1,2,3,9,A1,3,5,7,9,B4,5,6,7,8,9 由于等可能性,P(A)=5/10, P(B) =6/10。P(A)+P(B) 1 ,顯然P(AB) P(A)P(B) 因?yàn)锳和B存在共同部分AB5,7,9,P(AB)3/10。在P(A)+P(B) 中P(AB) 被重復(fù)計(jì)算了。

10、正確計(jì)算是: P(AB)5/106/103/108/100.8,3.1.4 條件概率與事件的獨(dú)立性,用于計(jì)算兩個(gè)事件同時(shí)發(fā)生的概率。 也即 “A發(fā)生且B發(fā)生”的概率 P(AB) 先關(guān)注事件是否相互獨(dú)立,(1)條件概率,條件概率在某些附加條件下計(jì)算的概率 在已知事件B已經(jīng)發(fā)生的條件下A發(fā)生的條件概率P(A|B) 條件概率的一般公式:,其中 P(B) 0,【例3-5】,某公司甲乙兩廠生產(chǎn)同種產(chǎn)品。甲廠生產(chǎn)400件,其中一級(jí)品為280件;乙廠生產(chǎn)600件,其中一級(jí)品有360件。若要從該廠的全部產(chǎn)品中任意抽取一件,試求:已知抽出產(chǎn)品為一級(jí)品的條件下該產(chǎn)品出自甲廠的概率;已知抽出產(chǎn)品出自甲廠的條件下該產(chǎn)

11、品為一級(jí)品的概率。 解:設(shè)A“甲廠產(chǎn)品”,B“一級(jí)品”,則: P(A)0.4, P(B) 0.64,P(AB)0.28 所求概率為事件B發(fā)生條件下A發(fā)生的條件概率 P(A|B)0.28/0.64 所求概率為事件A發(fā)生條件下B發(fā)生的條件概率 P(B|A)0.28/0. 4,P(A|B)在B發(fā)生的所有可能結(jié)果中AB發(fā)生的概率 即在樣本空間中考慮的條件概率P(A|B),就變成在新的樣本空間B中計(jì)算事件AB的概率問(wèn)題了,(1)條件概率(續(xù)),一旦事件B已發(fā)生,乘法公式的一般形式:,P(AB) P(A)P(B|A) 或 P(AB) P(B)P(A|B),【例3-6】對(duì)例3-1中的問(wèn)題(從這50件中任取2

12、件產(chǎn)品,可以看成是分兩次抽取,每次只抽取一件,不放回抽樣) 解:A1第一次抽到合格品,A2第二次抽到合格品,A1A2抽到兩件產(chǎn)品均為合格品 P(A1 A2)P(A1)P(A2| A1),事件的獨(dú)立性,兩個(gè)事件獨(dú)立 一個(gè)事件的發(fā)生與否并不影響另一個(gè)事件發(fā)生的概率 P(A|B)P(A),或 P(B|A)P(B),獨(dú)立事件的乘法公式:,P(AB) P(A)P(B),推廣到n 個(gè)獨(dú)立事件,有:,P(A1An)P(A1)P(A2) P(An),3.1.5 全概率公式與逆概率公式,完備事件組 事件A1、 A2、An互不相容, AA2An 且P(Ai ) 0(i=1、2、.、n) 對(duì)任一事件B,它總是與完備

13、事件組A1、 A2、An之一同時(shí)發(fā)生,則有求P(B)的全概率公式:,例3-7,假設(shè)有一道四選一的選擇題,某學(xué)生知道正確答案的可能性為2/3,他不知道正確答案時(shí)猜對(duì)的概率是1/4。試問(wèn)該生作出作答的概率? 解:設(shè) A知道正確答案,B選擇正確。 “選擇正確”包括: “知道正確答案而選擇正確”(即AB) “不知道正確答案但選擇正確”(即 ) P(B)(2/3)1(1/3)(1/4)3/4,全概率公式貝葉斯公式,全概率公式的直觀意義: 每一個(gè)Ai的發(fā)生都可能導(dǎo)致B出現(xiàn),每一個(gè)Ai 導(dǎo)致B發(fā)生的概率為,因此作為結(jié)果的事件B發(fā)生的概率是各個(gè)“原因”Ai 引發(fā)的概率的總和 相反,在觀察到事件B已經(jīng)發(fā)生的條件

14、下,確定導(dǎo)致B發(fā)生的各個(gè)原因Ai的概率 貝葉斯公式(逆概率公式) (后驗(yàn)概率公式),貝葉斯公式,若A1、 A2、An為完備事件組,則對(duì)于任意隨機(jī)事件B,有:,計(jì)算事件Ai在給定B條件下的條件概率公式。 公式中,P(Ai)稱為事件Ai的先驗(yàn)概率 P(Ai|B)稱為事件Ai的后驗(yàn)概率,3.2 隨機(jī)變量及其概率分布,3.2.1 隨機(jī)變量,隨機(jī)變量表示隨機(jī)試驗(yàn)結(jié)果的變量 取值是隨機(jī)的,事先不能確定取哪一個(gè)值 一個(gè)取值對(duì)應(yīng)隨機(jī)試驗(yàn)的一個(gè)可能結(jié)果 用大寫字母如X、Y、Z.來(lái)表示,具體取值則用相應(yīng)的小寫字母如x、y、z來(lái)表示 根據(jù)取值特點(diǎn)的不同,可分為: 離散型隨機(jī)變量取值可以一一列舉 連續(xù)型隨機(jī)變量取值不

15、能一一列舉,3.2.2 離散型隨機(jī)變量的概率分布,X的概率分布X的有限個(gè)可能取值為xi與其概率 pi(i=1,2,3,n)之間的對(duì)應(yīng)關(guān)系。 概率分布具有如下兩個(gè)基本性質(zhì): (1) pi0,i=1,2,n; (2),離散型概率分布的表示:,概率函數(shù):P(X= xi)= pi 分布列: 分布圖,3.2.2 離散型隨機(jī)變量的數(shù)學(xué)期望和方差,又稱均值 描述一個(gè)隨機(jī)變量的概率分布的中心位置 離散型隨機(jī)變量 X的數(shù)學(xué)期望: 相當(dāng)于所有可能取值以概率為權(quán)數(shù)的平均值 連續(xù)型隨機(jī)變量X 的數(shù)學(xué)期望:,數(shù)學(xué)期望的主要數(shù)學(xué)性質(zhì),若k是一常數(shù),則 E (k X) k E(X) 對(duì)于任意兩個(gè)隨機(jī)變量X、Y,有 E(X+

16、Y)E(X)E(Y) 若兩個(gè)隨機(jī)變量X、Y相互獨(dú)立,則 E(XY)E(X) E(Y),2. 隨機(jī)變量的方差,方差是它的各個(gè)可能取值偏離其均值的離差平方的均值,記為D(x)或2 公式: 離散型隨機(jī)變量的方差: 連續(xù)型隨機(jī)變量的方差:,方差和標(biāo)準(zhǔn)差(續(xù)),標(biāo)準(zhǔn)差方差的平方根 方差和標(biāo)準(zhǔn)差都反映隨機(jī)變量取值的分散程度。 它們的值越大,說(shuō)明離散程度越大,其概率分布曲線越扁平。 方差的主要數(shù)學(xué)性質(zhì): 若k是一常數(shù),則 D(k)0;D(kX)k2 D(X) 若兩個(gè)隨機(jī)變量X、Y相互獨(dú)立,則 D(X+Y)D(X)D(Y),【例3-10】,試求優(yōu)質(zhì)品件數(shù)的數(shù)學(xué)期望、方差和標(biāo)準(zhǔn)差。 解:, 0.6,3.兩個(gè)隨機(jī)

17、變量的協(xié)方差和相關(guān)系數(shù),協(xié)方差的定義,如果X,Y獨(dú)立(不相關(guān)),則 Cov(X,Y)0 即 E(XY)E(X) E(Y) 協(xié)方差在一定程度上反映了X、Y之間的相關(guān)性 協(xié)方差受兩個(gè)變量本身量綱的影響。,相關(guān)系數(shù),相關(guān)系數(shù)具有如下的性質(zhì): 相關(guān)系數(shù)是一個(gè)無(wú)量綱的值 0| | 0 當(dāng)=0,兩個(gè)變量不相關(guān)(不存在線性相關(guān)) 當(dāng) | |=1,兩個(gè)變量完全線性相關(guān),3.2.4 幾種常見離散型率分布,1. 二項(xiàng)分布 2. 泊松分布 3. 超幾何分布,1. 二項(xiàng)分布(背景),(背景)n重貝努里試驗(yàn): 一次試驗(yàn)只有兩種可能結(jié)果 用“成功”代表所關(guān)心的結(jié)果,相反的結(jié)果為“失敗” 每次試驗(yàn)中“成功”的概率都是 p

18、n 次試驗(yàn)相互獨(dú)立。,1. 二項(xiàng)分布,在n重貝努里試驗(yàn)中,“成功”的次數(shù)X服從參數(shù)為n、p的二項(xiàng)分布,記為 X B(n , p) 二項(xiàng)分布的概率函數(shù):,二項(xiàng)分布的數(shù)學(xué)期望和方差:,n1時(shí),二項(xiàng)分布就成了二點(diǎn)分布(0-1分布),二項(xiàng)分布圖形,p0.5時(shí),二項(xiàng)分布是以均值為中心對(duì)稱 p0.5時(shí),二項(xiàng)分布總是非對(duì)稱的 p0.5時(shí)峰值在中心的右側(cè) 隨著n無(wú)限增大,二項(xiàng)分布趨近于正態(tài)分布,p=0.3,p=0.5,p=0.7,二項(xiàng)分布圖示,【例3-11】,某單位有4輛汽車,假設(shè)每輛車在一年中至多只發(fā)生一次損失且損失的概率為0.1。試求在一年內(nèi)該單位:(1)沒(méi)有汽車發(fā)生損失的概率;(2)有1輛汽車發(fā)生損失的

19、概率;(3)發(fā)生損失的汽車不超過(guò)2輛的概率。 解:每輛汽車是否發(fā)生損失相互獨(dú)立的,且損失的概率相同,因此,據(jù)題意,在4輛汽車中發(fā)生損失的汽車數(shù)X B(4,0.1)。,利用Excel計(jì)算二項(xiàng)分布概率,進(jìn)入Excel表格界面,點(diǎn)擊任一空白單元格(作為輸出單元格) 點(diǎn)擊表格界面上的 fx 命令 在 “選擇類別”中點(diǎn)擊“統(tǒng)計(jì)”,在“選擇函數(shù)”中點(diǎn)擊“BINOMDIST” 在Number_s后填入試驗(yàn)成功次數(shù) x (本例為2); 在Trials后填入總試驗(yàn)次數(shù) n (本例為4) ; 在Probability_s后填入成功概率 p (本例為0.1); 在Cumulative后填入0 (或FALSE),表示

20、計(jì)算成功次數(shù)等于指定值的概率,“BINOMDIST(2,4,0.1,0)”,用EXCEL計(jì)算二項(xiàng)分布的概率,2. 泊松分布,X 服從泊松分布,記為XP():,E(X)=D(X)= 當(dāng) 很小時(shí),泊松分布呈偏態(tài),并隨著增大而趨于對(duì)稱 當(dāng)為整數(shù)時(shí), 和(-1)是最可能值,泊松分布(應(yīng)用背景),通常是作為稀有事件發(fā)生次數(shù)X的概率分布模型。 一段時(shí)間內(nèi)某繁忙十字路口發(fā)生交通事故的次數(shù) 一定時(shí)間段內(nèi)某電話交換臺(tái)接到的電話呼叫次數(shù) 服從泊松分布的現(xiàn)象的共同特征 在任意兩個(gè)很小的時(shí)間或空間區(qū)間內(nèi)事件發(fā)生次數(shù)是相互獨(dú)立的; 各區(qū)間內(nèi)事件發(fā)生次數(shù)只與區(qū)間長(zhǎng)度成比例,與區(qū)間起點(diǎn)無(wú)關(guān); 在一段充分小的區(qū)間內(nèi)事件發(fā)生兩

21、次或兩次以上的概率可以忽略不計(jì),【例3-12】,設(shè)某種報(bào)刊的每版上錯(cuò)別字個(gè)數(shù)服從 =2的泊松分布。隨機(jī)翻看一版,求: (1)沒(méi)有錯(cuò)別字的概率; (2)至多有5個(gè)錯(cuò)別字的概率。 解:設(shè)X每版上錯(cuò)別字個(gè)數(shù),則所求概率為:,利用EXCEL計(jì)算泊松分布的概率,二項(xiàng)分布的泊松近似,【前提】當(dāng)n很大而 p又很小時(shí),二項(xiàng)分布可用參數(shù)np 的泊松分布近似 【例3-13】一工廠有某種設(shè)備80臺(tái),配備了3個(gè)維修工。假設(shè)每臺(tái)設(shè)備的維修只需要一個(gè)維修工,設(shè)備發(fā)生故障是相互獨(dú)立的,且每臺(tái)設(shè)備發(fā)生故障的概率都是0.01。求設(shè)備發(fā)生故障而不能及時(shí)維修的概率是多少? 解:XB(n=80,p=0.01),由于np=0.8很小,

22、可以用0.8的泊松分布來(lái)近似計(jì)算其概率:,3. 超幾何分布,N個(gè)單位的有限總體中有M個(gè)單位具有某特征。用不重復(fù)抽樣方法從總體中抽取n個(gè)單位,樣本中具有某種特征的單位數(shù)X服從超幾何分布,記為XH(n,N,M ),數(shù)學(xué)期望和方差:,N很大而n相對(duì)很小時(shí),趨于二項(xiàng)分布(p=M/N),3.2.5 概率密度函數(shù)與連續(xù)型隨機(jī)變量,連續(xù)型隨機(jī)變量的概率分布只能表示為: 數(shù)學(xué)函數(shù)概率密度函數(shù)f (x)和分布函數(shù)F (x) 圖 形概率密度曲線和分布函數(shù)曲線 概率密度函數(shù)f (x)的函數(shù)值不是概率。 連續(xù)型隨機(jī)變量取某個(gè)特定值的概率等于0 只能計(jì)算隨機(jī)變量落在一定區(qū)間內(nèi)的概率 由x軸以上、概率密度曲線下方面積來(lái)表

23、示,概率密度f(wàn) (x) 的性質(zhì),(1) f (x)0。概率密度是非負(fù)函數(shù)。 (2),所有區(qū)域上取值的概率總和為1。,隨機(jī)變量X在一定區(qū)間(a,b)上的概率:,3. 分布函數(shù),適用于兩類隨機(jī)變量概率分布的描述 分布函數(shù)的定義: F(x)PXx,連續(xù)型隨機(jī)變量的分布函數(shù),離散型隨機(jī)變量的分布函數(shù) F(x),分布函數(shù)與概率密度,3.2.6 常見的連續(xù)型隨機(jī)變量的概率分布,1. 均勻分布 X只在一有限區(qū)間 a,b 上取值 且概率密度是一個(gè)常數(shù) 其概率密度為:,X 落在子區(qū)間 c,d 內(nèi)的概率與該子區(qū)間的長(zhǎng)度成正比,與具體位置無(wú)關(guān),P(cXd),2. 正態(tài)分布,XN (、 2 ),其概率密度為:,正態(tài)分

24、布的均值和標(biāo)準(zhǔn)差: 均值 E(X) = 方差 D(X)= 2,- x ,2. 正態(tài)曲線,正態(tài)曲線的主要特性: 關(guān)于x = 對(duì)稱的鐘形曲線 參數(shù)決定正態(tài)曲線的中心位置 參數(shù) 決定正態(tài)曲線的陡峭或扁平程度 以X軸為漸近線,即當(dāng)x 時(shí),f(x) 0,標(biāo)準(zhǔn)正態(tài)分布,0、1的正態(tài)分布,記為N (0, 1) 其概率密度(x),分布函數(shù) (x) XN (、 2 ), 則 : ZN (0,1 ),若 ZN (0,1 ),則有: P(| Z| a)2(a)1 (-a)=1(a),標(biāo)準(zhǔn)化,【例3-14】,某廠生產(chǎn)的某種節(jié)能燈管的使用壽命服從正態(tài)分布,對(duì)某批產(chǎn)品測(cè)試的結(jié)果,平均使用壽命為1050小時(shí),標(biāo)準(zhǔn)差為200

25、小時(shí)。試求: (a)使用壽命在500小時(shí)以下的燈管占多大比例? (b)使用壽命在8501450小時(shí)的燈管占多大比例? (c)以均值為中心,95的燈管的使用壽命在什么范圍內(nèi)?,解,X使用壽命,XN (1050,2002 ),(2)(-1)0.977250.158650.8186,95的燈管壽命在均值左右392(即6581442)小時(shí),1(2.75)10.997020.00298,3 原則,|X| 3 的概率很小,因此可認(rèn)為正態(tài)隨機(jī)變量的取值幾乎全部集中在 - 3,+ 3 區(qū)間內(nèi) 廣泛應(yīng)用: 產(chǎn)品質(zhì)量控制 判斷異常情況 ,正態(tài)分布最常用、最重要,大千世界中許多常見的隨機(jī)現(xiàn)象服從或近似服從正態(tài)分布

26、例如,測(cè)量誤差,同齡人的身高、體重,一批棉紗的抗拉強(qiáng)度,一種設(shè)備的使用壽命,農(nóng)作物的產(chǎn)量 特點(diǎn)是 “中間多兩頭少” 由于正態(tài)分布特有的數(shù)學(xué)性質(zhì),正態(tài)分布在很多統(tǒng)計(jì)理論中都占有十分重要的地位 正態(tài)分布是許多概率分布的極限分布 統(tǒng)計(jì)推斷中許多重要的分布(如2分布、t分布、F分布)都是在正態(tài)分布的基礎(chǔ)上推導(dǎo)出來(lái)的。,用正態(tài)分布近似二項(xiàng)分布,XB (n,p) ,當(dāng)n充分大時(shí), XN (n p,np(1-p) 【例3-15】假設(shè)有一批種子的發(fā)芽率為0.7?,F(xiàn)有這種種子1000顆,試求其中有720顆以上發(fā)芽的概率。 解:設(shè)X發(fā)芽種子顆數(shù),XB(1000,0.7)。近似地 XN (700,210)。 P(X

27、720)P(Z1.38)1P(Z1.38) 10.91620.0838,用正態(tài)分布近似二項(xiàng)分布,用正態(tài)分布近似二項(xiàng)分布的前提 n很大, p不能太接近 0 或 1(否則二項(xiàng)分布太偏) 一般要求np和np(1-p)都要大于5 如果np或np(1-p)小于5,二項(xiàng)分布可以用泊松分布來(lái)近似,計(jì)算正態(tài)分布的概率值,方法一:先標(biāo)準(zhǔn)化查標(biāo)準(zhǔn)正態(tài)分布函數(shù)值表 方法二:利用Excel來(lái)計(jì)算(不必標(biāo)準(zhǔn)化) 插入函數(shù)fx選擇“統(tǒng)計(jì)”“NORMDIST”,進(jìn)入“函數(shù)參數(shù)”對(duì)話框中, 在X后填入正態(tài)隨機(jī)變量的取值區(qū)間點(diǎn); 在Mean后填入正態(tài)分布的均值; 在Standard_dev后填入正態(tài)分布的標(biāo)準(zhǔn)差; 在Cumul

28、ative后填入1(或TRUE),表示計(jì)算隨機(jī)變量取值小于等于指定值x的累積概率值。,也可在選定的輸出單元格中,順次輸入函數(shù)名和參數(shù)值即可 如輸入“=NORMDIST(500,1050,200,1)”,確定后即可得到所求概率值0.0029798。 根據(jù)概率值F(Xx)求隨機(jī)變量取值的區(qū)間點(diǎn) x,選擇函數(shù)“NORMINV”。 如輸入“=NORMINV(0.0029798,1050,200)”,顯示計(jì)算結(jié)果為500。,計(jì)算正態(tài)分布的概率值,3.3 常用的抽樣方法,3.3.1 簡(jiǎn)單隨機(jī)抽樣 3.3.2 分層抽樣 3.3.3 系統(tǒng)抽樣 3.3.4 整群抽樣,抽樣方法,概率抽樣(probability

29、sampling),根據(jù)一個(gè)已知的概率來(lái)抽取樣本單位,也稱隨機(jī)抽樣 特點(diǎn) 按一定的概率以隨機(jī)原則抽取樣本 抽取樣本時(shí)使每個(gè)單位都有一定的機(jī)會(huì)被抽中 每個(gè)單位被抽中的概率是已知的,或是可以計(jì)算出來(lái)的 當(dāng)用樣本對(duì)總體目標(biāo)量進(jìn)行估計(jì)時(shí),要考慮到每個(gè)樣本單位被抽中的概率,簡(jiǎn)單隨機(jī)抽樣(simple random sampling),從總體N個(gè)單位中隨機(jī)地抽取n個(gè)單位作為樣本,使得每一個(gè)容量為樣本都有相同的機(jī)會(huì)(概率)被抽中 抽取元素的具體方法有重復(fù)抽樣和不重復(fù)抽樣 特點(diǎn) 簡(jiǎn)單、直觀,在抽樣框完整時(shí),可直接從中抽取樣本 用樣本統(tǒng)計(jì)量對(duì)目標(biāo)量進(jìn)行估計(jì)比較方便 局限性 當(dāng)N很大時(shí),不易構(gòu)造抽樣框 抽出的單位

30、很分散,給實(shí)施調(diào)查增加了困難 沒(méi)有利用其他輔助信息以提高估計(jì)的效率,分層抽樣(stratified sampling),將總體單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨(dú)立、隨機(jī)地抽取樣本 優(yōu)點(diǎn) 保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,從而提高估計(jì)的精度 組織實(shí)施調(diào)查方便 既可以對(duì)總體參數(shù)進(jìn)行估計(jì),也可以對(duì)各層的目標(biāo)量進(jìn)行估計(jì),3.3.3系統(tǒng)抽樣(systematic sampling),將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機(jī)地抽取一個(gè)單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其他樣本單位 先從數(shù)字1到k之間隨機(jī)抽取一個(gè)數(shù)字r作為初始單位,以后依次取r+k

31、,r+2k等單位 優(yōu)點(diǎn):操作簡(jiǎn)便,可提高估計(jì)的精度 缺點(diǎn):對(duì)估計(jì)量方差的估計(jì)比較困難,3.3.4 整群抽樣(cluster sampling),將總體中若干個(gè)單位合并為組(群),抽樣時(shí)直接抽取群,然后對(duì)中選群中的所有單位全部實(shí)施調(diào)查 特點(diǎn) 抽樣時(shí)只需群的抽樣框,可簡(jiǎn)化工作量 調(diào)查的地點(diǎn)相對(duì)集中,節(jié)省調(diào)查費(fèi)用,方便調(diào)查的實(shí)施 缺點(diǎn)是估計(jì)的精度較差,3.4 抽樣分布,3.4.1 抽樣分布的概念 3.4.2 樣本均值抽樣分布 3.4.3 樣本比率抽樣分布 3.4.4 樣本方差抽樣分布 3.4.5 兩個(gè)樣本統(tǒng)計(jì)量的分布,樣本統(tǒng)計(jì)量的概率分布,是一種理論分布 在重復(fù)選取容量為n的樣本時(shí),由該統(tǒng)計(jì)量的所有

32、可能取值形成的相對(duì)頻數(shù)分布 隨機(jī)變量是 樣本統(tǒng)計(jì)量 樣本均值, 樣本比例,樣本方差等 結(jié)果來(lái)自容量相同的所有可能樣本 提供了樣本統(tǒng)計(jì)量長(zhǎng)遠(yuǎn)而穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù),3.4.1 抽樣分布 (sampling distribution),抽樣分布的形成過(guò)程 (sampling distribution),在重復(fù)選取容量為n的樣本時(shí),由樣本均值的所有可能取值形成的相對(duì)頻數(shù)分布 一種理論概率分布 推斷總體均值的理論基礎(chǔ),樣本均值的抽樣分布,樣本均值的抽樣分布(例題分析),【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體) ,即總體單位數(shù)N=4。4 個(gè)個(gè)體分別為x1=1,x2=2,x3=3,x4=

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論