第四章概率與概率分布_第1頁
第四章概率與概率分布_第2頁
第四章概率與概率分布_第3頁
第四章概率與概率分布_第4頁
第四章概率與概率分布_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第四章 概率與概率分布第一節(jié) 隨機事件及其概率一、隨機試驗與隨機事件1、必然現(xiàn)象與偶然現(xiàn)象具有確定變化規(guī)律的現(xiàn)象是必然現(xiàn)象,一定條件必然導致一定結果。事先不確定結果的現(xiàn)象是隨機現(xiàn)象/偶然現(xiàn)象,在一定條件下可能出現(xiàn)這種結果也會出現(xiàn)那種結果,隨機而定。但隨機現(xiàn)象的隨機性中也蘊含著某種規(guī)律性。例如:個人壽命有長有短,無法確切預測,但某一地區(qū)人口平均壽命是比較穩(wěn)定的。隨機現(xiàn)象的這種規(guī)律就是統(tǒng)計規(guī)律。2、隨機試驗為了研究隨機現(xiàn)象的規(guī)律性,就要進行隨機試驗,以獲取有關信息,例如拋硬幣記錄正反面,從任意一批貨中抽取一件來檢查質量是否合格。嚴格意義的隨機試驗必須滿足三個條件:試驗在相同條件下可重復進行;每次試

2、驗的可能結果不止一個,但所有可能結果試驗前已知;每次試驗只能觀測到一個可能結果,但在試驗結束之間無法肯定出現(xiàn)哪一個。3、隨機事件隨機試驗的每一個可能結果被稱為一個隨機事件。隨機事件分類:基本事件(不能再分解)和復合事件(由兩個或多個基本事件組成)。隨機事件可用樣本空間的集合來表示,每一個基本事件稱為樣本點,所有樣本點構成樣本空間,如上例=甲勝,乙勝,平局。二、隨機事件的概率用來度量隨機事件發(fā)生的可能性大小的是隨機事件發(fā)生的概率,隨機事件A發(fā)生的概率記為P(A),對于一般的隨機事件,0發(fā)生的概率1。等于1則為必然事件,等于零則為不可能事件。1、古典概率概率論發(fā)源于人們對抽簽、拋硬幣、擲篩子等隨機

3、游戲和賭博問題的研究,計算此類概率較簡單直觀。例如篩子有六面,每一面出現(xiàn)的概率均等都是1/6。這類試驗具有兩個特點:試驗的基本事件總數(shù)有限,即樣本空間包含有限多個樣本點;每個事件出現(xiàn)的可能性相同。概率的古典定義:P(A)=事件A中包含的基本事件數(shù)/樣本空間中基本事件總數(shù)=m/n例1:有50件產(chǎn)品,其中有5件次品,現(xiàn)從50件中任取兩件,求抽到兩件均為合格品的概率是多少?兩件均為次品的概率是多少?解:P(A)= (C452C500)/C502 =0.8082 P(B)=(C450C52)/C502=0.00822、統(tǒng)計概率一些事件的各種結果發(fā)生的可能性不同,不能通過一兩次試驗來判斷結果(如射擊),

4、只有充分多次,事件發(fā)生的頻率才穩(wěn)定,即概率的統(tǒng)計定義。P(A)=pm/n在相同條件下重復進行n次試驗,事件A發(fā)生了m次,當試驗次數(shù)n很大時,事件A發(fā)生的頻率m/n在某一常數(shù)p上下波動,而且這種波動的幅度會隨試驗次數(shù)增加而縮小。例2:某地區(qū)近幾年新生嬰兒性別資料如表1,估計該地區(qū)新生兒為男嬰的概率。年份新生嬰兒數(shù)男嬰數(shù)男嬰比例%200016248270.509200112056220.516200215127740.512200314077150.508解:當試驗次數(shù)(觀察的新生兒個數(shù))充分多時,男嬰出現(xiàn)的頻率穩(wěn)定在0.511左右,因此可以估計生男嬰的概率為0.511。當觀測次數(shù)很多時,頻率和概

5、率非常接近,頻率(真實的發(fā)生比例)可作為概率(可能發(fā)生比例)的近似值,次數(shù)越多,越接近真實概率。此方法也稱概率的統(tǒng)計方法或頻率方法。3、主觀概率依據(jù)人們的主觀判斷而估計的隨機事件發(fā)生可能性大小稱為主觀概率,但并非隨意猜想,是基于經(jīng)驗、專業(yè)知識、對事件發(fā)生的條件和影響因素進行分析而得出的。4、概率的基本性質(1)任一事件A的概率是一個介入0和1之間的數(shù)值。(2)必然事件的概率為1,不可能事件的概率為0。(3)若A與B不可能同時發(fā)生/互斥事件,則至少有一個發(fā)生的概率等于各自概率之和。P(AB)=P(A)+P(B)三、概率的運算法則1、加法公式計算兩個事件中至少有一個發(fā)生的概率,AB事件。(1)互斥

6、事件的加法公式A發(fā)生,B就不可能發(fā)生例3:有50件產(chǎn)品,其中有5件次品,現(xiàn)從中任取兩件,求至少抽到一件次品的概率。解1:至少抽到1件次品就是兩件均為次品和只有1件次品兩個事件的和。P(AB)=P(A)+P(B)=C451C51/C502+C450C52/ C502=0.1918解2:利用互補事件概率關系計算?;パa事件,不可能同時發(fā)生而又必然有一個會發(fā)生的兩事件,如中靶和脫靶,合格與不合格。利用P(A)+P()=1,可得P(至少抽到一件次品)=1-P(未抽到次品)=1-C452- C502=0.1918(2)相容事件的加法公式兩事件可能同時發(fā)生例4:將分別寫有09這十個數(shù)的小球放入容器內(nèi),任意搖

7、出一個小球,求出現(xiàn)奇數(shù)或大于等于4的數(shù)的概率。解:奇數(shù)或大于等于4的數(shù)就是奇數(shù)(A)和大于等于4的數(shù)(B)這兩個事件和。樣本空間包括從0到9的10個數(shù),A=1、3、5、7、9,B=4、5、6、7、8、9,由于每個樣本點出現(xiàn)的可能性相同,所以P(A)=5/10,P(B)=6/10。由于A和B之間有交集,AB(簡寫AB)=5、7、9,所以P(AB)=5/10+6/10-3/10=0.8對于相容事件:P(AB)=P(A)+P(B) -P(AB)2、乘法公式計算許多事件同時發(fā)生的概率(1)條件概率作隨機試驗時,如果附加一些條件,計算的概率就是條件概率,如在已知事件B發(fā)生的條件下求A發(fā)生的概率,用P(A

8、B)表示。公式P(AB)= P(AB)/ P(B) P(B)0例5:某公司下屬的甲乙兩廠生產(chǎn)同種產(chǎn)品,甲廠生產(chǎn)產(chǎn)品400件,其中一級品為280件;乙廠生產(chǎn)600件,其中一級品360件。若要從該公司全部產(chǎn)品中任意抽取一件,求已知抽出產(chǎn)品為一級品的條件下該產(chǎn)品出自甲廠的概率。解:設A=甲廠產(chǎn)品,B=一級品,則P(A)=0.4, P(B)=0.64 P(AB)=0.28 P(AB)= 280/1000/640/1000=0.438該題等同于計算從全廠的一級品中抽到甲廠產(chǎn)品的概率,即全部一級品中甲廠產(chǎn)品的比例。(2)乘法公式和事件的獨立性由條件概率公式可推導出:P(AB)=P(A)P(BA) 或 P(

9、AB)=P(B)P(AB),表示兩個事件同時發(fā)生的概率等于其中一個發(fā)生概率乘以另一個事件的條件概率。這里要求兩個事件之間有相關性,否則,如果事件B的發(fā)生不影響事件A的發(fā)生,那么P(AB)= P(A),這種情況稱為A、B為獨立事件。獨立事件的乘法公式簡化為P(AB)=P(A) P(B)例6:50件產(chǎn)品中任取兩件,求抽到兩件均為合格品的概率和兩件均為次品的概率。分兩次抽取,每次只抽一件,則兩種情況:不放回抽樣和放回抽樣。解:設A1=第一次抽到合格品,A2=第二次抽到合格品,A1A2=抽到兩件均為合格品,12=抽到兩次均為次品。在不放回抽樣中:兩次不獨立,相互影響,用不獨立公式:P(AB)=P(A)

10、P(BA)P(A1A2)=P(A1)P(A2A1)=45/50×44/490.8082P(12)=P(1)P(21)=5/50×4/490.0082在放回抽樣中,兩次抽取相互獨立,樣本空間都是50,用獨立公式P(AB)=P(A) P(B)P(A1A2)=P(A1) P(A2)=45/50×45/50=0.81P(12)= P(1)P(2)=5/50×5/50=0.013、全概率公式與貝葉斯公式例7:有一道四選一的題,某學生知道正確答案的概率為2/3,不知道正確答案時才對的概率是1/4,求該學生做出正確選擇的概率?解:設A=知道正確答案,B=選擇正確,顯然

11、,選擇正確的概率可分解為兩種情況“知道正確答案而選擇正確即AB”“不知道正確答案但選擇正確即B”的和,而這兩個事件又分別是另外兩個事件的積。P(B)=P(AB)+P(B)= P(A)P(BA)+ P()P(B)=2/3×1+1/3×1/4=3/4將上例推廣到一般情況就是全概率公式:有i條路可以達到目的地,A1、A2. Ai互不相容,也只有這i條路可達到目的地,它們構成了所有的可能性集合,則稱事件A1、A2. Ai為完備事件組。要達到目的地(事件B),總是要選擇Ai中的一條路,與其同時發(fā)生。 P(B)= P(A1B)+P(A2B)+ P(AiB)= P(A1)P(BA1)+

12、P(A2)P(BA2)+ P(Ai)P(BAi) = P(Ai)P(BAi)直觀意義:每一個Ai發(fā)生都可能導致B發(fā)生,每一個Ai地發(fā)生導致B發(fā)生的概率為P(AiB)= P(Ai)P(BAi),因此作為結果的事件B發(fā)生的概率是各個原因A1引發(fā)的概率的和。由全概率公式推導出貝葉斯公式 ,也稱后驗概率公式:P(AiB)= P(AiB)/ P(B)= P(Ai)P(BAi)/ P(Ai) P(BAi)實際等同于計算在給定B條件下Ai的條件概率公式。應用十分廣泛,是在觀察到B已發(fā)生情況下,確定導致B發(fā)生的各個原因Ai的概率,常用來尋找事件發(fā)生的最可能原因。例8/練習題:在例6中,若學生回答正確,則其純屬

13、猜對的概率是多少?解:就是要求在答對的情況下B,不知道答案的概率是多少。 P(B)= P(B)/ P(B)= P()P(B)/P(A) P(BA)+ P() P(B)=1/3×1/4/2/3×1+1/3×1/40.111第二節(jié) 隨機變量及其概率分布一、隨機變量的概念如果隨機試驗的每個可能結果都用一個數(shù)值表示,那么所有結果就可用一個變量表示,即隨機變量。隨機變量的取值是隨機的,事先不確定。隨機變量通常用大寫字母表示,具體取值用小寫字母表示。例如,檢查產(chǎn)品合格率,出現(xiàn)次品的件數(shù)可能是0、1、2、3件,出現(xiàn)次品的件數(shù)就是一個隨機變量X,它有4個取值x1x2x3x4,分別

14、對應4個事件。隨機變量X取值為xi的概率用P(X=xi)來表示。根據(jù)取值的特點,將隨機變量分為離散型和連續(xù)型。二、隨機變量的概率分布隨機變量取值的規(guī)律,即取各個值的概率分布1、離散型隨機變量的概率分布例9:將一均勻篩子投擲20次、100次、無數(shù)次,用X表示篩子落下時面朝上的點數(shù),做出各種情況下X的相對頻率分布表和分布圖。表:篩子出現(xiàn)點數(shù)的相對頻率分布出現(xiàn)的點數(shù)X相對頻率f/nn=20n=100n=10.200.181/620.100.171/630.300.151/640.150.151/650.100.201/660.150.151/6 f/n n=20 f/n n=10 f/n=P(x)

15、n=0.3 0.3 0.30.2 0.2 0.20.1 0.1 0.1 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6當樣本較小時,相對頻率劇烈波動,隨著樣本量增加,相對頻率趨于穩(wěn)定,最后穩(wěn)定在一個極限分布上,即隨機變量X的概率分布。通過離散型隨機變量的概率分布圖形,可以知道該變量有可能有哪些取值及每個可能取值出現(xiàn)的頻率。每個取值的相對頻率之和等于1,概率之和也等于1:P(x)=12、連續(xù)型隨機變量的概率密度表:200名男生身高的頻數(shù)分布組限組中值頻數(shù)相對頻率相對概率密度148-15415140.020.003154-160157120.060.010160-16616

16、3440.220.037166-172169640.320.053172-178175560.280.047178-184181160.080.013184-19018740.020.003合計2001.001.00如畫出條形圖,柱條高度之和為1。如果將組距縮小一倍,3厘米,則條形圖形狀如下:148-151149.520.010.003151-154152.520.010.003154-157155.560.030.010157-170158.560.030.010合計2001.00隨著組距的減小,相對頻率分布圖越來越扁,柱條的寬度越來越窄,所有柱條高度之和仍為1。如果將縱軸刻度改為相對頻率密

17、度=相對頻率/組距,畫出直方圖,就使得柱狀圖不受組距大小影響,而成為一個標準化的圖。這時柱條面積總和等于1。樣本量增加、組距減小時的變化:隨樣本量增大,隨機因素影響減小,相對頻率趨向于概率。同時樣本增大也可以更精細地分組,于是在面積固定為1時,相對頻率密度近似變成一條曲線,稱為密度函數(shù),簡稱概率分布。離散型隨機變量分布圖形是一個階梯形,連續(xù)型變量是一條曲線。三、隨機變量的數(shù)字特征1、隨機變量的數(shù)學期望均值它描述隨機變量的概率分布的中心位置。例10:賭博中的擲篩子 n =20n =100n=Xf/nX(f/n)f/nX(f/n)f/n= P(X)X P(X)10.200.20.180.181/6

18、1/620.100.20.170.341/62/630.300.90.150.451/63/640.150.60.150.601/64/650.100.50.201.001/65/660.150.90.150.901/66/6=3.30=3.47=21/6=3.50隨樣本量增大,樣本均值趨向于某一極限值,稱為概率分布的均值或總體均值,也叫隨即變量X的均值,用E(x)或表示。= X P(X)E(x)只是重復多次試驗后所能期望得到的平均意義上的值,不一定是真實出現(xiàn)的值,所以也叫期望值。2、隨機變量的方差和標準差例11:按照上表中最后一列的概率分布計算均方差MSD和方差XP(X)(x-)(x-)2(

19、x-)2 P(X)11/6-2.506.251.0421/6-1.502.250.3831/6-0.500.250.0441/60.500.250.0451/61.502.250.3861/62.506.251.04=3.50MSD=2.92方差和均方差的差別僅在于除數(shù)是n-1而不是n,但當總體趨于無窮大時,兩者相同。方差=MSD=2.92;標準差=1.71。極限情況下的方差稱為概率分布的方差或總體方差,用2表示,公式:2=MSD=(X-) 2P(X)3、總體矩和樣本矩總體均值和方差也叫做總體的一階矩和二階距,與樣本均值和樣本方差的比較:樣本矩總體矩樣本均值=X(f/n)總體均值= X P(X

20、)樣本方差S2=MSD=(X-)2f/n總體方差2=MSD=(X-) 2P(X)四、常見的概率分布模型1、二項分布離散型隨機變量針對二項變量,即每次實驗只有兩種可能結果的變量,如性別、拋硬幣正反面。這類試驗的兩種可能結果通常用“成功”和“失敗”表示,用p和1-p表示成功概率和失敗概率,每次都有相同的成功概率和失敗概率,且每次實驗是獨立的。N次這樣的重復試驗中成功的總次數(shù)X就稱為二項變量。二項變量的例子:試驗成功失敗pNX=k投擲均勻硬幣國徽朝上國徽朝下1/2投擲次數(shù)國徽朝上的總次數(shù)隨機抽取一居民女性 男性總體中女性居民的比例樣本量樣本中的女性人數(shù)多項選擇題答案猜測(5個選項)正確錯誤1/5試題

21、數(shù)回答正確題數(shù)二項變量X的概率分布就是二項分布,概率分布公式為:P(X=k)=Cnkpk(1-p)n-kk=0,1,2,3.例12:在一個男女居民各半的大居民中,抽取一個n=10的隨機樣本,問1)樣本中正好有4位女性居民的概率是多少?2)樣本中至少有2為女性居民的概率是多少?假定有放回抽樣(其實不放回時誤差也很小,因為總體很大而樣本很?。=猓?n=10,k=4,p=0.51) P(X=4)=C104(0.5)4(0.5)6=0.20512) P(X2)= P(X=2) +P(X=3) +P(X=4).+ P(X=10)=0.9893可以查詢表二項概率分布表或二項分布的右側尾部累計概率表。二項

22、分布的性質:二項分布可簡寫為B(n,p),n是獨立實驗的次數(shù),p是事件A在每次實驗中發(fā)生的概率。二項分布的數(shù)學期望為np,二項分布方差為npq。當p=0.5時,分布圖形是對稱的,當不等于0.5時非對稱,n越大非對稱性越不明顯。2、正態(tài)分布連續(xù)型隨機變量,寫作N(,2)許多連續(xù)型隨機變量的概率分布是一種呈鐘形的對稱曲線,叫做正態(tài)曲線或高斯曲線,統(tǒng)計中最普通也最常用的分布。正態(tài)分布的特征:單峰,對稱眾數(shù)、中位數(shù)和均值相等。正態(tài)分布的常用性質:(1)正態(tài)曲線以x軸為漸近線,但是永遠不會與x相交。(2)正態(tài)分布是一條關于x=對稱的鐘形曲線,平均值位于正態(tài)曲線的中心。(3)標準差決定陡峭或扁平程度,越小

23、,越陡峭,越大,越扁平。(4)任何正態(tài)分布都適用689599.7規(guī)則,即:大約有68.27%的數(shù)據(jù)落在距平均值一個標準差的范圍內(nèi),即距均值一個標準差的范圍面積占總面積的68%;大約有95.45%的數(shù)據(jù)落在距平均值兩個標準差的范圍內(nèi);大約有99.73%的數(shù)據(jù)落在距平均值三個標準差的范圍內(nèi)。2.1 標準正態(tài)分布,寫作N(0,1)由于不同的變量的各自分布形狀不同,同一變量采用不同度量單位也會產(chǎn)生不同正態(tài)分布。所以可轉換為統(tǒng)一的分布:標準正態(tài)分布,=0,=1的正態(tài)分布,也叫Z分布。將隨機變量X轉化為Z值,Z= ,表示X值與均值的距離是標準差的幾倍。則隨機變量Z服從標準正態(tài)分布N(0,1)。標準分的實際

24、意義:例子:A同學數(shù)學考了90分,平均分是70分;B同學政治考了90分,平均分85分,兩個同學的成績一樣嗎?設標準差相等都為10分。Z(A)=90-70/10=2Z(B)=90-85/10=0.5 則A優(yōu)于BC同學數(shù)學考了70分,標準分為70-70/10=0,但不等于真實成績?yōu)?。如果數(shù)學和政治平均分都為70分,數(shù)學成績標準差為20,政治成績標準差為10,則A同學和B同學孰優(yōu)孰劣? Z(A)=90-70/20=1Z(B)=90-70/10=2 則B優(yōu)于A學習正態(tài)分布和標準正態(tài)分布的作用:計算某個變量在某一范圍內(nèi)取值的概率。例13:練習查表,p(Z1.96) ;p(Z-1.96); p(-1.9

25、6Z1.96); p(-1.0Z1.5)p(Z1.96)=0.025; p(Z-1.96)= p(Z1.96)=0.025; p(-1.96Z1.96)=1-2 p(Z1.96)=0.95; p(-1.0Z1.5)= 1- p (Z-1.0)- p(Z1.5)= 1-p(Z1.0)- p(Z1.5)=0.7745p(-1.0Z1.5)= p (Z1.5)-(1- p(Z1.0))=0.7745例14:某企業(yè)員工平均收入X服從=1750元,標準差=350元的正態(tài)分布,求該企業(yè)員工收入超過2200元的比例是多少?低于1500元的比例有多少?也就是說,隨機抽取一位員工其平均收入超過2200元或不到1500元的概率是多少?解:1)Z=(2200-1750)/3501.29,p(Z1.29)=0.09589.6% 2)Z

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論