第六章概率分布

上傳人：a*** IP屬地：湖北上傳時(shí)間：2023-02-01 格式：PPT 頁數(shù)：119 大?。?80KB 積分：28 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩114頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第六章概率分布第一節(jié)概率的基本概念第二節(jié)正態(tài)分布第三節(jié)二項(xiàng)分布第四節(jié)抽樣分布第一節(jié)概率的基本概念一、什么是概率在心理與教育研究中，大部分現(xiàn)象屬于隨機(jī)現(xiàn)象，隨機(jī)現(xiàn)象又稱隨機(jī)事件。隨機(jī)是指在一定條件下可能出現(xiàn)也可能不出現(xiàn)的，表明隨機(jī)事件出現(xiàn)可能性大小的客觀指標(biāo)就是概率（probability）。概率的定義有兩種，即后驗(yàn)概率和先驗(yàn)概率。（一）后驗(yàn)概率(posteriorprobability)或統(tǒng)計(jì)概率隨機(jī)事件A的頻率當(dāng)n無限增大時(shí)，隨機(jī)事件A的頻率會(huì)穩(wěn)定在一個(gè)常數(shù)P，這個(gè)常數(shù)就是隨機(jī)事件A的概率。（二）先驗(yàn)概率(priorprobability)或古典概率古典概率模型要求滿足兩個(gè)條件：⑴實(shí)驗(yàn)的所有可能結(jié)果（基本事件）是有限的；⑵每一種可能結(jié)果出現(xiàn)的可能性相等。二、概率的基本性質(zhì)（一）概率的公理系統(tǒng)1．任何一個(gè)隨機(jī)事件Ａ的概率都是非負(fù)的。0≤P（A）≤12．不可能事件的概率等于零。3．必然事件的概率等于1。（二）概率的加法定理互不相容事件：在一次實(shí)驗(yàn)或調(diào)查中，若事件Ａ發(fā)生，則事件Ｂ就一定不發(fā)生，這樣的兩個(gè)事件為互不相容事件。加法定理(additiverule)：兩互不相容事件A、B之和的概率，等于這兩個(gè)事件概率之和。即（三）概率的乘法定理獨(dú)立事件：一個(gè)事件的出現(xiàn)對(duì)另一個(gè)事件的出現(xiàn)不發(fā)生影響。相關(guān)事件或相依事件：事件A的概率隨事件B是否出現(xiàn)而改變，事件B的概率隨事件A是否出現(xiàn)而改變。乘法定理(productrule)：兩個(gè)獨(dú)立事件同時(shí)出現(xiàn)的概率等于這兩事件概率的乘積?！纠繌?2張撲克牌（去掉大小王牌）中有放回地連續(xù)抽兩張牌，即抽完第一張后將所抽的牌再放回去，混合好后再抽第二張。（1）第一次抽取紅桃K第二次抽取方塊K的概率是多少？（2）第一次抽取紅桃第二次抽取方塊的概率是多少？（3）抽牌兩次皆為紅色的概率是多少？【例6-1】一枚硬幣擲三次，或三枚硬幣各擲一次，問出現(xiàn)兩次或兩次以上H的概率是多少？解：投擲硬幣可能出現(xiàn)八種結(jié)果（HHH、HHT、HTH、THH、TTH、THT、HTT、TTT）。每種結(jié)果可能出現(xiàn)的概率，依概率乘法規(guī)則計(jì)算：各為。設(shè)P(A)代表3次H的概率，P(B)代表“HHT”這種結(jié)果的概率，P(C)代表“HTH”的概率，P(D)代表“THH”的概率。依據(jù)概率加法規(guī)則計(jì)算：三、概率分布類型概率分布(probabilitydistribution)：對(duì)隨機(jī)變量取值的概率分布情況用數(shù)學(xué)方法（函數(shù)）進(jìn)行描述，一般用概率分布函數(shù)進(jìn)行描述。概率分布依不同的標(biāo)準(zhǔn)可以分為不同的類型。（一）離散分布與連續(xù)分布離散分布：離散型隨機(jī)變量的概率分布，即計(jì)數(shù)數(shù)據(jù)的概率分布。常用的離散分布有二項(xiàng)分布(binomidistribution)、泊松分布(Poissondistribution)和超幾何分布(hypergeometricdistribution)等。連續(xù)分布：連續(xù)隨機(jī)變量的概率分布，即測(cè)量數(shù)據(jù)的概率分布。常用的連續(xù)分布有正態(tài)分布、負(fù)指數(shù)分布、威布爾分布等。（二）經(jīng)驗(yàn)分布與理論分布依分布函數(shù)的來源，可將概率分布分為經(jīng)驗(yàn)分布與理論分布。經(jīng)驗(yàn)分布(empiricaldistribution)：根據(jù)觀察或?qū)嶒?yàn)所獲得的數(shù)據(jù)而編制的次數(shù)分布或相對(duì)頻率分布。理論分布(theoreticaldistribution)：隨機(jī)變量概率分布的函數(shù)-數(shù)學(xué)模型；按某種數(shù)學(xué)模型計(jì)算出的總體的次數(shù)分布。隨機(jī)變量概率分布的性質(zhì)，由它的特征數(shù)來表達(dá)。這些特征數(shù)主要有期望值（理論平均數(shù)）和方差。（三）基本隨機(jī)變量分布與抽樣分布依概率分布所描述的數(shù)據(jù)特征，可將概率分布分為基本隨機(jī)變量分布與抽樣分布（samplingdistribution）?；倦S機(jī)變量分布：隨機(jī)變量各種不同取值情況的概率分布，常用的有二項(xiàng)分布、正態(tài)分布。抽樣分布：從同一總體內(nèi)抽取的不同樣本的統(tǒng)計(jì)量的概率分布。樣本統(tǒng)計(jì)量主要有平均數(shù)、兩平均數(shù)之差、方差、標(biāo)準(zhǔn)差、相關(guān)系數(shù)、回歸系數(shù)、百分比率（或概率）等。統(tǒng)計(jì)量是基本隨機(jī)變量的函數(shù)，故抽樣分布也稱隨機(jī)變量函數(shù)的分布?；倦S機(jī)變量分布與抽樣分布是應(yīng)用于統(tǒng)計(jì)學(xué)上的理論分布，是統(tǒng)計(jì)推論的重要依據(jù)，只有對(duì)它們真正了解，才能明確各種統(tǒng)計(jì)方法的應(yīng)用條件及注意問題，并對(duì)各種具體方法有較為深刻的理解。第二節(jié)正態(tài)分布正態(tài)分布(normaldistribution)：常態(tài)分布、常態(tài)分配，是連續(xù)隨機(jī)變量概率分布的一種，在數(shù)理統(tǒng)計(jì)的理論與實(shí)際應(yīng)用中占有最重要地位的一種理論分布。棣·莫弗、拉普拉斯、高斯一、正態(tài)分布特征（一）正態(tài)分布曲線函數(shù)正態(tài)分布曲線函數(shù)又稱概率密度函數(shù)，其一般方程為分布函數(shù)與概率密度函數(shù)分布函數(shù)F(x)=P(X<x)，表示隨機(jī)變量X的值小于x的概率。概率密度f(x)是F(x)在x處的關(guān)于x的一階導(dǎo)數(shù)，即變化率。如果在某一x附近取非常小的一個(gè)鄰域Δx，那么，隨機(jī)變量X落在(x,x+Δx)內(nèi)的概率約為f(x)Δx，即P(x<X<x+Δx)≈f(x)Δx。概率密度f(x)是X落在x處“單位寬度”內(nèi)的概率?！懊芏取币辉~可以由此理解。

（二）正態(tài)分布的特征1.正態(tài)分布的形式是對(duì)稱的，其對(duì)稱軸是經(jīng)過平均數(shù)點(diǎn)的垂線。2.正態(tài)分布的中央點(diǎn)最高，然后逐漸向兩側(cè)下降，曲線的形式是先向內(nèi)彎，然后向外彎，拐點(diǎn)位于正負(fù)1個(gè)標(biāo)準(zhǔn)差處，曲線兩端向靠近基線處無限延伸，但終不能與基線相交。3.正態(tài)曲線下的面積為1，由于它在平均數(shù)處左右對(duì)稱，故經(jīng)平均數(shù)點(diǎn)的垂線將正態(tài)曲線下的面積劃分為相等的兩部分，各為0.50。4.正態(tài)分布是一簇分布，隨隨機(jī)變量的平均數(shù)(μ)、標(biāo)準(zhǔn)差(σ)的大小與單位不同而有不同的分布形態(tài)。所有正態(tài)分布都可以通過Z分?jǐn)?shù)公式非常容易地轉(zhuǎn)換成標(biāo)準(zhǔn)正態(tài)分布(standardnormaldistribution)。根據(jù)Z分?jǐn)?shù)的性質(zhì)可知，標(biāo)準(zhǔn)正態(tài)分布的μ=0，σ2=1。標(biāo)準(zhǔn)正態(tài)分布通常寫作N(0,1)正態(tài)分布。標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)：標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)及面積（概率）的計(jì)算公式：5.正態(tài)分布中各差異量數(shù)數(shù)值相互間有固定比率。表6-1正態(tài)分布中各種差異量數(shù)值的固定比率QADsQ10.84530.6745AD1.182910.7979s1.48261.253316.在正態(tài)分布曲線下，標(biāo)準(zhǔn)差與概率（面積）有一定的數(shù)量關(guān)系。二、正態(tài)分布表的編制與使用（一）正態(tài)分布表的編制與結(jié)構(gòu)兩種不同的編制方法（1）從Z=﹣∞開始，表中列出的是某Z分?jǐn)?shù)以下的累積概率；（2）從Z=0開始，計(jì)算從Z=0至某一定值之間的概率。正態(tài)分布表的結(jié)構(gòu)一般包括三欄第一欄：Z分?jǐn)?shù)單位；第二欄：密度函數(shù)或比率數(shù)值（y）；第三欄：概率值（p）。（二）正態(tài)分布表的使用1.依據(jù)Z分?jǐn)?shù)求概率p，即已知標(biāo)準(zhǔn)分?jǐn)?shù)求面積。①求某Z分?jǐn)?shù)值與平均數(shù)（Z=0）之間的概率。②求某Z分?jǐn)?shù)以上或以下的概率。③求兩個(gè)Z分?jǐn)?shù)之間的概率。2.從概率p求Z分?jǐn)?shù)，即從面積求標(biāo)準(zhǔn)分?jǐn)?shù)值。①已知從平均數(shù)開始的概率值求Z值。②已知位于正態(tài)分布兩端的概率值求該概率值分界點(diǎn)的Z值。③若已知正態(tài)曲線下中央部分的概率，求Z分?jǐn)?shù)是多少。3.已知概率p或Z值，求概率密度y，即正態(tài)曲線的高。三、次數(shù)分布是否為正態(tài)分布的檢驗(yàn)方法（一）皮爾遜偏態(tài)量數(shù)法正態(tài)分布：M=Md=Mo正偏態(tài)分布：M﹥Md﹥Mo負(fù)偏態(tài)分布：M﹤Md﹤Mo皮爾遜發(fā)現(xiàn)，在偏態(tài)分布(skeweddistribution)中，Md離平均數(shù)較近、而距眾數(shù)較遠(yuǎn)。根據(jù)平均數(shù)與眾數(shù)或中數(shù)的距離，皮爾遜提出了一個(gè)偏態(tài)量數(shù)公式，用來描述分布形態(tài)：當(dāng)SK=0時(shí)，分布對(duì)稱；當(dāng)SK＞0時(shí)，分布屬正偏態(tài)；當(dāng)SK＜0時(shí)，分布屬負(fù)偏態(tài)。（二）峰度、偏度檢驗(yàn)法1.偏度系數(shù)(coefficientofskewness)當(dāng)g1=0時(shí)分布是對(duì)稱的；當(dāng)g1>0時(shí)，分布為正偏態(tài)；當(dāng)g1<0時(shí)，分布呈負(fù)偏態(tài)。當(dāng)觀測(cè)數(shù)據(jù)數(shù)目N>200時(shí)，這個(gè)偏態(tài)系數(shù)的統(tǒng)計(jì)量g1才較可靠。2.峰度系數(shù)(coefficientofkurtosis)當(dāng)g2=0時(shí)，正態(tài)分布的峰度；g2>0時(shí)，分布的峰度比正態(tài)分布的峰度低闊；g2<0時(shí)，表明分布的峰度比正態(tài)分布的峰度高狹。當(dāng)N>1000時(shí)，g2值才比較可靠。（三）累加次數(shù)曲線法因?yàn)闃?biāo)準(zhǔn)正態(tài)分布的形式固定，因此其累加概率與標(biāo)準(zhǔn)差的關(guān)系也固定。根據(jù)這一點(diǎn)，可將一般分布的累加概率與標(biāo)準(zhǔn)正態(tài)分布累加概率相比較。具體方法①制作樣本的累加次數(shù)分布表，列出累加比率和觀測(cè)值相應(yīng)的標(biāo)準(zhǔn)分?jǐn)?shù)。②制作樣本的累加頻率曲線圖。縱坐標(biāo)為次數(shù)比率0~1.00，橫坐標(biāo)為Z分?jǐn)?shù)，一般為﹣3~+3。③在同一坐標(biāo)系中，制作累加正態(tài)分布概率曲線圖。④畫好圖后，從圖上直接比較正態(tài)分布概率曲線與樣本的累加頻率曲線，若兩曲線完全重合，說明某樣本的分布呈正態(tài)；若樣本的累加頻率曲線偏離正態(tài)累積曲線較大，則不符合正態(tài)分布。四、正態(tài)分布理論在測(cè)驗(yàn)中的應(yīng)用（一）化等級(jí)評(píng)定為測(cè)量數(shù)據(jù)將等級(jí)評(píng)定轉(zhuǎn)化為測(cè)量數(shù)據(jù)，首先要考慮被評(píng)定的心理量是否為正態(tài)分布。將等級(jí)評(píng)定轉(zhuǎn)化為測(cè)量數(shù)據(jù)的方法是用各等級(jí)中點(diǎn)的Z分?jǐn)?shù)代表該等級(jí)分?jǐn)?shù)。具體步驟①根據(jù)各等級(jí)被評(píng)者的數(shù)目求各等級(jí)的人數(shù)比率；②求各等級(jí)比率值的中間值，作為該等級(jí)的中點(diǎn)；③求各等級(jí)中點(diǎn)以上（或以下）的累加比率；④用累加比率查正態(tài)表求Z值，該Z分?jǐn)?shù)就是各等級(jí)代表性的測(cè)量值；⑤求被評(píng)者所得評(píng)定等級(jí)的測(cè)量數(shù)據(jù)的算術(shù)平均數(shù)，即為每個(gè)被評(píng)定者的綜合評(píng)定分?jǐn)?shù)?！纠?-2】表6-2是3位教師對(duì)100名學(xué)生的學(xué)習(xí)能力所作等級(jí)評(píng)定的結(jié)果。表6-3是3名學(xué)生從3位老師那兒獲得的評(píng)定等級(jí)，試將其轉(zhuǎn)化為Z分?jǐn)?shù)。表6-23名教師對(duì)100名學(xué)生的評(píng)定結(jié)果

等級(jí)評(píng)定結(jié)果（人數(shù)）教師甲教師乙教師丙A51020B252025C404035D252015E5105總數(shù)100100100表6-3各學(xué)生所獲得的評(píng)定等級(jí)學(xué)生教師甲教師乙教師丙1BAA2ABA3DCC表6-4化等級(jí)評(píng)定為Z分?jǐn)?shù)

等級(jí)教師甲教師乙教師丙P比率中點(diǎn)以下累加ZP比率中點(diǎn)以下累加ZP比率中點(diǎn)以下累加ZA0.050.9751.960.100.951.650.200.901.28B0.250.8250.940.200.800.840.250.6750.45C0.400.5000.400.5000.350.375-0.32D0.250.175-0.940.200.20-0.840.150.125-1.15E0.050.025-1.960.100.05-1.650.050.025-1.96學(xué)生1的平均成績(jī)：(0.94+1.65+1.28)/3=1.29學(xué)生2的平均成績(jī)：(1.96+0.84+1.28)/3=1.36學(xué)生3的平均成績(jī)：(－0.94+0－0.32)/3=－0.42（二）確定測(cè)驗(yàn)題目的難易度原理：假設(shè)一個(gè)測(cè)驗(yàn)中不同難易題目的分布是正態(tài)的，即一個(gè)測(cè)驗(yàn)中通過率較大和較小的題目很少，而通過率居中的題目較多。確定題目難度分?jǐn)?shù)的具體步驟①計(jì)算各題目的通過率；②用0.5減去通過率，不計(jì)正負(fù)號(hào)，獲得正態(tài)分布表中的概率值（p）；③依照p值查正態(tài)表中相應(yīng)的Z值，通過率大于50%的Z值計(jì)為負(fù)值，通過率小于50%的Z值計(jì)為正值；④將查表得到的Z分?jǐn)?shù)加上5便得到從0~10的十進(jìn)制的難度分?jǐn)?shù)值。表6-5難度分?jǐn)?shù)的計(jì)算測(cè)驗(yàn)題編號(hào)通過率（%）P值ZZ+51990.49-2.3312.6693950.45-1.6453.3555850.35-1.0353.9657800.30-0.844.1609700.20-0.5254.4751050005.00011200.300.845.8401350.451.6456.6452510.492.337.330（三）在能力分組或等級(jí)評(píng)定時(shí)確定人數(shù)①將6個(gè)標(biāo)準(zhǔn)差除以分組的或等級(jí)的數(shù)目，做到Z分?jǐn)?shù)等距；②查正態(tài)分布表，從Z求p，即各等級(jí)或各組在等距的情況下應(yīng)有的比率；③將比率乘以欲分組的人數(shù)，便得到各等級(jí)或分組該有的人數(shù)。所計(jì)算的各組人數(shù)分布，應(yīng)與總數(shù)相等。有時(shí)由于從Z查p有誤差，使結(jié)果不能與總數(shù)相符，這時(shí)應(yīng)將居中的那一組做適當(dāng)?shù)脑黾踊驕p少，因?yàn)檫@樣做，對(duì)百分比率的影響甚小?！纠?-3】要把100人在某一能力上分成5個(gè)等級(jí)，各等級(jí)應(yīng)該有多少人，才能使等級(jí)評(píng)定做到等距？表6-6能力分為五組時(shí)各組人數(shù)的分布

分組各組界限比率p人數(shù)分布(p×N)A1.8σ以上0.03594B0.6σ~1.8σ0.238424C-0.6σ~0.6σ0.451444D-1.8σ~-0.6σ0.238424E-1.8σ以下0.03594（四）測(cè)驗(yàn)分?jǐn)?shù)的正態(tài)化正態(tài)化的步驟當(dāng)原始分?jǐn)?shù)不服從正態(tài)分布時(shí)，先將原始分?jǐn)?shù)的頻數(shù)轉(zhuǎn)化為相對(duì)累積頻數(shù)(百分等級(jí))，將它視為正態(tài)分布的概率；然后，通過查正態(tài)分布表中概率值相對(duì)應(yīng)的Z值，將其轉(zhuǎn)換成Z分?jǐn)?shù)，達(dá)到正態(tài)化的目的。正態(tài)化是利用改變次數(shù)的方法，將原來偏態(tài)分布中眾數(shù)所偏的一邊拉長(zhǎng)，使之成為正態(tài)，這是一種非線性轉(zhuǎn)換。正態(tài)化是建立正態(tài)標(biāo)準(zhǔn)分?jǐn)?shù)的關(guān)鍵。原始分?jǐn)?shù)正態(tài)化的前提條件：研究對(duì)象的總體事實(shí)上應(yīng)該是正態(tài)分布，否則就會(huì)歪曲事實(shí)，這是使用各種正態(tài)化標(biāo)準(zhǔn)分?jǐn)?shù)所必須注意的。T分?jǐn)?shù)(Tscores)是從Z分?jǐn)?shù)經(jīng)過轉(zhuǎn)化而來的一種正態(tài)化的標(biāo)準(zhǔn)分?jǐn)?shù)，它是McCall(1939)創(chuàng)用的方法。心理與教育測(cè)驗(yàn)常用T分?jǐn)?shù)來建立常模。T分?jǐn)?shù)是將標(biāo)準(zhǔn)分?jǐn)?shù)擴(kuò)大10倍，再加上50。T=10Z+50T分?jǐn)?shù)計(jì)算步驟第一步：將原始分?jǐn)?shù)正態(tài)化；第二步：把正態(tài)化的Z值代入T值公式加以直線轉(zhuǎn)換。T分?jǐn)?shù)不僅具備標(biāo)準(zhǔn)分?jǐn)?shù)的所有優(yōu)點(diǎn)，而且克服了標(biāo)準(zhǔn)分?jǐn)?shù)較難理解的不足。首先，它沒有負(fù)數(shù)。其次，若出現(xiàn)小數(shù)時(shí)可以四舍五入為整數(shù)，而誤差不會(huì)很大。再次，如果可以從理論上假設(shè)某一測(cè)驗(yàn)的分?jǐn)?shù)應(yīng)該是正態(tài)分布，只是由于抽樣誤差等偶然因素導(dǎo)致了原始分?jǐn)?shù)偏態(tài)分布，那么運(yùn)用T分?jǐn)?shù)的方法可迫使其成為正態(tài)?！纠磕逞芯恐须S機(jī)抽取了180名學(xué)生的某一能力測(cè)驗(yàn)分?jǐn)?shù)，由于這些能力分?jǐn)?shù)不是正態(tài)，需要將其正態(tài)化。具體步驟①將原始數(shù)據(jù)整理成次數(shù)分布表；②計(jì)算各分組上限以下的累加次數(shù)cf；③計(jì)算每組中點(diǎn)以下的累加次數(shù)，即前一組上限以下累加次數(shù)加上該組次數(shù)的一半；④各組中點(diǎn)以下累加次數(shù)除以總數(shù)求累積比率；⑤將各組中點(diǎn)以下累加比率視為正態(tài)分布的概率，查正態(tài)分布表，將p轉(zhuǎn)化為Z分?jǐn)?shù)；⑥將正態(tài)化的Z值直線轉(zhuǎn)換為T分?jǐn)?shù)。表6-7T分?jǐn)?shù)與正態(tài)化的計(jì)算分組組中值f上限以下累加各組中點(diǎn)以下累加次數(shù)累計(jì)百分比Z正態(tài)化T分?jǐn)?shù)T=10Z+50140~142818017697.782.0170135~137917216893.331.5065130~13220163153851.0460125~1272914312971.670.5756120~1222811410055.560.1451115~11716867843.33-0.1748110~11216706234.44-0.4046105~1078545027.78-0.5944100~1029464223.33-0.734395~978373318.33-0.904190~927292614.44-1.063985~876221910.56-1.253880~82616137.22-1.463575~7751084.44-1.703370~725531.67-2.1229N=180s=17.91T分?jǐn)?shù)雖不等距，但T分?jǐn)?shù)更接近總體的情況。轉(zhuǎn)換后的T分?jǐn)?shù)的平均數(shù)為50，標(biāo)準(zhǔn)差為10，平均數(shù)上下各五個(gè)標(biāo)準(zhǔn)差，正好包括了T分?jǐn)?shù)從0~100。在使用T分?jǐn)?shù)時(shí)，應(yīng)注意與前面所講的Z’=10Z+50的線性變換形式區(qū)別開來。雖然二者都有相同的平均數(shù)和標(biāo)準(zhǔn)差，但T分?jǐn)?shù)是經(jīng)過正態(tài)化的分?jǐn)?shù)，而前者是否服從正態(tài)分布還不清楚，它們將以原始分?jǐn)?shù)的分布形態(tài)為轉(zhuǎn)移。T分?jǐn)?shù)可用于本來應(yīng)是正態(tài)分布而實(shí)際呈偏態(tài)分布的各種測(cè)驗(yàn)的比較，而前者只能用于分布形態(tài)相同或相近的各種測(cè)驗(yàn)的比較。第三節(jié)二項(xiàng)分布二項(xiàng)分布(bionimaldistribution)是一種具有廣泛用途的離散型隨機(jī)變量的概率分布，它是由貝努里創(chuàng)始的，因此又稱為貝努里分布。一、二項(xiàng)試驗(yàn)與二項(xiàng)分布（一）二項(xiàng)試驗(yàn)二項(xiàng)試驗(yàn)：貝努里試驗(yàn)，必須滿足以下幾個(gè)條件：1.任何一次試驗(yàn)恰好有兩個(gè)結(jié)果，成功與失敗，或A與。2.共有n次試驗(yàn)，且n是預(yù)先給定的任一正整數(shù)。3.每次試驗(yàn)各自獨(dú)立，各次試驗(yàn)之間無相互影響。4.某種結(jié)果出現(xiàn)的概率在任何一次試驗(yàn)中都是固定的。（二）二項(xiàng)分布二項(xiàng)分布：試驗(yàn)僅有兩種不同性質(zhì)結(jié)果的概率分布。也稱兩個(gè)對(duì)立事件的概率分布。二項(xiàng)分布同二項(xiàng)定理有著密切的關(guān)系：x=0,1,…,n;n為正整數(shù)。二項(xiàng)展開式的要點(diǎn)：項(xiàng)數(shù)：二項(xiàng)展開式中共有n＋1項(xiàng)。方次：p的方次，從n→0為降冪；q的方次從0→n為升冪。每項(xiàng)p與q方次之和等于n。系數(shù)：各項(xiàng)系數(shù)是成功事件次數(shù)的組合數(shù)。二項(xiàng)分布的具體定義設(shè)有n次試驗(yàn)，各次試驗(yàn)是彼此獨(dú)立的，每次試驗(yàn)?zāi)呈录霈F(xiàn)的概率都是p，某事件不出現(xiàn)的概率都是q(q=1－p)，則對(duì)于某事件出現(xiàn)X次(0,1,2,…,n)的概率分布為：【例6-4】10個(gè)硬幣擲一次，或1個(gè)硬幣擲十次。問五次正面向上的概率是多少？五次及五次以上正面向上的概率是多少？

解：（1）根據(jù)題意，n=10，p=q=1/2，X=5

（2）五次及五次以上正面向上的概率二、二項(xiàng)分布的性質(zhì)（一）二項(xiàng)分布是離散型分布，概率直方圖是躍階式。因?yàn)閄為不連續(xù)變量，用概率條圖表示更合適，用直方圖表示只是為了更形象。1.當(dāng)p=q時(shí)圖形是對(duì)稱的。【例6-5】已知p=q=1/2，求(p+q)6的值。解：2.當(dāng)p≠q時(shí)，直方圖呈偏態(tài)，p﹤q與p﹥q的偏斜方向相反。如果n很大，即使p≠q，偏態(tài)逐漸降低，最終呈正態(tài)分布，二項(xiàng)分布的極限分布為正態(tài)分布。當(dāng)p﹤q且np≥5，或p＞q且nq≥5時(shí)，二項(xiàng)分布就可以當(dāng)做一個(gè)正態(tài)分布的近似形，二項(xiàng)分布的概率可用正態(tài)分布的概率作為近似值。（二）二項(xiàng)分布的平均數(shù)與標(biāo)準(zhǔn)差如果二項(xiàng)分布滿足p＜q，np≥5，（或p＞q且nq≥5）時(shí)，二項(xiàng)分布接近正態(tài)分布。這時(shí)，二項(xiàng)分布的X變量（即成功的次數(shù)）具有如下性質(zhì)：μ=np，，即X變量為μ=np，的正態(tài)分布。X理論實(shí)驗(yàn)次數(shù)f概率次數(shù)f頻率fXfX2010.0009810.00098001100.00977150.0146515152450.04395500.0488310020031200.117191180.11523354106242100.205082040.19922816326452520.246092510.245121255627562100.205082080.203131248748871200.117191240.1210986860768450.04395410.0400432826249100.00977110.01074998911010.0009810.0009810100∑10241024509327995

μ=5σ=1.58s=1.613三、二項(xiàng)分布的應(yīng)用二項(xiàng)分布在心理與教育研究中，主要用于解決含有機(jī)遇性質(zhì)的問題。所謂機(jī)遇問題是指在實(shí)驗(yàn)或調(diào)查中，實(shí)驗(yàn)結(jié)果可能是由于猜測(cè)而造成的?！纠?-6】有10道正誤題，問答題者答對(duì)幾題才能認(rèn)為他是真會(huì)，或者說答對(duì)幾題，才能認(rèn)為不是出于猜測(cè)因素？解：已知猜對(duì)與猜錯(cuò)的概率為p=q=0.5，np=5，此二項(xiàng)分布接近正態(tài)分布，故：根據(jù)正態(tài)分布概率，當(dāng)Z=1.645時(shí)，該點(diǎn)以下包含了全體的95%。如果用原分?jǐn)?shù)表示，則為μ+1.645σ=5+1.645×1.58=7.6=8二項(xiàng)分布函數(shù)計(jì)算結(jié)果答對(duì)8道題及其以上的總概率【例6-7】有10道多重選擇題，每題有5個(gè)答案，其中只有一個(gè)是正確的。問答對(duì)幾道題才能說不是猜測(cè)的結(jié)果？解：此題n=10，p=1/5=0.2，q=0.8，np＜5，故此題不接近正態(tài)分布，不能用正態(tài)分布計(jì)算概率，而應(yīng)直接用二項(xiàng)分布函數(shù)計(jì)算猜對(duì)各題數(shù)的概率：猜對(duì)5題及5題以上的概率為0.03279，不足5%。第四節(jié)抽樣分布區(qū)分三種不同性質(zhì)的分布：總體分布：總體內(nèi)個(gè)體數(shù)值的頻數(shù)分布。樣本分布：樣本內(nèi)個(gè)體數(shù)值的頻數(shù)分布。抽樣分布：某一樣本統(tǒng)計(jì)量的概率分布。抽樣分布：樣本統(tǒng)計(jì)量的分布，是統(tǒng)計(jì)推論的重要依據(jù)。一、正態(tài)分布及漸近正態(tài)分布（一）樣本平均數(shù)的分布1.總體分布為正態(tài)，方差(σ2)已知，樣本平均數(shù)的分布為正態(tài)分布平均數(shù)的分布：從基本隨機(jī)變量為正態(tài)分布的總體中，采用有放回隨機(jī)抽樣方法，每次從這個(gè)總體中抽取大小為n的一個(gè)樣本，計(jì)算出它的平均數(shù)，然后將這些個(gè)體放回總體中，再次取n個(gè)個(gè)體，又可計(jì)算出一個(gè)，……，再將n個(gè)個(gè)體放回去，再抽取n個(gè)個(gè)體，……，這樣如此反復(fù)，可計(jì)算出無限多個(gè)，這無限多個(gè)平均數(shù)的分布，即為樣本平均數(shù)的分布。當(dāng)總體分布為正態(tài)，方差(σ2)已知，樣本平均數(shù)的分布為正態(tài)分布。設(shè)母總體的參數(shù)為μ和σ2，那么，樣本平均數(shù)分布的平均數(shù)與方差（標(biāo)準(zhǔn)差）與母總體的平均數(shù)與方差（或標(biāo)準(zhǔn)差）的關(guān)系：平均數(shù)的標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤某種統(tǒng)計(jì)量在抽樣分布上的標(biāo)準(zhǔn)差，稱為標(biāo)準(zhǔn)誤。標(biāo)準(zhǔn)誤用來衡量抽樣誤差。標(biāo)準(zhǔn)誤越小，表明樣本統(tǒng)計(jì)量與總體參數(shù)的值越接近，樣本對(duì)總體越有代表性，用樣本統(tǒng)計(jì)量推斷總體參數(shù)的可靠度越大。因此，標(biāo)準(zhǔn)誤是統(tǒng)計(jì)推斷可靠性的指標(biāo)。樣本平均數(shù)的平均數(shù)與母總體的平均數(shù)相同，樣本平均數(shù)的標(biāo)準(zhǔn)誤與母總體的標(biāo)準(zhǔn)差成正比，而與樣本容量n成反比。樣本容量越大，標(biāo)準(zhǔn)誤就越小。樣本平均數(shù)的標(biāo)準(zhǔn)分?jǐn)?shù)：2.總體分布非正態(tài)，但σ2已知，這時(shí)當(dāng)樣本足夠大時(shí)（n＞30），其樣本平均數(shù)的分布為漸近正態(tài)分布。（二）方差及標(biāo)準(zhǔn)差的分布依隨機(jī)取樣的原則，自正態(tài)分布的總體中抽取容量為n的樣本，當(dāng)n足夠大時(shí)（n＞30），樣本方差及標(biāo)準(zhǔn)差的分布，漸趨于正態(tài)分布，這時(shí)其分布的平均數(shù)與標(biāo)準(zhǔn)差與母總體的σ2和σ的關(guān)系，可近似地表示如下：二、t分布t分布(t-distribution)是統(tǒng)計(jì)分析中應(yīng)用較多的一種隨機(jī)變量函數(shù)的分布，是格賽特1908年推導(dǎo)出的一種分布，也叫學(xué)生分布(Student’sdistribution)。t分布是一種左右對(duì)稱、峰態(tài)比較高狹，分布形狀隨樣本容量n－1的變化而變化的一簇分布。t分布與σ無關(guān)而與其自由度(n－1)有關(guān)。自由度(degreesoffreedom)：任何變量中可以自由變化的數(shù)目，是t分布密度函數(shù)中的參數(shù)（），它代表t分布中獨(dú)立隨機(jī)變量的數(shù)目，故曰自由度。（一）t分布的特點(diǎn)1.平均值為0。2.以平均值0左右對(duì)稱的分布，左側(cè)t為負(fù)值，右側(cè)t為正值。3.變量取值在﹣∞~∞之間。4.當(dāng)樣本容量趨于∞時(shí)，t分布為正態(tài)分布，方差為1；當(dāng)n－1＞30時(shí)，t分布接近正態(tài)分布，方差大于1，隨n－1的增大而方差漸趨于1；當(dāng)n－1＜30時(shí)，t分布與正態(tài)分布相差較大，隨n－1減少，離散程度（方差）越大，分布圖的中間變低但尾部變高。

（二）t分布表的使用t分布表由三方面的數(shù)值構(gòu)成，即t值、自由度和顯著性水平。雙側(cè)概率通常寫作tα/2，單側(cè)概率寫作tα。使用情況：一種是已知自由度和概率值查t值，另一種是已知自由度和t值查相應(yīng)的概率值。當(dāng)正態(tài)分布的總體方差未知時(shí)，如果以樣本的方差s2作為總體σ2的估計(jì)值，這樣，每取一個(gè)樣本，便可計(jì)算一個(gè)s2和s，當(dāng)樣本容量小于30時(shí)，樣本方差及標(biāo)準(zhǔn)差的分布不是正態(tài)分布，而是偏態(tài)分布，而也是偏態(tài)分布，此時(shí)樣本平均數(shù)的分布為t分布。（三）樣本平均數(shù)的分布1.總體分布為正態(tài)，方差(σ2

)未知時(shí)，樣本平均數(shù)的分布為t分布。2.當(dāng)總體分布為非正態(tài)而其方差(σ2

)又未知時(shí)，若滿足n＞30這一條件，樣本平均數(shù)的分布近似為t分布。三、χ2分布χ2分布是統(tǒng)計(jì)分析中應(yīng)用較多的一種抽樣分布，是刻畫正態(tài)變量二次型的一種重要分布。從一個(gè)服從正態(tài)分布的總體中，每次隨機(jī)抽取隨機(jī)變量X1，X2，…，Xn，分別將其平方，即可得到

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

第六章概率分布

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

第六章概率分布

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔