版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第六章概率分布第一節(jié)概率的基本概念第二節(jié)正態(tài)分布第三節(jié)二項(xiàng)分布第四節(jié)抽樣分布第一節(jié)概率的基本概念一、什么是概率在心理與教育研究中,大部分現(xiàn)象屬于隨機(jī)現(xiàn)象,隨機(jī)現(xiàn)象又稱隨機(jī)事件。隨機(jī)是指在一定條件下可能出現(xiàn)也可能不出現(xiàn)的,表明隨機(jī)事件出現(xiàn)可能性大小的客觀指標(biāo)就是概率(probability)。概率的定義有兩種,即后驗(yàn)概率和先驗(yàn)概率。(一)后驗(yàn)概率(posteriorprobability)或統(tǒng)計(jì)概率隨機(jī)事件A的頻率當(dāng)n無(wú)限增大時(shí),隨機(jī)事件A的頻率會(huì)穩(wěn)定在一個(gè)常數(shù)P,這個(gè)常數(shù)就是隨機(jī)事件A的概率。(二)先驗(yàn)概率(priorprobability)或古典概率古典概率模型要求滿足兩個(gè)條件:⑴實(shí)驗(yàn)的所有可能結(jié)果(基本事件)是有限的;⑵每一種可能結(jié)果出現(xiàn)的可能性相等。二、概率的基本性質(zhì)(一)概率的公理系統(tǒng)1.任何一個(gè)隨機(jī)事件A的概率都是非負(fù)的。0≤P(A)≤12.不可能事件的概率等于零。3.必然事件的概率等于1。(二)概率的加法定理互不相容事件:在一次實(shí)驗(yàn)或調(diào)查中,若事件A發(fā)生,則事件B就一定不發(fā)生,這樣的兩個(gè)事件為互不相容事件。加法定理(additiverule):兩互不相容事件A、B之和的概率,等于這兩個(gè)事件概率之和。即(三)概率的乘法定理獨(dú)立事件:一個(gè)事件的出現(xiàn)對(duì)另一個(gè)事件的出現(xiàn)不發(fā)生影響。相關(guān)事件或相依事件:事件A的概率隨事件B是否出現(xiàn)而改變,事件B的概率隨事件A是否出現(xiàn)而改變。乘法定理(productrule):兩個(gè)獨(dú)立事件同時(shí)出現(xiàn)的概率等于這兩事件概率的乘積?!纠繌?2張撲克牌(去掉大小王牌)中有放回地連續(xù)抽兩張牌,即抽完第一張后將所抽的牌再放回去,混合好后再抽第二張。(1)第一次抽取紅桃K第二次抽取方塊K的概率是多少?(2)第一次抽取紅桃第二次抽取方塊的概率是多少?(3)抽牌兩次皆為紅色的概率是多少?【例6-1】一枚硬幣擲三次,或三枚硬幣各擲一次,問(wèn)出現(xiàn)兩次或兩次以上H的概率是多少?解:投擲硬幣可能出現(xiàn)八種結(jié)果(HHH、HHT、HTH、THH、TTH、THT、HTT、TTT)。每種結(jié)果可能出現(xiàn)的概率,依概率乘法規(guī)則計(jì)算:各為。設(shè)P(A)代表3次H的概率,P(B)代表“HHT”這種結(jié)果的概率,P(C)代表“HTH”的概率,P(D)代表“THH”的概率。依據(jù)概率加法規(guī)則計(jì)算:三、概率分布類型概率分布(probabilitydistribution):對(duì)隨機(jī)變量取值的概率分布情況用數(shù)學(xué)方法(函數(shù))進(jìn)行描述,一般用概率分布函數(shù)進(jìn)行描述。概率分布依不同的標(biāo)準(zhǔn)可以分為不同的類型。(一)離散分布與連續(xù)分布離散分布:離散型隨機(jī)變量的概率分布,即計(jì)數(shù)數(shù)據(jù)的概率分布。常用的離散分布有二項(xiàng)分布(binomidistribution)、泊松分布(Poissondistribution)和超幾何分布(hypergeometricdistribution)等。連續(xù)分布:連續(xù)隨機(jī)變量的概率分布,即測(cè)量數(shù)據(jù)的概率分布。常用的連續(xù)分布有正態(tài)分布、負(fù)指數(shù)分布、威布爾分布等。(二)經(jīng)驗(yàn)分布與理論分布依分布函數(shù)的來(lái)源,可將概率分布分為經(jīng)驗(yàn)分布與理論分布。經(jīng)驗(yàn)分布(empiricaldistribution):根據(jù)觀察或?qū)嶒?yàn)所獲得的數(shù)據(jù)而編制的次數(shù)分布或相對(duì)頻率分布。理論分布(theoreticaldistribution):隨機(jī)變量概率分布的函數(shù)-數(shù)學(xué)模型;按某種數(shù)學(xué)模型計(jì)算出的總體的次數(shù)分布。隨機(jī)變量概率分布的性質(zhì),由它的特征數(shù)來(lái)表達(dá)。這些特征數(shù)主要有期望值(理論平均數(shù))和方差。(三)基本隨機(jī)變量分布與抽樣分布依概率分布所描述的數(shù)據(jù)特征,可將概率分布分為基本隨機(jī)變量分布與抽樣分布(samplingdistribution)?;倦S機(jī)變量分布:隨機(jī)變量各種不同取值情況的概率分布,常用的有二項(xiàng)分布、正態(tài)分布。抽樣分布:從同一總體內(nèi)抽取的不同樣本的統(tǒng)計(jì)量的概率分布。樣本統(tǒng)計(jì)量主要有平均數(shù)、兩平均數(shù)之差、方差、標(biāo)準(zhǔn)差、相關(guān)系數(shù)、回歸系數(shù)、百分比率(或概率)等。統(tǒng)計(jì)量是基本隨機(jī)變量的函數(shù),故抽樣分布也稱隨機(jī)變量函數(shù)的分布?;倦S機(jī)變量分布與抽樣分布是應(yīng)用于統(tǒng)計(jì)學(xué)上的理論分布,是統(tǒng)計(jì)推論的重要依據(jù),只有對(duì)它們真正了解,才能明確各種統(tǒng)計(jì)方法的應(yīng)用條件及注意問(wèn)題,并對(duì)各種具體方法有較為深刻的理解。第二節(jié)正態(tài)分布正態(tài)分布(normaldistribution):常態(tài)分布、常態(tài)分配,是連續(xù)隨機(jī)變量概率分布的一種,在數(shù)理統(tǒng)計(jì)的理論與實(shí)際應(yīng)用中占有最重要地位的一種理論分布。棣·莫弗、拉普拉斯、高斯一、正態(tài)分布特征(一)正態(tài)分布曲線函數(shù)正態(tài)分布曲線函數(shù)又稱概率密度函數(shù),其一般方程為分布函數(shù)與概率密度函數(shù)分布函數(shù)F(x)=P(X<x),表示隨機(jī)變量X的值小于x的概率。概率密度f(wàn)(x)是F(x)在x處的關(guān)于x的一階導(dǎo)數(shù),即變化率。如果在某一x附近取非常小的一個(gè)鄰域Δx,那么,隨機(jī)變量X落在(x,x+Δx)內(nèi)的概率約為f(x)Δx,即P(x<X<x+Δx)≈f(x)Δx。概率密度f(wàn)(x)是X落在x處“單位寬度”內(nèi)的概率?!懊芏取币辉~可以由此理解。
(二)正態(tài)分布的特征1.正態(tài)分布的形式是對(duì)稱的,其對(duì)稱軸是經(jīng)過(guò)平均數(shù)點(diǎn)的垂線。2.正態(tài)分布的中央點(diǎn)最高,然后逐漸向兩側(cè)下降,曲線的形式是先向內(nèi)彎,然后向外彎,拐點(diǎn)位于正負(fù)1個(gè)標(biāo)準(zhǔn)差處,曲線兩端向靠近基線處無(wú)限延伸,但終不能與基線相交。3.正態(tài)曲線下的面積為1,由于它在平均數(shù)處左右對(duì)稱,故經(jīng)平均數(shù)點(diǎn)的垂線將正態(tài)曲線下的面積劃分為相等的兩部分,各為0.50。4.正態(tài)分布是一簇分布,隨隨機(jī)變量的平均數(shù)(μ)、標(biāo)準(zhǔn)差(σ)的大小與單位不同而有不同的分布形態(tài)。所有正態(tài)分布都可以通過(guò)Z分?jǐn)?shù)公式非常容易地轉(zhuǎn)換成標(biāo)準(zhǔn)正態(tài)分布(standardnormaldistribution)。根據(jù)Z分?jǐn)?shù)的性質(zhì)可知,標(biāo)準(zhǔn)正態(tài)分布的μ=0,σ2=1。標(biāo)準(zhǔn)正態(tài)分布通常寫作N(0,1)正態(tài)分布。標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù):標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)及面積(概率)的計(jì)算公式:5.正態(tài)分布中各差異量數(shù)數(shù)值相互間有固定比率。表6-1正態(tài)分布中各種差異量數(shù)值的固定比率QADsQ10.84530.6745AD1.182910.7979s1.48261.253316.在正態(tài)分布曲線下,標(biāo)準(zhǔn)差與概率(面積)有一定的數(shù)量關(guān)系。二、正態(tài)分布表的編制與使用(一)正態(tài)分布表的編制與結(jié)構(gòu)兩種不同的編制方法(1)從Z=﹣∞開始,表中列出的是某Z分?jǐn)?shù)以下的累積概率;(2)從Z=0開始,計(jì)算從Z=0至某一定值之間的概率。正態(tài)分布表的結(jié)構(gòu)一般包括三欄第一欄:Z分?jǐn)?shù)單位;第二欄:密度函數(shù)或比率數(shù)值(y);第三欄:概率值(p)。(二)正態(tài)分布表的使用1.依據(jù)Z分?jǐn)?shù)求概率p,即已知標(biāo)準(zhǔn)分?jǐn)?shù)求面積。①求某Z分?jǐn)?shù)值與平均數(shù)(Z=0)之間的概率。②求某Z分?jǐn)?shù)以上或以下的概率。③求兩個(gè)Z分?jǐn)?shù)之間的概率。2.從概率p求Z分?jǐn)?shù),即從面積求標(biāo)準(zhǔn)分?jǐn)?shù)值。①已知從平均數(shù)開始的概率值求Z值。②已知位于正態(tài)分布兩端的概率值求該概率值分界點(diǎn)的Z值。③若已知正態(tài)曲線下中央部分的概率,求Z分?jǐn)?shù)是多少。3.已知概率p或Z值,求概率密度y,即正態(tài)曲線的高。三、次數(shù)分布是否為正態(tài)分布的檢驗(yàn)方法(一)皮爾遜偏態(tài)量數(shù)法正態(tài)分布:M=Md=Mo正偏態(tài)分布:M﹥Md﹥Mo負(fù)偏態(tài)分布:M﹤Md﹤Mo皮爾遜發(fā)現(xiàn),在偏態(tài)分布(skeweddistribution)中,Md離平均數(shù)較近、而距眾數(shù)較遠(yuǎn)。根據(jù)平均數(shù)與眾數(shù)或中數(shù)的距離,皮爾遜提出了一個(gè)偏態(tài)量數(shù)公式,用來(lái)描述分布形態(tài):當(dāng)SK=0時(shí),分布對(duì)稱;當(dāng)SK>0時(shí),分布屬正偏態(tài);當(dāng)SK<0時(shí),分布屬負(fù)偏態(tài)。(二)峰度、偏度檢驗(yàn)法1.偏度系數(shù)(coefficientofskewness)當(dāng)g1=0時(shí)分布是對(duì)稱的;當(dāng)g1>0時(shí),分布為正偏態(tài);當(dāng)g1<0時(shí),分布呈負(fù)偏態(tài)。當(dāng)觀測(cè)數(shù)據(jù)數(shù)目N>200時(shí),這個(gè)偏態(tài)系數(shù)的統(tǒng)計(jì)量g1才較可靠。2.峰度系數(shù)(coefficientofkurtosis)當(dāng)g2=0時(shí),正態(tài)分布的峰度;g2>0時(shí),分布的峰度比正態(tài)分布的峰度低闊;g2<0時(shí),表明分布的峰度比正態(tài)分布的峰度高狹。當(dāng)N>1000時(shí),g2值才比較可靠。(三)累加次數(shù)曲線法因?yàn)闃?biāo)準(zhǔn)正態(tài)分布的形式固定,因此其累加概率與標(biāo)準(zhǔn)差的關(guān)系也固定。根據(jù)這一點(diǎn),可將一般分布的累加概率與標(biāo)準(zhǔn)正態(tài)分布累加概率相比較。具體方法①制作樣本的累加次數(shù)分布表,列出累加比率和觀測(cè)值相應(yīng)的標(biāo)準(zhǔn)分?jǐn)?shù)。②制作樣本的累加頻率曲線圖??v坐標(biāo)為次數(shù)比率0~1.00,橫坐標(biāo)為Z分?jǐn)?shù),一般為﹣3~+3。③在同一坐標(biāo)系中,制作累加正態(tài)分布概率曲線圖。④畫好圖后,從圖上直接比較正態(tài)分布概率曲線與樣本的累加頻率曲線,若兩曲線完全重合,說(shuō)明某樣本的分布呈正態(tài);若樣本的累加頻率曲線偏離正態(tài)累積曲線較大,則不符合正態(tài)分布。四、正態(tài)分布理論在測(cè)驗(yàn)中的應(yīng)用(一)化等級(jí)評(píng)定為測(cè)量數(shù)據(jù)將等級(jí)評(píng)定轉(zhuǎn)化為測(cè)量數(shù)據(jù),首先要考慮被評(píng)定的心理量是否為正態(tài)分布。將等級(jí)評(píng)定轉(zhuǎn)化為測(cè)量數(shù)據(jù)的方法是用各等級(jí)中點(diǎn)的Z分?jǐn)?shù)代表該等級(jí)分?jǐn)?shù)。具體步驟①根據(jù)各等級(jí)被評(píng)者的數(shù)目求各等級(jí)的人數(shù)比率;②求各等級(jí)比率值的中間值,作為該等級(jí)的中點(diǎn);③求各等級(jí)中點(diǎn)以上(或以下)的累加比率;④用累加比率查正態(tài)表求Z值,該Z分?jǐn)?shù)就是各等級(jí)代表性的測(cè)量值;⑤求被評(píng)者所得評(píng)定等級(jí)的測(cè)量數(shù)據(jù)的算術(shù)平均數(shù),即為每個(gè)被評(píng)定者的綜合評(píng)定分?jǐn)?shù)?!纠?-2】表6-2是3位教師對(duì)100名學(xué)生的學(xué)習(xí)能力所作等級(jí)評(píng)定的結(jié)果。表6-3是3名學(xué)生從3位老師那兒獲得的評(píng)定等級(jí),試將其轉(zhuǎn)化為Z分?jǐn)?shù)。表6-23名教師對(duì)100名學(xué)生的評(píng)定結(jié)果
等級(jí)評(píng)定結(jié)果(人數(shù))教師甲教師乙教師丙A51020B252025C404035D252015E5105總數(shù)100100100表6-3各學(xué)生所獲得的評(píng)定等級(jí)學(xué)生教師甲教師乙教師丙1BAA2ABA3DCC表6-4化等級(jí)評(píng)定為Z分?jǐn)?shù)
等級(jí)教師甲教師乙教師丙P比率中點(diǎn)以下累加ZP比率中點(diǎn)以下累加ZP比率中點(diǎn)以下累加ZA0.050.9751.960.100.951.650.200.901.28B0.250.8250.940.200.800.840.250.6750.45C0.400.5000.400.5000.350.375-0.32D0.250.175-0.940.200.20-0.840.150.125-1.15E0.050.025-1.960.100.05-1.650.050.025-1.96學(xué)生1的平均成績(jī):(0.94+1.65+1.28)/3=1.29學(xué)生2的平均成績(jī):(1.96+0.84+1.28)/3=1.36學(xué)生3的平均成績(jī):(-0.94+0-0.32)/3=-0.42(二)確定測(cè)驗(yàn)題目的難易度原理:假設(shè)一個(gè)測(cè)驗(yàn)中不同難易題目的分布是正態(tài)的,即一個(gè)測(cè)驗(yàn)中通過(guò)率較大和較小的題目很少,而通過(guò)率居中的題目較多。確定題目難度分?jǐn)?shù)的具體步驟①計(jì)算各題目的通過(guò)率;②用0.5減去通過(guò)率,不計(jì)正負(fù)號(hào),獲得正態(tài)分布表中的概率值(p);③依照p值查正態(tài)表中相應(yīng)的Z值,通過(guò)率大于50%的Z值計(jì)為負(fù)值,通過(guò)率小于50%的Z值計(jì)為正值;④將查表得到的Z分?jǐn)?shù)加上5便得到從0~10的十進(jìn)制的難度分?jǐn)?shù)值。表6-5難度分?jǐn)?shù)的計(jì)算測(cè)驗(yàn)題編號(hào)通過(guò)率(%)P值ZZ+51990.49-2.3312.6693950.45-1.6453.3555850.35-1.0353.9657800.30-0.844.1609700.20-0.5254.4751050005.00011200.300.845.8401350.451.6456.6452510.492.337.330(三)在能力分組或等級(jí)評(píng)定時(shí)確定人數(shù)①將6個(gè)標(biāo)準(zhǔn)差除以分組的或等級(jí)的數(shù)目,做到Z分?jǐn)?shù)等距;②查正態(tài)分布表,從Z求p,即各等級(jí)或各組在等距的情況下應(yīng)有的比率;③將比率乘以欲分組的人數(shù),便得到各等級(jí)或分組該有的人數(shù)。所計(jì)算的各組人數(shù)分布,應(yīng)與總數(shù)相等。有時(shí)由于從Z查p有誤差,使結(jié)果不能與總數(shù)相符,這時(shí)應(yīng)將居中的那一組做適當(dāng)?shù)脑黾踊驕p少,因?yàn)檫@樣做,對(duì)百分比率的影響甚小?!纠?-3】要把100人在某一能力上分成5個(gè)等級(jí),各等級(jí)應(yīng)該有多少人,才能使等級(jí)評(píng)定做到等距?表6-6能力分為五組時(shí)各組人數(shù)的分布
分組各組界限比率p人數(shù)分布(p×N)A1.8σ以上0.03594B0.6σ~1.8σ0.238424C-0.6σ~0.6σ0.451444D-1.8σ~-0.6σ0.238424E-1.8σ以下0.03594(四)測(cè)驗(yàn)分?jǐn)?shù)的正態(tài)化正態(tài)化的步驟當(dāng)原始分?jǐn)?shù)不服從正態(tài)分布時(shí),先將原始分?jǐn)?shù)的頻數(shù)轉(zhuǎn)化為相對(duì)累積頻數(shù)(百分等級(jí)),將它視為正態(tài)分布的概率;然后,通過(guò)查正態(tài)分布表中概率值相對(duì)應(yīng)的Z值,將其轉(zhuǎn)換成Z分?jǐn)?shù),達(dá)到正態(tài)化的目的。正態(tài)化是利用改變次數(shù)的方法,將原來(lái)偏態(tài)分布中眾數(shù)所偏的一邊拉長(zhǎng),使之成為正態(tài),這是一種非線性轉(zhuǎn)換。正態(tài)化是建立正態(tài)標(biāo)準(zhǔn)分?jǐn)?shù)的關(guān)鍵。原始分?jǐn)?shù)正態(tài)化的前提條件:研究對(duì)象的總體事實(shí)上應(yīng)該是正態(tài)分布,否則就會(huì)歪曲事實(shí),這是使用各種正態(tài)化標(biāo)準(zhǔn)分?jǐn)?shù)所必須注意的。T分?jǐn)?shù)(Tscores)是從Z分?jǐn)?shù)經(jīng)過(guò)轉(zhuǎn)化而來(lái)的一種正態(tài)化的標(biāo)準(zhǔn)分?jǐn)?shù),它是McCall(1939)創(chuàng)用的方法。心理與教育測(cè)驗(yàn)常用T分?jǐn)?shù)來(lái)建立常模。T分?jǐn)?shù)是將標(biāo)準(zhǔn)分?jǐn)?shù)擴(kuò)大10倍,再加上50。T=10Z+50T分?jǐn)?shù)計(jì)算步驟第一步:將原始分?jǐn)?shù)正態(tài)化;第二步:把正態(tài)化的Z值代入T值公式加以直線轉(zhuǎn)換。T分?jǐn)?shù)不僅具備標(biāo)準(zhǔn)分?jǐn)?shù)的所有優(yōu)點(diǎn),而且克服了標(biāo)準(zhǔn)分?jǐn)?shù)較難理解的不足。首先,它沒有負(fù)數(shù)。其次,若出現(xiàn)小數(shù)時(shí)可以四舍五入為整數(shù),而誤差不會(huì)很大。再次,如果可以從理論上假設(shè)某一測(cè)驗(yàn)的分?jǐn)?shù)應(yīng)該是正態(tài)分布,只是由于抽樣誤差等偶然因素導(dǎo)致了原始分?jǐn)?shù)偏態(tài)分布,那么運(yùn)用T分?jǐn)?shù)的方法可迫使其成為正態(tài)?!纠磕逞芯恐须S機(jī)抽取了180名學(xué)生的某一能力測(cè)驗(yàn)分?jǐn)?shù),由于這些能力分?jǐn)?shù)不是正態(tài),需要將其正態(tài)化。具體步驟①將原始數(shù)據(jù)整理成次數(shù)分布表;②計(jì)算各分組上限以下的累加次數(shù)cf;③計(jì)算每組中點(diǎn)以下的累加次數(shù),即前一組上限以下累加次數(shù)加上該組次數(shù)的一半;④各組中點(diǎn)以下累加次數(shù)除以總數(shù)求累積比率;⑤將各組中點(diǎn)以下累加比率視為正態(tài)分布的概率,查正態(tài)分布表,將p轉(zhuǎn)化為Z分?jǐn)?shù);⑥將正態(tài)化的Z值直線轉(zhuǎn)換為T分?jǐn)?shù)。表6-7T分?jǐn)?shù)與正態(tài)化的計(jì)算分組組中值f上限以下累加各組中點(diǎn)以下累加次數(shù)累計(jì)百分比Z正態(tài)化T分?jǐn)?shù)T=10Z+50140~142818017697.782.0170135~137917216893.331.5065130~13220163153851.0460125~1272914312971.670.5756120~1222811410055.560.1451115~11716867843.33-0.1748110~11216706234.44-0.4046105~1078545027.78-0.5944100~1029464223.33-0.734395~978373318.33-0.904190~927292614.44-1.063985~876221910.56-1.253880~82616137.22-1.463575~7751084.44-1.703370~725531.67-2.1229N=180s=17.91T分?jǐn)?shù)雖不等距,但T分?jǐn)?shù)更接近總體的情況。轉(zhuǎn)換后的T分?jǐn)?shù)的平均數(shù)為50,標(biāo)準(zhǔn)差為10,平均數(shù)上下各五個(gè)標(biāo)準(zhǔn)差,正好包括了T分?jǐn)?shù)從0~100。在使用T分?jǐn)?shù)時(shí),應(yīng)注意與前面所講的Z’=10Z+50的線性變換形式區(qū)別開來(lái)。雖然二者都有相同的平均數(shù)和標(biāo)準(zhǔn)差,但T分?jǐn)?shù)是經(jīng)過(guò)正態(tài)化的分?jǐn)?shù),而前者是否服從正態(tài)分布還不清楚,它們將以原始分?jǐn)?shù)的分布形態(tài)為轉(zhuǎn)移。T分?jǐn)?shù)可用于本來(lái)應(yīng)是正態(tài)分布而實(shí)際呈偏態(tài)分布的各種測(cè)驗(yàn)的比較,而前者只能用于分布形態(tài)相同或相近的各種測(cè)驗(yàn)的比較。第三節(jié)二項(xiàng)分布二項(xiàng)分布(bionimaldistribution)是一種具有廣泛用途的離散型隨機(jī)變量的概率分布,它是由貝努里創(chuàng)始的,因此又稱為貝努里分布。一、二項(xiàng)試驗(yàn)與二項(xiàng)分布(一)二項(xiàng)試驗(yàn)二項(xiàng)試驗(yàn):貝努里試驗(yàn),必須滿足以下幾個(gè)條件:1.任何一次試驗(yàn)恰好有兩個(gè)結(jié)果,成功與失敗,或A與。2.共有n次試驗(yàn),且n是預(yù)先給定的任一正整數(shù)。3.每次試驗(yàn)各自獨(dú)立,各次試驗(yàn)之間無(wú)相互影響。4.某種結(jié)果出現(xiàn)的概率在任何一次試驗(yàn)中都是固定的。(二)二項(xiàng)分布二項(xiàng)分布:試驗(yàn)僅有兩種不同性質(zhì)結(jié)果的概率分布。也稱兩個(gè)對(duì)立事件的概率分布。二項(xiàng)分布同二項(xiàng)定理有著密切的關(guān)系:x=0,1,…,n;n為正整數(shù)。二項(xiàng)展開式的要點(diǎn):項(xiàng)數(shù):二項(xiàng)展開式中共有n+1項(xiàng)。方次:p的方次,從n→0為降冪;q的方次從0→n為升冪。每項(xiàng)p與q方次之和等于n。系數(shù):各項(xiàng)系數(shù)是成功事件次數(shù)的組合數(shù)。二項(xiàng)分布的具體定義設(shè)有n次試驗(yàn),各次試驗(yàn)是彼此獨(dú)立的,每次試驗(yàn)?zāi)呈录霈F(xiàn)的概率都是p,某事件不出現(xiàn)的概率都是q(q=1-p),則對(duì)于某事件出現(xiàn)X次(0,1,2,…,n)的概率分布為:【例6-4】10個(gè)硬幣擲一次,或1個(gè)硬幣擲十次。問(wèn)五次正面向上的概率是多少?五次及五次以上正面向上的概率是多少?
解:(1)根據(jù)題意,n=10,p=q=1/2,X=5
(2)五次及五次以上正面向上的概率二、二項(xiàng)分布的性質(zhì)(一)二項(xiàng)分布是離散型分布,概率直方圖是躍階式。因?yàn)閄為不連續(xù)變量,用概率條圖表示更合適,用直方圖表示只是為了更形象。1.當(dāng)p=q時(shí)圖形是對(duì)稱的。【例6-5】已知p=q=1/2,求(p+q)6的值。解:2.當(dāng)p≠q時(shí),直方圖呈偏態(tài),p﹤q與p﹥q的偏斜方向相反。如果n很大,即使p≠q,偏態(tài)逐漸降低,最終呈正態(tài)分布,二項(xiàng)分布的極限分布為正態(tài)分布。當(dāng)p﹤q且np≥5,或p>q且nq≥5時(shí),二項(xiàng)分布就可以當(dāng)做一個(gè)正態(tài)分布的近似形,二項(xiàng)分布的概率可用正態(tài)分布的概率作為近似值。(二)二項(xiàng)分布的平均數(shù)與標(biāo)準(zhǔn)差如果二項(xiàng)分布滿足p<q,np≥5,(或p>q且nq≥5)時(shí),二項(xiàng)分布接近正態(tài)分布。這時(shí),二項(xiàng)分布的X變量(即成功的次數(shù))具有如下性質(zhì):μ=np,,即X變量為μ=np,的正態(tài)分布。X理論實(shí)驗(yàn)次數(shù)f概率次數(shù)f頻率fXfX2010.0009810.00098001100.00977150.0146515152450.04395500.0488310020031200.117191180.11523354106242100.205082040.19922816326452520.246092510.245121255627562100.205082080.203131248748871200.117191240.1210986860768450.04395410.0400432826249100.00977110.01074998911010.0009810.0009810100∑10241024509327995
μ=5σ=1.58s=1.613三、二項(xiàng)分布的應(yīng)用二項(xiàng)分布在心理與教育研究中,主要用于解決含有機(jī)遇性質(zhì)的問(wèn)題。所謂機(jī)遇問(wèn)題是指在實(shí)驗(yàn)或調(diào)查中,實(shí)驗(yàn)結(jié)果可能是由于猜測(cè)而造成的?!纠?-6】有10道正誤題,問(wèn)答題者答對(duì)幾題才能認(rèn)為他是真會(huì),或者說(shuō)答對(duì)幾題,才能認(rèn)為不是出于猜測(cè)因素?解:已知猜對(duì)與猜錯(cuò)的概率為p=q=0.5,np=5,此二項(xiàng)分布接近正態(tài)分布,故:根據(jù)正態(tài)分布概率,當(dāng)Z=1.645時(shí),該點(diǎn)以下包含了全體的95%。如果用原分?jǐn)?shù)表示,則為μ+1.645σ=5+1.645×1.58=7.6=8二項(xiàng)分布函數(shù)計(jì)算結(jié)果答對(duì)8道題及其以上的總概率【例6-7】有10道多重選擇題,每題有5個(gè)答案,其中只有一個(gè)是正確的。問(wèn)答對(duì)幾道題才能說(shuō)不是猜測(cè)的結(jié)果?解:此題n=10,p=1/5=0.2,q=0.8,np<5,故此題不接近正態(tài)分布,不能用正態(tài)分布計(jì)算概率,而應(yīng)直接用二項(xiàng)分布函數(shù)計(jì)算猜對(duì)各題數(shù)的概率:猜對(duì)5題及5題以上的概率為0.03279,不足5%。第四節(jié)抽樣分布區(qū)分三種不同性質(zhì)的分布:總體分布:總體內(nèi)個(gè)體數(shù)值的頻數(shù)分布。樣本分布:樣本內(nèi)個(gè)體數(shù)值的頻數(shù)分布。抽樣分布:某一樣本統(tǒng)計(jì)量的概率分布。抽樣分布:樣本統(tǒng)計(jì)量的分布,是統(tǒng)計(jì)推論的重要依據(jù)。一、正態(tài)分布及漸近正態(tài)分布(一)樣本平均數(shù)的分布1.總體分布為正態(tài),方差(σ2)已知,樣本平均數(shù)的分布為正態(tài)分布平均數(shù)的分布:從基本隨機(jī)變量為正態(tài)分布的總體中,采用有放回隨機(jī)抽樣方法,每次從這個(gè)總體中抽取大小為n的一個(gè)樣本,計(jì)算出它的平均數(shù),然后將這些個(gè)體放回總體中,再次取n個(gè)個(gè)體,又可計(jì)算出一個(gè),……,再將n個(gè)個(gè)體放回去,再抽取n個(gè)個(gè)體,……,這樣如此反復(fù),可計(jì)算出無(wú)限多個(gè),這無(wú)限多個(gè)平均數(shù)的分布,即為樣本平均數(shù)的分布。當(dāng)總體分布為正態(tài),方差(σ2)已知,樣本平均數(shù)的分布為正態(tài)分布。設(shè)母總體的參數(shù)為μ和σ2,那么,樣本平均數(shù)分布的平均數(shù)與方差(標(biāo)準(zhǔn)差)與母總體的平均數(shù)與方差(或標(biāo)準(zhǔn)差)的關(guān)系:平均數(shù)的標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤某種統(tǒng)計(jì)量在抽樣分布上的標(biāo)準(zhǔn)差,稱為標(biāo)準(zhǔn)誤。標(biāo)準(zhǔn)誤用來(lái)衡量抽樣誤差。標(biāo)準(zhǔn)誤越小,表明樣本統(tǒng)計(jì)量與總體參數(shù)的值越接近,樣本對(duì)總體越有代表性,用樣本統(tǒng)計(jì)量推斷總體參數(shù)的可靠度越大。因此,標(biāo)準(zhǔn)誤是統(tǒng)計(jì)推斷可靠性的指標(biāo)。樣本平均數(shù)的平均數(shù)與母總體的平均數(shù)相同,樣本平均數(shù)的標(biāo)準(zhǔn)誤與母總體的標(biāo)準(zhǔn)差成正比,而與樣本容量n成反比。樣本容量越大,標(biāo)準(zhǔn)誤就越小。樣本平均數(shù)的標(biāo)準(zhǔn)分?jǐn)?shù):2.總體分布非正態(tài),但σ2已知,這時(shí)當(dāng)樣本足夠大時(shí)(n>30),其樣本平均數(shù)的分布為漸近正態(tài)分布。(二)方差及標(biāo)準(zhǔn)差的分布依隨機(jī)取樣的原則,自正態(tài)分布的總體中抽取容量為n的樣本,當(dāng)n足夠大時(shí)(n>30),樣本方差及標(biāo)準(zhǔn)差的分布,漸趨于正態(tài)分布,這時(shí)其分布的平均數(shù)與標(biāo)準(zhǔn)差與母總體的σ2和σ的關(guān)系,可近似地表示如下:二、t分布t分布(t-distribution)是統(tǒng)計(jì)分析中應(yīng)用較多的一種隨機(jī)變量函數(shù)的分布,是格賽特1908年推導(dǎo)出的一種分布,也叫學(xué)生分布(Student’sdistribution)。t分布是一種左右對(duì)稱、峰態(tài)比較高狹,分布形狀隨樣本容量n-1的變化而變化的一簇分布。t分布與σ無(wú)關(guān)而與其自由度(n-1)有關(guān)。自由度(degreesoffreedom):任何變量中可以自由變化的數(shù)目,是t分布密度函數(shù)中的參數(shù)(),它代表t分布中獨(dú)立隨機(jī)變量的數(shù)目,故曰自由度。(一)t分布的特點(diǎn)1.平均值為0。2.以平均值0左右對(duì)稱的分布,左側(cè)t為負(fù)值,右側(cè)t為正值。3.變量取值在﹣∞~∞之間。4.當(dāng)樣本容量趨于∞時(shí),t分布為正態(tài)分布,方差為1;當(dāng)n-1>30時(shí),t分布接近正態(tài)分布,方差大于1,隨n-1的增大而方差漸趨于1;當(dāng)n-1<30時(shí),t分布與正態(tài)分布相差較大,隨n-1減少,離散程度(方差)越大,分布圖的中間變低但尾部變高。
(二)t分布表的使用t分布表由三方面的數(shù)值構(gòu)成,即t值、自由度和顯著性水平。雙側(cè)概率通常寫作tα/2,單側(cè)概率寫作tα。使用情況:一種是已知自由度和概率值查t值,另一種是已知自由度和t值查相應(yīng)的概率值。當(dāng)正態(tài)分布的總體方差未知時(shí),如果以樣本的方差s2作為總體σ2的估計(jì)值,這樣,每取一個(gè)樣本,便可計(jì)算一個(gè)s2和s,當(dāng)樣本容量小于30時(shí),樣本方差及標(biāo)準(zhǔn)差的分布不是正態(tài)分布,而是偏態(tài)分布,而也是偏態(tài)分布,此時(shí)樣本平均數(shù)的分布為t分布。(三)樣本平均數(shù)的分布1.總體分布為正態(tài),方差(σ2
)未知時(shí),樣本平均數(shù)的分布為t分布。2.當(dāng)總體分布為非正態(tài)而其方差(σ2
)又未知時(shí),若滿足n>30這一條件,樣本平均數(shù)的分布近似為t分布。三、χ2分布χ2分布是統(tǒng)計(jì)分析中應(yīng)用較多的一種抽樣分布,是刻畫正態(tài)變量二次型的一種重要分布。從一個(gè)服從正態(tài)分布的總體中,每次隨機(jī)抽取隨機(jī)變量X1,X2,…,Xn,分別將其平方,即可得到
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 第13課 五四運(yùn)動(dòng)
- 《企業(yè)及管理》課件
- 項(xiàng)目里程碑成果展
- 秋分習(xí)俗的地理解讀
- 大班月份工作計(jì)劃
- 2023年-2024年項(xiàng)目管理人員安全培訓(xùn)考試題答案標(biāo)準(zhǔn)卷
- 《電流跟電壓》課件
- 隧道隧道內(nèi)環(huán)境監(jiān)測(cè)-洞察分析
- 性別平等與人口質(zhì)量的關(guān)系-洞察分析
- 宇宙微波背景輻射的精細(xì)結(jié)構(gòu)分析-洞察分析
- 2025年1月山西、陜西、寧夏、青海普通高等學(xué)校招生考試適應(yīng)性測(cè)試(八省聯(lián)考)政治
- 《廣東省智慧高速公路建設(shè)指南(試行)》
- 護(hù)理年終個(gè)人工作總結(jié)
- 《臨床顱內(nèi)壓增高》課件
- 2024老師聘用合同范本
- 國(guó)開電大《建筑結(jié)構(gòu)試驗(yàn)》形考任務(wù)1-4參考答案
- 年度分析報(bào)告格式范文
- 浙江省2023年1月學(xué)業(yè)考試物理物理試題(解析版)
- 2024電力建設(shè)工程質(zhì)量問(wèn)題通病防止手冊(cè)
- 【初中地理】世界的聚落+課件-2024-2025學(xué)年七年級(jí)地理上學(xué)期(湘教版2024)
- 辯論英文課件教學(xué)課件
評(píng)論
0/150
提交評(píng)論