




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第六章概率分布第一節(jié)概率的基本概念第二節(jié)正態(tài)分布第三節(jié)二項(xiàng)分布第四節(jié)抽樣分布第一節(jié)概率的基本概念一、什么是概率在心理與教育研究中,大部分現(xiàn)象屬于隨機(jī)現(xiàn)象,隨機(jī)現(xiàn)象又稱隨機(jī)事件。隨機(jī)是指在一定條件下可能出現(xiàn)也可能不出現(xiàn)的,表明隨機(jī)事件出現(xiàn)可能性大小的客觀指標(biāo)就是概率(probability)。概率的定義有兩種,即后驗(yàn)概率和先驗(yàn)概率。(一)后驗(yàn)概率(posteriorprobability)或統(tǒng)計(jì)概率隨機(jī)事件A的頻率當(dāng)n無限增大時,隨機(jī)事件A的頻率會穩(wěn)定在一個常數(shù)P,這個常數(shù)就是隨機(jī)事件A的概率。(二)先驗(yàn)概率(priorprobability)或古典概率古典概率模型要求滿足兩個條件:⑴實(shí)驗(yàn)的所有可能結(jié)果(基本事件)是有限的;⑵每一種可能結(jié)果出現(xiàn)的可能性相等。二、概率的基本性質(zhì)(一)概率的公理系統(tǒng)1.任何一個隨機(jī)事件A的概率都是非負(fù)的。0≤P(A)≤12.不可能事件的概率等于零。3.必然事件的概率等于1。(二)概率的加法定理互不相容事件:在一次實(shí)驗(yàn)或調(diào)查中,若事件A發(fā)生,則事件B就一定不發(fā)生,這樣的兩個事件為互不相容事件。加法定理(additiverule):兩互不相容事件A、B之和的概率,等于這兩個事件概率之和。即(三)概率的乘法定理獨(dú)立事件:一個事件的出現(xiàn)對另一個事件的出現(xiàn)不發(fā)生影響。相關(guān)事件或相依事件:事件A的概率隨事件B是否出現(xiàn)而改變,事件B的概率隨事件A是否出現(xiàn)而改變。乘法定理(productrule):兩個獨(dú)立事件同時出現(xiàn)的概率等于這兩事件概率的乘積?!纠繌?2張撲克牌(去掉大小王牌)中有放回地連續(xù)抽兩張牌,即抽完第一張后將所抽的牌再放回去,混合好后再抽第二張。(1)第一次抽取紅桃K第二次抽取方塊K的概率是多少?(2)第一次抽取紅桃第二次抽取方塊的概率是多少?(3)抽牌兩次皆為紅色的概率是多少?【例6-1】一枚硬幣擲三次,或三枚硬幣各擲一次,問出現(xiàn)兩次或兩次以上H的概率是多少?解:投擲硬幣可能出現(xiàn)八種結(jié)果(HHH、HHT、HTH、THH、TTH、THT、HTT、TTT)。每種結(jié)果可能出現(xiàn)的概率,依概率乘法規(guī)則計(jì)算:各為。設(shè)P(A)代表3次H的概率,P(B)代表“HHT”這種結(jié)果的概率,P(C)代表“HTH”的概率,P(D)代表“THH”的概率。依據(jù)概率加法規(guī)則計(jì)算:三、概率分布類型概率分布(probabilitydistribution):對隨機(jī)變量取值的概率分布情況用數(shù)學(xué)方法(函數(shù))進(jìn)行描述,一般用概率分布函數(shù)進(jìn)行描述。概率分布依不同的標(biāo)準(zhǔn)可以分為不同的類型。(一)離散分布與連續(xù)分布離散分布:離散型隨機(jī)變量的概率分布,即計(jì)數(shù)數(shù)據(jù)的概率分布。常用的離散分布有二項(xiàng)分布(binomidistribution)、泊松分布(Poissondistribution)和超幾何分布(hypergeometricdistribution)等。連續(xù)分布:連續(xù)隨機(jī)變量的概率分布,即測量數(shù)據(jù)的概率分布。常用的連續(xù)分布有正態(tài)分布、負(fù)指數(shù)分布、威布爾分布等。(二)經(jīng)驗(yàn)分布與理論分布依分布函數(shù)的來源,可將概率分布分為經(jīng)驗(yàn)分布與理論分布。經(jīng)驗(yàn)分布(empiricaldistribution):根據(jù)觀察或?qū)嶒?yàn)所獲得的數(shù)據(jù)而編制的次數(shù)分布或相對頻率分布。理論分布(theoreticaldistribution):隨機(jī)變量概率分布的函數(shù)-數(shù)學(xué)模型;按某種數(shù)學(xué)模型計(jì)算出的總體的次數(shù)分布。隨機(jī)變量概率分布的性質(zhì),由它的特征數(shù)來表達(dá)。這些特征數(shù)主要有期望值(理論平均數(shù))和方差。(三)基本隨機(jī)變量分布與抽樣分布依概率分布所描述的數(shù)據(jù)特征,可將概率分布分為基本隨機(jī)變量分布與抽樣分布(samplingdistribution)?;倦S機(jī)變量分布:隨機(jī)變量各種不同取值情況的概率分布,常用的有二項(xiàng)分布、正態(tài)分布。抽樣分布:從同一總體內(nèi)抽取的不同樣本的統(tǒng)計(jì)量的概率分布。樣本統(tǒng)計(jì)量主要有平均數(shù)、兩平均數(shù)之差、方差、標(biāo)準(zhǔn)差、相關(guān)系數(shù)、回歸系數(shù)、百分比率(或概率)等。統(tǒng)計(jì)量是基本隨機(jī)變量的函數(shù),故抽樣分布也稱隨機(jī)變量函數(shù)的分布。基本隨機(jī)變量分布與抽樣分布是應(yīng)用于統(tǒng)計(jì)學(xué)上的理論分布,是統(tǒng)計(jì)推論的重要依據(jù),只有對它們真正了解,才能明確各種統(tǒng)計(jì)方法的應(yīng)用條件及注意問題,并對各種具體方法有較為深刻的理解。第二節(jié)正態(tài)分布正態(tài)分布(normaldistribution):常態(tài)分布、常態(tài)分配,是連續(xù)隨機(jī)變量概率分布的一種,在數(shù)理統(tǒng)計(jì)的理論與實(shí)際應(yīng)用中占有最重要地位的一種理論分布。棣·莫弗、拉普拉斯、高斯一、正態(tài)分布特征(一)正態(tài)分布曲線函數(shù)正態(tài)分布曲線函數(shù)又稱概率密度函數(shù),其一般方程為分布函數(shù)與概率密度函數(shù)分布函數(shù)F(x)=P(X<x),表示隨機(jī)變量X的值小于x的概率。概率密度f(x)是F(x)在x處的關(guān)于x的一階導(dǎo)數(shù),即變化率。如果在某一x附近取非常小的一個鄰域Δx,那么,隨機(jī)變量X落在(x,x+Δx)內(nèi)的概率約為f(x)Δx,即P(x<X<x+Δx)≈f(x)Δx。概率密度f(x)是X落在x處“單位寬度”內(nèi)的概率?!懊芏取币辉~可以由此理解。
(二)正態(tài)分布的特征1.正態(tài)分布的形式是對稱的,其對稱軸是經(jīng)過平均數(shù)點(diǎn)的垂線。2.正態(tài)分布的中央點(diǎn)最高,然后逐漸向兩側(cè)下降,曲線的形式是先向內(nèi)彎,然后向外彎,拐點(diǎn)位于正負(fù)1個標(biāo)準(zhǔn)差處,曲線兩端向靠近基線處無限延伸,但終不能與基線相交。3.正態(tài)曲線下的面積為1,由于它在平均數(shù)處左右對稱,故經(jīng)平均數(shù)點(diǎn)的垂線將正態(tài)曲線下的面積劃分為相等的兩部分,各為0.50。4.正態(tài)分布是一簇分布,隨隨機(jī)變量的平均數(shù)(μ)、標(biāo)準(zhǔn)差(σ)的大小與單位不同而有不同的分布形態(tài)。所有正態(tài)分布都可以通過Z分?jǐn)?shù)公式非常容易地轉(zhuǎn)換成標(biāo)準(zhǔn)正態(tài)分布(standardnormaldistribution)。根據(jù)Z分?jǐn)?shù)的性質(zhì)可知,標(biāo)準(zhǔn)正態(tài)分布的μ=0,σ2=1。標(biāo)準(zhǔn)正態(tài)分布通常寫作N(0,1)正態(tài)分布。標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù):標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)及面積(概率)的計(jì)算公式:5.正態(tài)分布中各差異量數(shù)數(shù)值相互間有固定比率。表6-1正態(tài)分布中各種差異量數(shù)值的固定比率QADsQ10.84530.6745AD1.182910.7979s1.48261.253316.在正態(tài)分布曲線下,標(biāo)準(zhǔn)差與概率(面積)有一定的數(shù)量關(guān)系。二、正態(tài)分布表的編制與使用(一)正態(tài)分布表的編制與結(jié)構(gòu)兩種不同的編制方法(1)從Z=﹣∞開始,表中列出的是某Z分?jǐn)?shù)以下的累積概率;(2)從Z=0開始,計(jì)算從Z=0至某一定值之間的概率。正態(tài)分布表的結(jié)構(gòu)一般包括三欄第一欄:Z分?jǐn)?shù)單位;第二欄:密度函數(shù)或比率數(shù)值(y);第三欄:概率值(p)。(二)正態(tài)分布表的使用1.依據(jù)Z分?jǐn)?shù)求概率p,即已知標(biāo)準(zhǔn)分?jǐn)?shù)求面積。①求某Z分?jǐn)?shù)值與平均數(shù)(Z=0)之間的概率。②求某Z分?jǐn)?shù)以上或以下的概率。③求兩個Z分?jǐn)?shù)之間的概率。2.從概率p求Z分?jǐn)?shù),即從面積求標(biāo)準(zhǔn)分?jǐn)?shù)值。①已知從平均數(shù)開始的概率值求Z值。②已知位于正態(tài)分布兩端的概率值求該概率值分界點(diǎn)的Z值。③若已知正態(tài)曲線下中央部分的概率,求Z分?jǐn)?shù)是多少。3.已知概率p或Z值,求概率密度y,即正態(tài)曲線的高。三、次數(shù)分布是否為正態(tài)分布的檢驗(yàn)方法(一)皮爾遜偏態(tài)量數(shù)法正態(tài)分布:M=Md=Mo正偏態(tài)分布:M﹥Md﹥Mo負(fù)偏態(tài)分布:M﹤Md﹤Mo皮爾遜發(fā)現(xiàn),在偏態(tài)分布(skeweddistribution)中,Md離平均數(shù)較近、而距眾數(shù)較遠(yuǎn)。根據(jù)平均數(shù)與眾數(shù)或中數(shù)的距離,皮爾遜提出了一個偏態(tài)量數(shù)公式,用來描述分布形態(tài):當(dāng)SK=0時,分布對稱;當(dāng)SK>0時,分布屬正偏態(tài);當(dāng)SK<0時,分布屬負(fù)偏態(tài)。(二)峰度、偏度檢驗(yàn)法1.偏度系數(shù)(coefficientofskewness)當(dāng)g1=0時分布是對稱的;當(dāng)g1>0時,分布為正偏態(tài);當(dāng)g1<0時,分布呈負(fù)偏態(tài)。當(dāng)觀測數(shù)據(jù)數(shù)目N>200時,這個偏態(tài)系數(shù)的統(tǒng)計(jì)量g1才較可靠。2.峰度系數(shù)(coefficientofkurtosis)當(dāng)g2=0時,正態(tài)分布的峰度;g2>0時,分布的峰度比正態(tài)分布的峰度低闊;g2<0時,表明分布的峰度比正態(tài)分布的峰度高狹。當(dāng)N>1000時,g2值才比較可靠。(三)累加次數(shù)曲線法因?yàn)闃?biāo)準(zhǔn)正態(tài)分布的形式固定,因此其累加概率與標(biāo)準(zhǔn)差的關(guān)系也固定。根據(jù)這一點(diǎn),可將一般分布的累加概率與標(biāo)準(zhǔn)正態(tài)分布累加概率相比較。具體方法①制作樣本的累加次數(shù)分布表,列出累加比率和觀測值相應(yīng)的標(biāo)準(zhǔn)分?jǐn)?shù)。②制作樣本的累加頻率曲線圖。縱坐標(biāo)為次數(shù)比率0~1.00,橫坐標(biāo)為Z分?jǐn)?shù),一般為﹣3~+3。③在同一坐標(biāo)系中,制作累加正態(tài)分布概率曲線圖。④畫好圖后,從圖上直接比較正態(tài)分布概率曲線與樣本的累加頻率曲線,若兩曲線完全重合,說明某樣本的分布呈正態(tài);若樣本的累加頻率曲線偏離正態(tài)累積曲線較大,則不符合正態(tài)分布。四、正態(tài)分布理論在測驗(yàn)中的應(yīng)用(一)化等級評定為測量數(shù)據(jù)將等級評定轉(zhuǎn)化為測量數(shù)據(jù),首先要考慮被評定的心理量是否為正態(tài)分布。將等級評定轉(zhuǎn)化為測量數(shù)據(jù)的方法是用各等級中點(diǎn)的Z分?jǐn)?shù)代表該等級分?jǐn)?shù)。具體步驟①根據(jù)各等級被評者的數(shù)目求各等級的人數(shù)比率;②求各等級比率值的中間值,作為該等級的中點(diǎn);③求各等級中點(diǎn)以上(或以下)的累加比率;④用累加比率查正態(tài)表求Z值,該Z分?jǐn)?shù)就是各等級代表性的測量值;⑤求被評者所得評定等級的測量數(shù)據(jù)的算術(shù)平均數(shù),即為每個被評定者的綜合評定分?jǐn)?shù)?!纠?-2】表6-2是3位教師對100名學(xué)生的學(xué)習(xí)能力所作等級評定的結(jié)果。表6-3是3名學(xué)生從3位老師那兒獲得的評定等級,試將其轉(zhuǎn)化為Z分?jǐn)?shù)。表6-23名教師對100名學(xué)生的評定結(jié)果
等級評定結(jié)果(人數(shù))教師甲教師乙教師丙A51020B252025C404035D252015E5105總數(shù)100100100表6-3各學(xué)生所獲得的評定等級學(xué)生教師甲教師乙教師丙1BAA2ABA3DCC表6-4化等級評定為Z分?jǐn)?shù)
等級教師甲教師乙教師丙P比率中點(diǎn)以下累加ZP比率中點(diǎn)以下累加ZP比率中點(diǎn)以下累加ZA0.050.9751.960.100.951.650.200.901.28B0.250.8250.940.200.800.840.250.6750.45C0.400.5000.400.5000.350.375-0.32D0.250.175-0.940.200.20-0.840.150.125-1.15E0.050.025-1.960.100.05-1.650.050.025-1.96學(xué)生1的平均成績:(0.94+1.65+1.28)/3=1.29學(xué)生2的平均成績:(1.96+0.84+1.28)/3=1.36學(xué)生3的平均成績:(-0.94+0-0.32)/3=-0.42(二)確定測驗(yàn)題目的難易度原理:假設(shè)一個測驗(yàn)中不同難易題目的分布是正態(tài)的,即一個測驗(yàn)中通過率較大和較小的題目很少,而通過率居中的題目較多。確定題目難度分?jǐn)?shù)的具體步驟①計(jì)算各題目的通過率;②用0.5減去通過率,不計(jì)正負(fù)號,獲得正態(tài)分布表中的概率值(p);③依照p值查正態(tài)表中相應(yīng)的Z值,通過率大于50%的Z值計(jì)為負(fù)值,通過率小于50%的Z值計(jì)為正值;④將查表得到的Z分?jǐn)?shù)加上5便得到從0~10的十進(jìn)制的難度分?jǐn)?shù)值。表6-5難度分?jǐn)?shù)的計(jì)算測驗(yàn)題編號通過率(%)P值ZZ+51990.49-2.3312.6693950.45-1.6453.3555850.35-1.0353.9657800.30-0.844.1609700.20-0.5254.4751050005.00011200.300.845.8401350.451.6456.6452510.492.337.330(三)在能力分組或等級評定時確定人數(shù)①將6個標(biāo)準(zhǔn)差除以分組的或等級的數(shù)目,做到Z分?jǐn)?shù)等距;②查正態(tài)分布表,從Z求p,即各等級或各組在等距的情況下應(yīng)有的比率;③將比率乘以欲分組的人數(shù),便得到各等級或分組該有的人數(shù)。所計(jì)算的各組人數(shù)分布,應(yīng)與總數(shù)相等。有時由于從Z查p有誤差,使結(jié)果不能與總數(shù)相符,這時應(yīng)將居中的那一組做適當(dāng)?shù)脑黾踊驕p少,因?yàn)檫@樣做,對百分比率的影響甚小?!纠?-3】要把100人在某一能力上分成5個等級,各等級應(yīng)該有多少人,才能使等級評定做到等距?表6-6能力分為五組時各組人數(shù)的分布
分組各組界限比率p人數(shù)分布(p×N)A1.8σ以上0.03594B0.6σ~1.8σ0.238424C-0.6σ~0.6σ0.451444D-1.8σ~-0.6σ0.238424E-1.8σ以下0.03594(四)測驗(yàn)分?jǐn)?shù)的正態(tài)化正態(tài)化的步驟當(dāng)原始分?jǐn)?shù)不服從正態(tài)分布時,先將原始分?jǐn)?shù)的頻數(shù)轉(zhuǎn)化為相對累積頻數(shù)(百分等級),將它視為正態(tài)分布的概率;然后,通過查正態(tài)分布表中概率值相對應(yīng)的Z值,將其轉(zhuǎn)換成Z分?jǐn)?shù),達(dá)到正態(tài)化的目的。正態(tài)化是利用改變次數(shù)的方法,將原來偏態(tài)分布中眾數(shù)所偏的一邊拉長,使之成為正態(tài),這是一種非線性轉(zhuǎn)換。正態(tài)化是建立正態(tài)標(biāo)準(zhǔn)分?jǐn)?shù)的關(guān)鍵。原始分?jǐn)?shù)正態(tài)化的前提條件:研究對象的總體事實(shí)上應(yīng)該是正態(tài)分布,否則就會歪曲事實(shí),這是使用各種正態(tài)化標(biāo)準(zhǔn)分?jǐn)?shù)所必須注意的。T分?jǐn)?shù)(Tscores)是從Z分?jǐn)?shù)經(jīng)過轉(zhuǎn)化而來的一種正態(tài)化的標(biāo)準(zhǔn)分?jǐn)?shù),它是McCall(1939)創(chuàng)用的方法。心理與教育測驗(yàn)常用T分?jǐn)?shù)來建立常模。T分?jǐn)?shù)是將標(biāo)準(zhǔn)分?jǐn)?shù)擴(kuò)大10倍,再加上50。T=10Z+50T分?jǐn)?shù)計(jì)算步驟第一步:將原始分?jǐn)?shù)正態(tài)化;第二步:把正態(tài)化的Z值代入T值公式加以直線轉(zhuǎn)換。T分?jǐn)?shù)不僅具備標(biāo)準(zhǔn)分?jǐn)?shù)的所有優(yōu)點(diǎn),而且克服了標(biāo)準(zhǔn)分?jǐn)?shù)較難理解的不足。首先,它沒有負(fù)數(shù)。其次,若出現(xiàn)小數(shù)時可以四舍五入為整數(shù),而誤差不會很大。再次,如果可以從理論上假設(shè)某一測驗(yàn)的分?jǐn)?shù)應(yīng)該是正態(tài)分布,只是由于抽樣誤差等偶然因素導(dǎo)致了原始分?jǐn)?shù)偏態(tài)分布,那么運(yùn)用T分?jǐn)?shù)的方法可迫使其成為正態(tài)?!纠磕逞芯恐须S機(jī)抽取了180名學(xué)生的某一能力測驗(yàn)分?jǐn)?shù),由于這些能力分?jǐn)?shù)不是正態(tài),需要將其正態(tài)化。具體步驟①將原始數(shù)據(jù)整理成次數(shù)分布表;②計(jì)算各分組上限以下的累加次數(shù)cf;③計(jì)算每組中點(diǎn)以下的累加次數(shù),即前一組上限以下累加次數(shù)加上該組次數(shù)的一半;④各組中點(diǎn)以下累加次數(shù)除以總數(shù)求累積比率;⑤將各組中點(diǎn)以下累加比率視為正態(tài)分布的概率,查正態(tài)分布表,將p轉(zhuǎn)化為Z分?jǐn)?shù);⑥將正態(tài)化的Z值直線轉(zhuǎn)換為T分?jǐn)?shù)。表6-7T分?jǐn)?shù)與正態(tài)化的計(jì)算分組組中值f上限以下累加各組中點(diǎn)以下累加次數(shù)累計(jì)百分比Z正態(tài)化T分?jǐn)?shù)T=10Z+50140~142818017697.782.0170135~137917216893.331.5065130~13220163153851.0460125~1272914312971.670.5756120~1222811410055.560.1451115~11716867843.33-0.1748110~11216706234.44-0.4046105~1078545027.78-0.5944100~1029464223.33-0.734395~978373318.33-0.904190~927292614.44-1.063985~876221910.56-1.253880~82616137.22-1.463575~7751084.44-1.703370~725531.67-2.1229N=180s=17.91T分?jǐn)?shù)雖不等距,但T分?jǐn)?shù)更接近總體的情況。轉(zhuǎn)換后的T分?jǐn)?shù)的平均數(shù)為50,標(biāo)準(zhǔn)差為10,平均數(shù)上下各五個標(biāo)準(zhǔn)差,正好包括了T分?jǐn)?shù)從0~100。在使用T分?jǐn)?shù)時,應(yīng)注意與前面所講的Z’=10Z+50的線性變換形式區(qū)別開來。雖然二者都有相同的平均數(shù)和標(biāo)準(zhǔn)差,但T分?jǐn)?shù)是經(jīng)過正態(tài)化的分?jǐn)?shù),而前者是否服從正態(tài)分布還不清楚,它們將以原始分?jǐn)?shù)的分布形態(tài)為轉(zhuǎn)移。T分?jǐn)?shù)可用于本來應(yīng)是正態(tài)分布而實(shí)際呈偏態(tài)分布的各種測驗(yàn)的比較,而前者只能用于分布形態(tài)相同或相近的各種測驗(yàn)的比較。第三節(jié)二項(xiàng)分布二項(xiàng)分布(bionimaldistribution)是一種具有廣泛用途的離散型隨機(jī)變量的概率分布,它是由貝努里創(chuàng)始的,因此又稱為貝努里分布。一、二項(xiàng)試驗(yàn)與二項(xiàng)分布(一)二項(xiàng)試驗(yàn)二項(xiàng)試驗(yàn):貝努里試驗(yàn),必須滿足以下幾個條件:1.任何一次試驗(yàn)恰好有兩個結(jié)果,成功與失敗,或A與。2.共有n次試驗(yàn),且n是預(yù)先給定的任一正整數(shù)。3.每次試驗(yàn)各自獨(dú)立,各次試驗(yàn)之間無相互影響。4.某種結(jié)果出現(xiàn)的概率在任何一次試驗(yàn)中都是固定的。(二)二項(xiàng)分布二項(xiàng)分布:試驗(yàn)僅有兩種不同性質(zhì)結(jié)果的概率分布。也稱兩個對立事件的概率分布。二項(xiàng)分布同二項(xiàng)定理有著密切的關(guān)系:x=0,1,…,n;n為正整數(shù)。二項(xiàng)展開式的要點(diǎn):項(xiàng)數(shù):二項(xiàng)展開式中共有n+1項(xiàng)。方次:p的方次,從n→0為降冪;q的方次從0→n為升冪。每項(xiàng)p與q方次之和等于n。系數(shù):各項(xiàng)系數(shù)是成功事件次數(shù)的組合數(shù)。二項(xiàng)分布的具體定義設(shè)有n次試驗(yàn),各次試驗(yàn)是彼此獨(dú)立的,每次試驗(yàn)?zāi)呈录霈F(xiàn)的概率都是p,某事件不出現(xiàn)的概率都是q(q=1-p),則對于某事件出現(xiàn)X次(0,1,2,…,n)的概率分布為:【例6-4】10個硬幣擲一次,或1個硬幣擲十次。問五次正面向上的概率是多少?五次及五次以上正面向上的概率是多少?
解:(1)根據(jù)題意,n=10,p=q=1/2,X=5
(2)五次及五次以上正面向上的概率二、二項(xiàng)分布的性質(zhì)(一)二項(xiàng)分布是離散型分布,概率直方圖是躍階式。因?yàn)閄為不連續(xù)變量,用概率條圖表示更合適,用直方圖表示只是為了更形象。1.當(dāng)p=q時圖形是對稱的?!纠?-5】已知p=q=1/2,求(p+q)6的值。解:2.當(dāng)p≠q時,直方圖呈偏態(tài),p﹤q與p﹥q的偏斜方向相反。如果n很大,即使p≠q,偏態(tài)逐漸降低,最終呈正態(tài)分布,二項(xiàng)分布的極限分布為正態(tài)分布。當(dāng)p﹤q且np≥5,或p>q且nq≥5時,二項(xiàng)分布就可以當(dāng)做一個正態(tài)分布的近似形,二項(xiàng)分布的概率可用正態(tài)分布的概率作為近似值。(二)二項(xiàng)分布的平均數(shù)與標(biāo)準(zhǔn)差如果二項(xiàng)分布滿足p<q,np≥5,(或p>q且nq≥5)時,二項(xiàng)分布接近正態(tài)分布。這時,二項(xiàng)分布的X變量(即成功的次數(shù))具有如下性質(zhì):μ=np,,即X變量為μ=np,的正態(tài)分布。X理論實(shí)驗(yàn)次數(shù)f概率次數(shù)f頻率fXfX2010.0009810.00098001100.00977150.0146515152450.04395500.0488310020031200.117191180.11523354106242100.205082040.19922816326452520.246092510.245121255627562100.205082080.203131248748871200.117191240.1210986860768450.04395410.0400432826249100.00977110.01074998911010.0009810.0009810100∑10241024509327995
μ=5σ=1.58s=1.613三、二項(xiàng)分布的應(yīng)用二項(xiàng)分布在心理與教育研究中,主要用于解決含有機(jī)遇性質(zhì)的問題。所謂機(jī)遇問題是指在實(shí)驗(yàn)或調(diào)查中,實(shí)驗(yàn)結(jié)果可能是由于猜測而造成的。【例6-6】有10道正誤題,問答題者答對幾題才能認(rèn)為他是真會,或者說答對幾題,才能認(rèn)為不是出于猜測因素?解:已知猜對與猜錯的概率為p=q=0.5,np=5,此二項(xiàng)分布接近正態(tài)分布,故:根據(jù)正態(tài)分布概率,當(dāng)Z=1.645時,該點(diǎn)以下包含了全體的95%。如果用原分?jǐn)?shù)表示,則為μ+1.645σ=5+1.645×1.58=7.6=8二項(xiàng)分布函數(shù)計(jì)算結(jié)果答對8道題及其以上的總概率【例6-7】有10道多重選擇題,每題有5個答案,其中只有一個是正確的。問答對幾道題才能說不是猜測的結(jié)果?解:此題n=10,p=1/5=0.2,q=0.8,np<5,故此題不接近正態(tài)分布,不能用正態(tài)分布計(jì)算概率,而應(yīng)直接用二項(xiàng)分布函數(shù)計(jì)算猜對各題數(shù)的概率:猜對5題及5題以上的概率為0.03279,不足5%。第四節(jié)抽樣分布區(qū)分三種不同性質(zhì)的分布:總體分布:總體內(nèi)個體數(shù)值的頻數(shù)分布。樣本分布:樣本內(nèi)個體數(shù)值的頻數(shù)分布。抽樣分布:某一樣本統(tǒng)計(jì)量的概率分布。抽樣分布:樣本統(tǒng)計(jì)量的分布,是統(tǒng)計(jì)推論的重要依據(jù)。一、正態(tài)分布及漸近正態(tài)分布(一)樣本平均數(shù)的分布1.總體分布為正態(tài),方差(σ2)已知,樣本平均數(shù)的分布為正態(tài)分布平均數(shù)的分布:從基本隨機(jī)變量為正態(tài)分布的總體中,采用有放回隨機(jī)抽樣方法,每次從這個總體中抽取大小為n的一個樣本,計(jì)算出它的平均數(shù),然后將這些個體放回總體中,再次取n個個體,又可計(jì)算出一個,……,再將n個個體放回去,再抽取n個個體,……,這樣如此反復(fù),可計(jì)算出無限多個,這無限多個平均數(shù)的分布,即為樣本平均數(shù)的分布。當(dāng)總體分布為正態(tài),方差(σ2)已知,樣本平均數(shù)的分布為正態(tài)分布。設(shè)母總體的參數(shù)為μ和σ2,那么,樣本平均數(shù)分布的平均數(shù)與方差(標(biāo)準(zhǔn)差)與母總體的平均數(shù)與方差(或標(biāo)準(zhǔn)差)的關(guān)系:平均數(shù)的標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤某種統(tǒng)計(jì)量在抽樣分布上的標(biāo)準(zhǔn)差,稱為標(biāo)準(zhǔn)誤。標(biāo)準(zhǔn)誤用來衡量抽樣誤差。標(biāo)準(zhǔn)誤越小,表明樣本統(tǒng)計(jì)量與總體參數(shù)的值越接近,樣本對總體越有代表性,用樣本統(tǒng)計(jì)量推斷總體參數(shù)的可靠度越大。因此,標(biāo)準(zhǔn)誤是統(tǒng)計(jì)推斷可靠性的指標(biāo)。樣本平均數(shù)的平均數(shù)與母總體的平均數(shù)相同,樣本平均數(shù)的標(biāo)準(zhǔn)誤與母總體的標(biāo)準(zhǔn)差成正比,而與樣本容量n成反比。樣本容量越大,標(biāo)準(zhǔn)誤就越小。樣本平均數(shù)的標(biāo)準(zhǔn)分?jǐn)?shù):2.總體分布非正態(tài),但σ2已知,這時當(dāng)樣本足夠大時(n>30),其樣本平均數(shù)的分布為漸近正態(tài)分布。(二)方差及標(biāo)準(zhǔn)差的分布依隨機(jī)取樣的原則,自正態(tài)分布的總體中抽取容量為n的樣本,當(dāng)n足夠大時(n>30),樣本方差及標(biāo)準(zhǔn)差的分布,漸趨于正態(tài)分布,這時其分布的平均數(shù)與標(biāo)準(zhǔn)差與母總體的σ2和σ的關(guān)系,可近似地表示如下:二、t分布t分布(t-distribution)是統(tǒng)計(jì)分析中應(yīng)用較多的一種隨機(jī)變量函數(shù)的分布,是格賽特1908年推導(dǎo)出的一種分布,也叫學(xué)生分布(Student’sdistribution)。t分布是一種左右對稱、峰態(tài)比較高狹,分布形狀隨樣本容量n-1的變化而變化的一簇分布。t分布與σ無關(guān)而與其自由度(n-1)有關(guān)。自由度(degreesoffreedom):任何變量中可以自由變化的數(shù)目,是t分布密度函數(shù)中的參數(shù)(),它代表t分布中獨(dú)立隨機(jī)變量的數(shù)目,故曰自由度。(一)t分布的特點(diǎn)1.平均值為0。2.以平均值0左右對稱的分布,左側(cè)t為負(fù)值,右側(cè)t為正值。3.變量取值在﹣∞~∞之間。4.當(dāng)樣本容量趨于∞時,t分布為正態(tài)分布,方差為1;當(dāng)n-1>30時,t分布接近正態(tài)分布,方差大于1,隨n-1的增大而方差漸趨于1;當(dāng)n-1<30時,t分布與正態(tài)分布相差較大,隨n-1減少,離散程度(方差)越大,分布圖的中間變低但尾部變高。
(二)t分布表的使用t分布表由三方面的數(shù)值構(gòu)成,即t值、自由度和顯著性水平。雙側(cè)概率通常寫作tα/2,單側(cè)概率寫作tα。使用情況:一種是已知自由度和概率值查t值,另一種是已知自由度和t值查相應(yīng)的概率值。當(dāng)正態(tài)分布的總體方差未知時,如果以樣本的方差s2作為總體σ2的估計(jì)值,這樣,每取一個樣本,便可計(jì)算一個s2和s,當(dāng)樣本容量小于30時,樣本方差及標(biāo)準(zhǔn)差的分布不是正態(tài)分布,而是偏態(tài)分布,而也是偏態(tài)分布,此時樣本平均數(shù)的分布為t分布。(三)樣本平均數(shù)的分布1.總體分布為正態(tài),方差(σ2
)未知時,樣本平均數(shù)的分布為t分布。2.當(dāng)總體分布為非正態(tài)而其方差(σ2
)又未知時,若滿足n>30這一條件,樣本平均數(shù)的分布近似為t分布。三、χ2分布χ2分布是統(tǒng)計(jì)分析中應(yīng)用較多的一種抽樣分布,是刻畫正態(tài)變量二次型的一種重要分布。從一個服從正態(tài)分布的總體中,每次隨機(jī)抽取隨機(jī)變量X1,X2,…,Xn,分別將其平方,即可得到
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 重癥醫(yī)學(xué)輪轉(zhuǎn)護(hù)士培訓(xùn)
- 腰椎間盤突出預(yù)防鍛煉
- 胸椎骨折病人的護(hù)理查房
- 2024內(nèi)蒙古通遼市中考真題生物+答案
- 2025年專用刀具及類似器具項(xiàng)目發(fā)展計(jì)劃
- 腎挫傷休克護(hù)理查房
- 非瓦楞紙及紙板容器企業(yè)ESG實(shí)踐與創(chuàng)新戰(zhàn)略研究報告
- 歡樂碰碰車行業(yè)跨境出海戰(zhàn)略研究報告
- 殘障人三輪車批發(fā)企業(yè)ESG實(shí)踐與創(chuàng)新戰(zhàn)略研究報告
- 山西省2025屆高三下學(xué)期考前適應(yīng)性測試啟航(一模)數(shù)學(xué)試題
- 中華人民共和國學(xué)前教育法
- 辯論英文課件教學(xué)課件
- 2023屆江蘇省南通市高考一模地理試題(解析版)
- 2021年廣東省公務(wù)員錄用考試《行測》題(鄉(xiāng)鎮(zhèn)卷)【原卷版】
- 2020年全國中學(xué)生生物學(xué)競賽聯(lián)賽試題真題(含答案解析)
- 足浴技師與店內(nèi)禁止黃賭毒協(xié)議書范文
- 鐵路專業(yè)基礎(chǔ)知識考試題及答案
- 制定業(yè)務(wù)拓展的具體方案計(jì)劃
- 租電合作合同協(xié)議書范本
- 一例下肢靜脈血栓疑難病例護(hù)理討論
- 鼎和財(cái)險個人人身意外傷害保險(互聯(lián)網(wǎng)專屬)條款
評論
0/150
提交評論