參數(shù)估計(jì)假設(shè)檢驗(yàn)_第1頁
參數(shù)估計(jì)假設(shè)檢驗(yàn)_第2頁
參數(shù)估計(jì)假設(shè)檢驗(yàn)_第3頁
參數(shù)估計(jì)假設(shè)檢驗(yàn)_第4頁
參數(shù)估計(jì)假設(shè)檢驗(yàn)_第5頁
已閱讀5頁,還剩98頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

推斷統(tǒng)計(jì)部分

第五章推斷統(tǒng)計(jì)的理論基礎(chǔ)

第六章參數(shù)估計(jì)

第七章假設(shè)檢驗(yàn)第五章推斷統(tǒng)計(jì)的理論基礎(chǔ)5.1概率與概率分布5.2抽樣分布描述統(tǒng)計(jì)學(xué)推斷統(tǒng)計(jì)學(xué)統(tǒng)計(jì)學(xué)概率抽樣分布描述統(tǒng)計(jì)學(xué)是推斷性統(tǒng)計(jì)的基礎(chǔ)推斷統(tǒng)計(jì)

在搜集、整理觀測(cè)樣本的基礎(chǔ)上,對(duì)有關(guān)總體作出推斷,其特點(diǎn)是根據(jù)隨機(jī)性的觀測(cè)樣本數(shù)據(jù)以及問題的條件和假設(shè),對(duì)未知事物作出的以概率形式表述的推斷。

推斷性統(tǒng)計(jì)的基本特征:通過從總體中抽取樣本構(gòu)造適當(dāng)?shù)慕y(tǒng)計(jì)量,由樣本性質(zhì)去推斷關(guān)于總體的性質(zhì)。4.1隨機(jī)事件與概率拋一枚硬幣,觀察其出現(xiàn)正面或反面的情況。投擲一顆骰子,觀察其出現(xiàn)的點(diǎn)數(shù)。從一批產(chǎn)品中隨機(jī)抽出一件,觀察其是正品還是次品。進(jìn)行一場(chǎng)足球比賽,觀察其實(shí)獲勝、失利還是平局。隨機(jī)事件與概率共同的特點(diǎn):可以在相同條件下重復(fù)的進(jìn)行。每次試驗(yàn)的可能結(jié)果可能不止一個(gè),但試驗(yàn)的所有可能結(jié)果在試驗(yàn)之前是確切的知道的。試驗(yàn)結(jié)束之前,不能確定該次試驗(yàn)的確切結(jié)果。隨機(jī)事件與概率概率的古典定義:某一隨機(jī)試驗(yàn)的結(jié)果有限,而且各結(jié)果出現(xiàn)的可能性相等,則某一事件A發(fā)生的概率為該事件所包含的基本事件數(shù)m與樣本空間中所包含的基本事件數(shù)n的比值,記為:P(A)=樣本空間中所包含的基本事件數(shù)事件A所數(shù)包含的基本事件數(shù)=mn

在相同條件下隨機(jī)試驗(yàn)n次,某事件A出現(xiàn)m次(m≤n),則比值m/n稱為事件A發(fā)生的頻率。隨著n的增大,該頻率圍繞某一常數(shù)p上下波動(dòng),且波動(dòng)的幅度逐漸減小,取于穩(wěn)定,這個(gè)頻率的穩(wěn)定值即為該事件的概率。隨機(jī)事件與概率概率的統(tǒng)計(jì)定義(probability)P(A)=p=mn試驗(yàn):在概率語言中,所謂試驗(yàn)是指在一組條件下,對(duì)某事物現(xiàn)象所進(jìn)行的觀察或測(cè)量的過程。而把觀察或試驗(yàn)的結(jié)果則稱為事件。事件:事件是試驗(yàn)中可能出現(xiàn)也可能不出現(xiàn)的結(jié)果,因此也稱為隨機(jī)事件。隨機(jī)事件通常用大寫英文字母A,B,C表示。隨機(jī)事件與概率隨機(jī)事件與概率試驗(yàn)樣本空間Ω={ω}拋一枚硬幣投擲一顆骰子抽出一件產(chǎn)品檢測(cè)一場(chǎng)足球比賽{正面朝上,反面朝上}{1點(diǎn),2點(diǎn),3點(diǎn),4點(diǎn),5點(diǎn),6點(diǎn)}{合格,不合格}{獲勝,失利,平局}試驗(yàn)與樣本空間樣本空間:在一項(xiàng)試驗(yàn)中,可以羅列出試驗(yàn)的所有可能結(jié)果的全體定義。樣本空間是試驗(yàn)中所有可能結(jié)果的集合。樣本點(diǎn):樣本空間中每一個(gè)特定的試驗(yàn)結(jié)果被稱為樣本點(diǎn)。隨機(jī)事件與概率試驗(yàn)隨機(jī)變量X試驗(yàn)結(jié)果隨機(jī)變量的取值xi(x1,x2,…,

xn)檢查50件產(chǎn)品某班級(jí)英語期末考及格率某電話用戶每次通話時(shí)間長(zhǎng)度監(jiān)測(cè)某產(chǎn)品的適用壽命合格品數(shù)及格學(xué)生比例每次通話時(shí)長(zhǎng)產(chǎn)品使用的時(shí)間長(zhǎng)度0,1,2,3,…,500≤X≤100%X>0X≥0隨機(jī)變量(randomvariable)P(Xi)=P(x=Xi)概率函數(shù),X稱為P(x)的隨機(jī)變量隨機(jī)事件與概率隨機(jī)變量(randomvariable)

一次隨機(jī)試驗(yàn)或一次隨機(jī)觀察的數(shù)量結(jié)果或數(shù)值性描述。

X=一個(gè)均勻?qū)ΨQ的骰子被拋擲時(shí)所出現(xiàn)的點(diǎn)數(shù)

Y=從某市居民中隨機(jī)地抽取一人調(diào)查,該被訪者的收入

Z=從某居民區(qū)中隨機(jī)地抽取三人調(diào)查,該樣本中的女性人數(shù)隨機(jī)事件與概率離散型隨機(jī)變量(discreterandomvariable)只能取有限個(gè)或可數(shù)個(gè)值的隨機(jī)變量。連續(xù)型隨機(jī)變量(continuousrandomvariable)可以取一個(gè)或多個(gè)區(qū)間中任何值的隨機(jī)變量。4.2離散型隨機(jī)變量的概率分布X=投擲一個(gè)均勻的骰子所出現(xiàn)的點(diǎn)數(shù)

1、2、3、4、5、6離散型隨機(jī)變量的概率分布例題4-3將以均勻骰子投擲20次、100次的過程。用X表示骰子被投擲落下時(shí)(面朝上)所出現(xiàn)的點(diǎn)數(shù)。作出一下各種情況中X的相對(duì)頻率分布表及分布圖.隨機(jī)數(shù)字表的使用396576454519906964612026363162…737123709065976012113156341919…722047338451674797199840071766…751725691717952178582433457748…3748798874

63520634300131601027…02890816

9485538329955627092443……離散型隨機(jī)變量的概率分布出現(xiàn)的點(diǎn)數(shù)(X)頻數(shù)(f)相對(duì)頻率(f/n)1234564353140.200.150.250.150.050.20n=20離散型隨機(jī)變量的概率分布1/61/61/61/61/61/60.180.170.150.150.200.150.200.150.250.150.050.20123456n=∞n=100n=20相對(duì)頻率點(diǎn)數(shù)X骰子的相對(duì)頻率分布離散型隨機(jī)變量的概率分布離散型隨機(jī)變量的概率分布

概率

隨機(jī)變量X取某個(gè)對(duì)應(yīng)值的可能性(0和1之間)記作Pr(X)直觀意義--

相對(duì)頻率f/n(在統(tǒng)計(jì)意義下)的極限概率分布隨機(jī)變量取其所有可能值或可能值范圍的概率

Pr(X)=1

離散型隨機(jī)變量的概率分布離散型隨機(jī)變量的概率分布離散型隨機(jī)變量的概率分布X0123456合計(jì)P(X)0.020.090.230.320.230.090.021.00離散型隨機(jī)變量的概率分布X=拋擲一枚均勻?qū)ΨQ的硬幣n次,所出現(xiàn)的正面朝上的次數(shù)二項(xiàng)分布二項(xiàng)變量的特點(diǎn):

每一次試驗(yàn)或觀測(cè)只有兩種可能結(jié)果,統(tǒng)稱為“成功”和“失敗”n次重復(fù)的試驗(yàn)或觀測(cè)是相互獨(dú)立的每一次試驗(yàn)或觀測(cè)“成功”的概率

不變Pr(成功)=

,Pr(失敗)=1-

n次重復(fù)的試驗(yàn)或觀測(cè)中,“成功”的次數(shù)為k,其可能取值為0,1,2,…,n離散型隨機(jī)變量的概率分布例題4-8

在一個(gè)有10000名員工的公司中隨機(jī)抽取n=10名員工進(jìn)行調(diào)查,已知該公司有100名項(xiàng)目經(jīng)理或部門主管以上的負(fù)責(zé)人。問抽中的10名員工都不是負(fù)責(zé)人的概率是多少?抽樣過程有放回(獨(dú)立的)

Pr(X=10)=(0.99)10=0.3487抽樣過程無放回

Pr(X=10)=(900/1000)(899/999)(898/998)(897/997)(896/996)(895/995)(894/994)(893/993)(892/992)(891/991)=0.3469離散型隨機(jī)變量的概率分布泊松分布泊松分布是用來描述在一定時(shí)間范圍內(nèi)或在指定的面積或體積內(nèi)某一事件出現(xiàn)的個(gè)數(shù)分布。在某一工廠中每月觀察到的事故的次數(shù)單位時(shí)間內(nèi)到達(dá)某一服務(wù)柜臺(tái)請(qǐng)求服務(wù)的人數(shù)……4.3連續(xù)型隨機(jī)變量的概率分布組限組中值頻數(shù)(f)相對(duì)頻率(f/n)148-154154-160160-166166-172172-178178-184184-190151157163169175181187412446456164.02.06.22.32.28.08.02總計(jì)2001.00200名男子身高的頻數(shù)分布表(cm)連續(xù)型隨機(jī)變量的概率分布男子身高分組數(shù)據(jù)的直方圖連續(xù)型隨機(jī)變量的概率分布對(duì)一個(gè)離散行隨機(jī)變量,可以計(jì)算其某個(gè)特定取值的概率;而對(duì)一個(gè)連續(xù)型隨機(jī)變量,討論其特定取值的概率是沒有也沒有可能的(因?yàn)樗∪魏我粋€(gè)特定值的概率都等于零),必須在某一區(qū)間內(nèi)考慮相應(yīng)的概率問題。連續(xù)型概率分布是用于刻畫連續(xù)型隨機(jī)變量在不同范圍內(nèi)取值的概率大小的,與離散型概率分布中的分布列相對(duì)應(yīng),連續(xù)型概率分布主要是通過概率密度函數(shù)進(jìn)行描述。

連續(xù)型隨機(jī)變量的概率分布相對(duì)頻率相對(duì)頻率組距減半時(shí),高度也減半組距較大時(shí)連續(xù)型隨機(jī)變量的概率分布隨著分?jǐn)?shù)的增多(組距相應(yīng)減小),相對(duì)頻率分別圖的形狀將越來越扁,棒條寬度也越來越窄,但所有棒條的高度之和仍然是1.相對(duì)頻率密度=組距相對(duì)頻率連續(xù)型隨機(jī)變量的概率分布相對(duì)頻率密度相對(duì)頻率密度組距較大時(shí)組距減半時(shí),高度也不變連續(xù)型隨機(jī)變量的概率分布雖然組距變窄,但圖形的形狀沒有太大的變化;雖然棒條變窄,但是所有棒條的面積之和仍然等于1.連續(xù)型隨機(jī)變量的概率分布相對(duì)頻率密度相對(duì)頻率(面積)=相對(duì)頻率密度×組距樣本量逐漸增大組距逐漸減少直方圖逐漸變成一條曲線圖連續(xù)型隨機(jī)變量的概率分布組限組中值頻數(shù)(f)相對(duì)頻率(f/n)148-154154-160160-166166-172172-178178-184184-190151157163169175181187412446456164.02.06.22.32.28.08.02總計(jì)2001.00200名男子身高的頻數(shù)分布表(cm)連續(xù)型隨機(jī)變量的概率分布男子身高分組數(shù)據(jù)的直方圖連續(xù)型隨機(jī)變量的概率分布設(shè)X是一個(gè)連續(xù)型變量,它代表某一區(qū)間或多個(gè)區(qū)間中的任意數(shù)值,它的概率分布通過概率密度函數(shù)來表述,記作f(x)。概率密度函數(shù)只是給出了連續(xù)型隨機(jī)變量某一特定值的函數(shù)值,這一函數(shù)值不是真正意義上的取值概率,連續(xù)型隨機(jī)變量在給定區(qū)間內(nèi)取值的概率對(duì)應(yīng)的是概率密度函數(shù)f(x)曲線(或直線)在該區(qū)間上圍成的面積,這一特征恰恰意味著連續(xù)行隨機(jī)變量在某一點(diǎn)的概率值為零,因?yàn)樗鼘?duì)應(yīng)的面積為零。所以對(duì)任一區(qū)間端點(diǎn)的取舍并不影響該區(qū)間的概率。連續(xù)型隨機(jī)變量的概率分布正態(tài)分布現(xiàn)實(shí)中,幾乎沒有一組數(shù)據(jù)是完全呈正態(tài)分布的實(shí)際生活中,很多數(shù)據(jù)是近似于正態(tài)分布的人類的屬性和能力工業(yè)產(chǎn)品的物理性質(zhì)……連續(xù)型隨機(jī)變量的概率分布正態(tài)分布

最常用的連續(xù)型隨機(jī)變量的概率分布特征對(duì)稱的、單峰的、呈鈴狀的概率分布曲線連續(xù)型隨機(jī)變量的概率分布鐘型對(duì)稱最普遍、常用用均值和標(biāo)準(zhǔn)差可以完整地描述正態(tài)分布連續(xù)型隨機(jī)變量的概率分布數(shù)學(xué)上,完全光滑的正態(tài)曲線是由復(fù)雜的公式給出的特征不同參數(shù)取值的正態(tài)分布構(gòu)成一個(gè)完成的“正態(tài)分布族”正態(tài)分布的均值

可以是實(shí)數(shù)軸上的任意數(shù)值,它決定正態(tài)曲線的具體位置,標(biāo)準(zhǔn)差

相同而均值不同的正態(tài)曲線在坐標(biāo)軸上體現(xiàn)為水平位移。正態(tài)分布的標(biāo)準(zhǔn)差

為大于零的實(shí)數(shù),它決定正態(tài)曲線的“陡峭”或“扁平”程度。

越大,正態(tài)曲線越扁平;

越小,正態(tài)曲線越陡峭。當(dāng)X的取值向橫軸左右兩個(gè)方向無限延伸時(shí),正態(tài)曲線的左右兩個(gè)尾端無限漸近橫軸,但理論上永遠(yuǎn)不會(huì)與之相交。標(biāo)準(zhǔn)正態(tài)分布(Z分布)均值=0標(biāo)準(zhǔn)差=1連續(xù)型隨機(jī)變量的概率分布標(biāo)準(zhǔn)化一般正態(tài)分布轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布(Z分布)的過程連續(xù)型隨機(jī)變量的概率分布(正態(tài)分布)→正態(tài)分布→標(biāo)準(zhǔn)正態(tài)分布正態(tài)分布的性質(zhì)

只要給定了分布的均值

和方差

2(或標(biāo)準(zhǔn)差

),就可以完全確定對(duì)應(yīng)的正態(tài)分布曲線

均值

決定了分布的中心,其位置就是曲線的對(duì)稱中心

標(biāo)準(zhǔn)差

決定了曲線的伸展程度和形狀,其大小等于從均值到均值的左側(cè)或右側(cè)的曲率轉(zhuǎn)換點(diǎn)的距離

正態(tài)分布曲線下的面積的大小,就等于隨機(jī)變量X取對(duì)應(yīng)范圍的值的概率連續(xù)型隨機(jī)變量的概率分布任何正態(tài)分布都滿足68-95-99.7的規(guī)則在任何正態(tài)分布中,如果反復(fù)試驗(yàn)或觀測(cè),則大約有68%的觀測(cè)值落在距均值一個(gè)標(biāo)準(zhǔn)差的范圍內(nèi)

(嚴(yán)格些說是68.3%)95%的觀測(cè)值落在距均值兩個(gè)標(biāo)準(zhǔn)差的范圍內(nèi)

(嚴(yán)格些說是1.96個(gè)標(biāo)準(zhǔn)差)99.7%的觀測(cè)值落在距均值三個(gè)標(biāo)準(zhǔn)差的范圍內(nèi)

(嚴(yán)格些說是2.96個(gè)標(biāo)準(zhǔn)差)連續(xù)型隨機(jī)變量的概率分布68.3%95.4%99.7%連續(xù)型隨機(jī)變量的概率分布68.3%80%95%99%例題4-5

假定已知某市居民平均每天收看電視的時(shí)間長(zhǎng)度X近似地服從均值

=90分鐘、標(biāo)準(zhǔn)差

=30分鐘的正態(tài)分布。求每天收看電視的時(shí)間長(zhǎng)度在以下范圍的比例是多少?

1)超過120分鐘;2)不足60分鐘;3)60~120分鐘。并估計(jì)4)看電視時(shí)間最長(zhǎng)的那5%居民,每天收看電視的時(shí)間不會(huì)少于多少分鐘?5)第97.5百分位數(shù)和第2.5百分位數(shù)上的收聽時(shí)間是多少?

連續(xù)型隨機(jī)變量的概率分布→正態(tài)分布標(biāo)準(zhǔn)化→標(biāo)準(zhǔn)正態(tài)分布4)由Pr(Z

Z0)=5%=0.05,查得Z0

1.64

由Z0=(X0-

)/

X0=

+

Z0=90+30(1.64)=139.25)由Pr(Z

Z0)=1-97.5%=0.025,查得Z0

1.96

由Z0=(X0-

)/

X0=

+

Z0=90+30(1.96)=148.8

由Pr(Z

Z0)=Pr(Z

-Z0)=2.5%=0.025,得Z0

-1.96

由Z0=(X0-

)/

X0=

+

Z0=90+30(-1.96)=31.2解:1)Z=(X-

)/

=(120-90)/30=1.0Pr(X

120)=Pr(Z

1.0)=0.15872)Z=(60-90)/30=-1.0Pr(X

60)=Pr(Z

-1.0)=Pr(Z

1.0)=0.15873)Pr(60

X

120)=Pr(-1.0

Z

1.0)=1-Pr(Z

-1.0)-Pr(Z

1.0)=1-2Pr(Z

1.0)=1-2(0.1587)=0.6826標(biāo)準(zhǔn)正態(tài)分布表抽樣分布SamplingDistribution標(biāo)準(zhǔn)的統(tǒng)計(jì)問題總體的有關(guān)指標(biāo)(參數(shù))是客觀存在的總體未知從總體中抽取一個(gè)樣本用樣本的有關(guān)指標(biāo)(統(tǒng)計(jì)量)來估計(jì)總體的有關(guān)指標(biāo)均值是常用的指標(biāo)之一為此要先研究樣本均值的分布規(guī)律抽樣分布

研究昆明市居民年均家庭收入時(shí),隨機(jī)抽取1000戶進(jìn)行調(diào)查,這1000戶家庭的年平均收入為39000元,以此作為昆明市居民年均家庭收入的依據(jù)??煽繂?00名學(xué)生的身高總體及均值、標(biāo)準(zhǔn)差的計(jì)算總體分布身高X頻次概率PXP(X-μ)2P1511571631691751811871624382461.01.06.24.38.24.06.011.519.4239.1264.2242.0010.861.873.248.648.640.008.648.643.24N=1001.00μ=169.00σ=6.406抽樣分布抽樣模擬從100人的總體中抽取n=4的樣本利用隨機(jī)數(shù)字表抽取抽樣分布隨機(jī)數(shù)字表396576454519906964612026363162…737123709065976012113156341919…722047338451674797199840071766…751725691717952178582433457748…374879887463520634300131601027…028908169485538329955627092443…871815700737794912384813935596…988371701589093959240006411420……利用隨機(jī)數(shù)字表總體分布順序號(hào)碼身高X頻次頻率P1511571631691751811871624382461.01.06.24.38.24.06.010001-0607-3031-6869-9293-9899模擬樣本之一順序號(hào)碼身高x89093959175163169169均值=169抽樣分布模擬樣本之二順序號(hào)碼身高x93053103181157169157均值=166樣本均值的抽樣分布(n=4,100個(gè)樣本)抽樣分布樣本均值的期望值樣本均值的標(biāo)準(zhǔn)差均值概率P均值*P(樣本均值-總體均值)2(樣本均值-總體均值)2*P161163165167169171173175177.01.05.12.19.26.19.12.05.011.618.1519.8031.7343.9432.4920.768.751.776436164041636640.641.801.920.7600.761.921.800.64169樣本均值的標(biāo)準(zhǔn)差SE=3.20抽樣分布利用隨機(jī)數(shù)字表總體分布順序號(hào)碼身高X頻次頻率P1511571631691751811871624382461.01.06.24.38.24.06.010001-0607-3031-6869-9293-9899模擬樣本之一順序號(hào)碼身高x374879887463520634169169175175175169169157169均值≈169.67抽樣分布樣本均值的抽樣分布(n=9,100個(gè)樣本)抽樣分布樣本均值的期望值樣本均值的標(biāo)準(zhǔn)差均值概率P均值*P(樣本均值-總體均值)2(樣本均值-總體均值)2*P163165167169171173175.01.06.24.38.24.06.011.639.9040.0864.2241.0410.381.75361640416360.360.960.9600.960.960.36169樣本均值的標(biāo)準(zhǔn)差SE=2.14抽樣分布SE=的標(biāo)準(zhǔn)誤差=的標(biāo)準(zhǔn)差XX抽樣分布

為了區(qū)分X的標(biāo)準(zhǔn)差和的標(biāo)準(zhǔn)差,的標(biāo)準(zhǔn)差通常稱為的標(biāo)準(zhǔn)誤差,或簡(jiǎn)稱為SE。XXX樣本量=4樣本量=9樣本均值概率(%)概率(%)161116351165126167192416926381711924173126175511771抽樣分布n=4的樣本均值的抽樣分布n=9的樣本均值的抽樣分布抽樣分布

不管總體本身是否服從正態(tài)分布樣本均值的分布都是漸近正態(tài)的抽樣分布樣本均值的抽樣分布抽樣分布的中心就是總體的中心抽樣分布的標(biāo)準(zhǔn)誤差比總體的標(biāo)準(zhǔn)差小,樣本量越大,標(biāo)準(zhǔn)誤差越小對(duì)非正態(tài)總體,樣本量比較大時(shí),樣本均值的抽樣分布也是近似對(duì)稱和正態(tài)的正態(tài)近似定理(中心極限定理)在容量為n的非常簡(jiǎn)單隨機(jī)樣本中,樣本均值以的標(biāo)準(zhǔn)誤差圍繞著總體均值μ波動(dòng)。隨著n的增大,的分布也就圍繞其目標(biāo)μ波動(dòng)得越來越小,也就越來越接近于正態(tài)。抽樣分布(正態(tài)近似定理)

第六章

參數(shù)估計(jì)Parameterestimation

所謂點(diǎn)估計(jì),就是用一個(gè)最適當(dāng)?shù)臉颖窘y(tǒng)計(jì)量來代表總體的參數(shù)。要調(diào)查昆明市民對(duì)昆明實(shí)施道路交通“休克”療法的態(tài)度,從昆明市抽取了一個(gè)100人的隨機(jī)樣本,而計(jì)算出樣本中表示贊成的比例為67%,那么我們可以說,昆明市民中有67%的人支持實(shí)施道路交通“休克”療法來有一年的擁堵?lián)Q取未來的出行暢通。一般來說,進(jìn)行點(diǎn)估計(jì)時(shí),如果樣本越大,且抽樣方法越嚴(yán)謹(jǐn),這種估計(jì)就越可信。但無論如何,抽樣誤差總是難免的,而且點(diǎn)估計(jì)無法得到估計(jì)值的可信程度。

所謂區(qū)間估計(jì),就是用兩個(gè)數(shù)組成的區(qū)間估計(jì)參數(shù)值。

現(xiàn)隨機(jī)地抽取n=25位下馬村居民區(qū)居民,調(diào)查了人均日收聽廣播時(shí)間,這25人的平均日收聽廣播時(shí)間為60分鐘。那么整個(gè)下馬村居民區(qū)的平均日收聽廣播時(shí)間是

54<<66分鐘。置信區(qū)間ConfidenceInterval

由樣本統(tǒng)計(jì)量所構(gòu)造的總體參數(shù)的估計(jì)區(qū)間稱為置信區(qū)間置信區(qū)間置信水平=1-α置信下限點(diǎn)估計(jì)值置信上限

那么整個(gè)下馬村居民區(qū)的平均日收聽廣播時(shí)間是

54<<66分鐘。置信水平

αα/2Zα/290%95%99%0.100.050.010.050.0250.0051.6451.962.58常用置信水平的Zα/2值μ-1.96SE1.96SE95%置信區(qū)間一個(gè)總體參數(shù)的區(qū)間估計(jì)總體均值的區(qū)間估計(jì)總體比例的區(qū)間估計(jì)總體均值μ的95%置信區(qū)間總體均值

的置信區(qū)間95%置信區(qū)間總體均值μ的95%置信區(qū)間置信區(qū)間在波動(dòng)保持不變總體均值

的置信區(qū)間總體均值μ的95%置信區(qū)間P=2.5%例5-1.要估計(jì)某居民區(qū)人均日收聽廣播時(shí)間,已知標(biāo)準(zhǔn)差為

=15分鐘?,F(xiàn)隨機(jī)地抽取n=25位居民,這25人的平均日收聽廣播時(shí)間為60分鐘。求整個(gè)居民區(qū)的平均日收聽廣播時(shí)間的95%置信區(qū)間。

=60±654<<66總體均值

的置信區(qū)間總體均值μ的95%置信區(qū)間保持不變置信區(qū)間在波動(dòng)總體均值

的置信區(qū)間總體均值μ的99%置信區(qū)間P=2.5%例5-3:要估計(jì)某居民區(qū)人均日收聽廣播時(shí)間,已知標(biāo)準(zhǔn)差為

=15分鐘。現(xiàn)隨機(jī)地抽取n=25位居民,這25人的平均日收聽廣播時(shí)間為60分鐘。

求整個(gè)居民區(qū)的平均日收聽廣播時(shí)間的95%,99%置信區(qū)間。

95%置信區(qū)間

=60±5.8854.12<<65.88

99%置信區(qū)間

=60±7.7452.26<<67.74總體均值

的置信區(qū)間P=0.5%

隨著置信度的提高,隨之增大,因此置信區(qū)間變得更寬,即更加含糊不明確。

置信度和精度之間是矛盾的

要在兩者之間作合理的折中??傮w均值

的置信區(qū)間總體均值μ的置信度為1-α的置信區(qū)間總體均值

的置信區(qū)間總體均值

的置信區(qū)間總體均值μ的置信度為1-α的置信區(qū)間當(dāng)σ未知時(shí),總體均值μ的置信區(qū)間總體均值

的置信區(qū)間t分布以n-1為自由度(df)的t分布Normal=t(df=∞)t(df=20)t(df=5)Z

scalet

scale-1.96+1.96-1.96df=∞+1.96

-2.086df=20+2.086-2.571df=5+2.571P=2.5%tvalues總體均值

的置信區(qū)間例5-4從一大工廠中隨機(jī)地抽取4位職工,他們當(dāng)月的獎(jiǎng)金分別為:

360元、400元、240元、300元計(jì)算全廠當(dāng)月平均獎(jiǎng)金μ的95%置信區(qū)間(n=4,df=3,t0.025=3.1824)總體均值

的置信區(qū)間

=(360+400+240+300)/4±t0.025(3)*=325±3.1824*70/2

[213.6<

436.4]總體比例P的置信區(qū)間總體比例P的95%置信區(qū)間總體比例P的99%置信區(qū)間從昆明市抽取了一個(gè)400人的隨機(jī)樣本,而計(jì)算出樣本中表示支持實(shí)施道路交通“休克”療法的比例為67.8%,那么在95%的置信度下,總體比例的置信區(qū)間為:總體比例P的置信區(qū)間

我們有95%的把握說,昆明市民中有63.2%至72.4%的人支持實(shí)施道路交通“休克”療法來用一年的擁堵?lián)Q取未來的出行暢通。0.632<<0.724第二輪小組作業(yè)講述內(nèi)容:第一組:樣本所在總體平均數(shù),與已知總體平均數(shù)的比較(CompareMeans菜單

One-sampleTTest)(第13周)第二組:兩個(gè)樣本平均數(shù)差別的比較,即通常所說的兩組數(shù)據(jù)的T檢驗(yàn)(CompareMeans菜單

Independent-sampleTTest)(第13周)第三組:配對(duì)樣本(數(shù)據(jù))的平均值比較。

(CompareMeans菜單

Paired-sampleTTest)

(第14周)第四組:多組樣本平均數(shù)的比較(CompareMeans菜單

One-WayANOVA)(第14周)第五組:相關(guān)分析(第15周)(Correlate菜單Bivariate過程)第六組:卡方的一致性檢驗(yàn)(第15周)(NonparametricTest菜單Chi-Square命令)第七組:卡方的獨(dú)立性檢驗(yàn)(第16周)(Crosstabs命令的X2

檢驗(yàn))第八組:制定數(shù)據(jù)的綜合分析(包括描述性分析和推斷分析,前七項(xiàng)內(nèi)容中不少于三項(xiàng))(第17周)第二輪小組作業(yè)要求:包括理論內(nèi)容和軟件操作兩個(gè)部分制作講述內(nèi)容的ppt

選擇適合的數(shù)據(jù)資料進(jìn)行軟件操作的展示每小組最多由兩位同學(xué)講授,并且不能與第一輪講授的同學(xué)重復(fù)展示時(shí)間安排:第13周——第17周兩個(gè)總體均值之差μ1—μ2

的置信區(qū)間

(兩個(gè)總體均值的比較)在某一公司相互獨(dú)立地隨機(jī)抽取了男、女員工各5名,他們的月收入(元)如下表:男女員工的收入有差別嗎?是否能說明該公司對(duì)女性有歧視?男員工25002550205023001900女員工22002300190020001800兩個(gè)總體均值之差()的置信區(qū)間兩個(gè)總體均值之差()的置信區(qū)間自由度例題

為了評(píng)價(jià)某個(gè)電視欄目的改版效果,在改版前從一個(gè)居民點(diǎn)中抽取了5位居民,他們對(duì)該欄目的評(píng)分分別為:65、70、85、80、75;改版以后又從另一個(gè)居民點(diǎn)抽取了6位居民,他們對(duì)該欄目的評(píng)分分別為:70、75、80、85、85、85。如果假定兩個(gè)居民點(diǎn)的評(píng)分的方差相同是和合理的,計(jì)算兩個(gè)居民點(diǎn)對(duì)該欄目評(píng)分均值之差的95%置信區(qū)間。兩個(gè)總體均值之差()的置信區(qū)間X(n=5)均值偏差偏差平方偏差平方和改版前居民點(diǎn)1657085807575-10-5105010025100250250X(n=6)均值偏差偏差平方偏差平方和改版后居民點(diǎn)270758085858580-10-50555100250252525200自由度df=(5-1)+(6-1)=9置信度=95%改版后、改版前的節(jié)目評(píng)價(jià)得分的之差在-5分和15分之間無法判斷改版后的評(píng)價(jià)得分是否高于改版前的評(píng)價(jià)得分樣本居民評(píng)分編號(hào)改版前改版后123456657070808580707580858585樣本居民評(píng)分差異編號(hào)改版前改版后D偏差偏差平方12345665707080858070758085858555105050050-5000250250均值=5方差=50/5=10自由度

df=6-1=5看作一個(gè)新的單一樣本兩個(gè)總體均值之差()的置信區(qū)間配對(duì)樣本時(shí),總體均值之差的95%置信區(qū)間樣本居民評(píng)分差異編號(hào)改版前改版后D1234566570708085807075808585855510505均值=5看作一個(gè)新的單一樣本

改版后、改版前的節(jié)目評(píng)價(jià)得分的之差在2分和8分之間改版后的評(píng)價(jià)得分高于改版前的評(píng)價(jià)得分未經(jīng)訓(xùn)練(樣本1)經(jīng)過訓(xùn)練(樣本2)X1偏差偏差平方X2偏差偏差平方130152120143135均值=136-616-1617-1036256256491598132141110130132均值=129312-191-30914436119524例題

為了評(píng)價(jià)一個(gè)減肥健美操訓(xùn)練班的效果,隨機(jī)地抽取了還未參加訓(xùn)練的5名學(xué)員(剛剛報(bào)名)以及完成訓(xùn)練即將畢業(yè)的另外5名學(xué)員,他們的體重如表所示。1)求以下各題的平均體重的95%置信區(qū)間

a未經(jīng)訓(xùn)練時(shí)的;b經(jīng)過訓(xùn)練后的;c訓(xùn)練期間所減少的2)為了更好地評(píng)價(jià)訓(xùn)練的效果,如何改變抽樣設(shè)計(jì)的方案?

=1-27±17原始數(shù)據(jù)(配對(duì)樣本)計(jì)算均值和標(biāo)準(zhǔn)差學(xué)員編號(hào)X1X2D=X1-X2偏差偏差平方123451301521201431351201521111321301009115均值=73-724-209494164SD2=82/4=1-27±6配對(duì)樣本=1-27±17獨(dú)立樣本利用配對(duì)樣本比較差異時(shí),可以得到更精確的置信區(qū)間因?yàn)樵S多外部因素保持了相等(排除了外部因素的影響)配對(duì)樣本配對(duì)樣本:在兩個(gè)樣本中,使用同樣的個(gè)體配對(duì)數(shù)據(jù)的樣本誤差大大減小配對(duì)以后,使得許多外部變量(如個(gè)人背景情況等)保持不變兩個(gè)總體均值之差()的置信區(qū)間兩個(gè)總體方差已知時(shí)總體方差相等,但未知時(shí)

配對(duì)樣本時(shí),總體均值之差的置信區(qū)間參數(shù)估計(jì)第六章假設(shè)檢驗(yàn)

6.1假設(shè)檢驗(yàn)的基本問題6.2利用置信區(qū)間進(jìn)行假設(shè)檢驗(yàn)*6.3利用概率進(jìn)行假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)的基本問題假設(shè)假設(shè)檢驗(yàn)Testofhypothesis假設(shè)檢驗(yàn)的基本問題——假設(shè)問題的提出與表達(dá)假設(shè)(統(tǒng)計(jì)上的)是關(guān)于總體的某個(gè)主張或申明可以通過抽取隨機(jī)樣本進(jìn)行檢驗(yàn)假設(shè)檢驗(yàn)的基本問題——假設(shè)問題的提出與表達(dá)原/零假設(shè)H0(NullHypothesis)統(tǒng)計(jì)上:

假定各個(gè)總體都是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論