《社會統(tǒng)計學(xué)》課程第二次作業(yè)參考答案_第1頁
《社會統(tǒng)計學(xué)》課程第二次作業(yè)參考答案_第2頁
《社會統(tǒng)計學(xué)》課程第二次作業(yè)參考答案_第3頁
《社會統(tǒng)計學(xué)》課程第二次作業(yè)參考答案_第4頁
《社會統(tǒng)計學(xué)》課程第二次作業(yè)參考答案_第5頁
已閱讀5頁,還剩10頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

11社會統(tǒng)計學(xué)》課程第二次作業(yè)參考答案第五章置信區(qū)間答:(1)中國人民公安大學(xué):答:(1)中國人民公安大學(xué):=X土10.025S\.'n沁4.32土2.021沁4.32土0.156J505-282003年,在一項對高校擴(kuò)招的態(tài)度調(diào)查中,10所北京市院校對高校擴(kuò)招的態(tài)度數(shù)據(jù)如下表(分?jǐn)?shù)越高態(tài)度越積極):院校名態(tài)度平均值標(biāo)準(zhǔn)差人數(shù)北京外國語學(xué)院3.810.6748中國人民公安大學(xué)4.320.5550中國青年政治學(xué)院4.080.6852北京農(nóng)學(xué)院3.980.6550北京大學(xué)3.580.6450清華大學(xué)3.780.7149北方交通大學(xué)4.260.6650北京航空航天大學(xué)4.120.7442對外經(jīng)濟(jì)貿(mào)易大學(xué)3.880.5748北京醫(yī)學(xué)院4.070.6344求:1)中國人民公安大學(xué)、清華大學(xué)、北京大學(xué)的總體平均態(tài)度分的95%置信區(qū)間2)中國人民公安大學(xué)和北京大學(xué)的總體平均態(tài)度分之差的95%置信區(qū)間;3)清華大學(xué)和北京大學(xué)的總體平均態(tài)度分之差的95%置信區(qū)間。(提示:要先從S求得E(X-X)2)(df=49);依此類推,同樣的方法計算得:清華大學(xué):3.78土0.204;北京大學(xué):3.58土0.182(2)中國人民公安大學(xué)與北京大學(xué)差異:先根據(jù)公式S2=~工2計算E(X-X)2:n-1公安大學(xué):E(X1-X1)2=S]2(n—1)=0.552x49=14.8225北京大學(xué):E(X2-X2)2=S22(n—1)=0.642x49=20.0704因此,聯(lián)合方差為:S2—因此,聯(lián)合方差為:S2—工(X]-X])2+E(X2-X2)2

(n1-1)+(n2-1)14.8225+20.070449+49—0.35605df=49+49=98,查表得t002宇1.98-2)±10Z計+十?(4.32-3.58)±1-980.35605氣+50?0-74±0-236(3)清華大學(xué):工(X1-X1)2=S]2(n—1)=0.712x48=24.1968北京大學(xué):E(X2—X2)2=S22(n—1)=0.642x49=20.0704S2=工(X1-X1)2+工(X2-X2)2=24.1968+2°?°7°4=045636p(n1—1)+(n2—1)48+49df=48+49=97,查表得t0025~1.981111卩]—卩2=(X1一X2)土10025S,1——+—◎(3.78一3.58)土1.98xv'0.45636x寸一+—?0.20土0.269n1n24950注意:本題由于樣本量比較大,關(guān)于t值我們通過查表無法獲得精確值,只能用其他值近似地估計一下,由于每個人取的估計值可能會有所出入,所以可能會有點偏差(但不應(yīng)相差過大),而書上的答案可能是通過軟件去計算的,所以我們的答案可能也不一定和它相同。第六章假設(shè)檢驗6-6從死于汽車碰撞事故的司機(jī)中抽取2000名司機(jī)的隨機(jī)樣本,根據(jù)他們的血液中是否含有酒精以及他們是否對事故負(fù)有責(zé)任,將數(shù)據(jù)整理如下表所示。在整個總體中,血液中含有酒精和不含酒精的司機(jī)之間在對事故負(fù)有責(zé)任方面有差異嗎?為了回答這一問題:1)敘述H°并計算概值;2)計算適當(dāng)?shù)闹眯艆^(qū)間(95%)來說明差異有多大;3)從這一數(shù)據(jù)如何說明“酒精增加了事故的發(fā)生率”。有酒精嗎^■有責(zé)任嗎有無有650150無700500答:問題轉(zhuǎn)化為檢驗假設(shè):是否有酒精對責(zé)任變化率的影響。表:死于汽車碰撞事故中司機(jī)血液中是否含有酒精對事故的責(zé)任影響表(n=2000)有責(zé)任無責(zé)任有責(zé)任比例P.有酒精650(81.25%)150(18.75%)650/800(100%)(n1=800)無酒精700(58.33%)500(41.67%)700/1200(100%)(n2=1200)1.首先,血液有酒精的司機(jī)中有兀注匕例的司機(jī)對事故負(fù)有責(zé)任;而血液中沒有酒精的司機(jī)中有n0比例的司機(jī)對事故負(fù)有責(zé)任?,F(xiàn)在觀測到的樣本中,血液中有酒精的司機(jī)的責(zé)任事故率的比例P1=81.25%,血液中無酒精的司機(jī)的責(zé)任事故率的比例P0=58.33%,a)、虛無假設(shè)H。:在5%的錯誤水平統(tǒng)計上,總體中血液里含有酒精和沒有酒精的司機(jī)在對事故負(fù)有責(zé)任的比例方面不存在統(tǒng)計意義上的差異,即H0:人=n1_n0=0;備擇假設(shè)H1:在5%的錯誤水平統(tǒng)計上,總體中血液里含有酒精和沒有酒精的司機(jī)在對事故負(fù)有責(zé)任的比例方面存在統(tǒng)計意義上的差異,假設(shè)酒精增加了司機(jī)的責(zé)任事故率,00H1:A=n1n0>0;現(xiàn)在,總體比例差值的標(biāo)準(zhǔn)誤差SE為:.p(1-p),p(1-p).'0.8125(1-0.8125)~~0.5833(1-0.5833)SE=11+—inn10““1cCSE=11+—inn108001200=J0.000190429+0.00020255=J0.00039298=0.0198按照虛無假設(shè)H0:有酒精的叫=58.33%計算其成立的概值:估計值-虛無假設(shè)值標(biāo)準(zhǔn)誤差t=標(biāo)準(zhǔn)誤差0.8125-0.5833=0.0198=11.56對于樣本量達(dá)2000的抽樣,使用正態(tài)分布Z分布表,查得:概值=Pr(Z>11.56)<Pr(Z>5.0)=0.000000287已經(jīng)查不到了,可以認(rèn)為:概值=0;b)、由于假定檢驗有酒精的司機(jī)更容易引起事故,故而計算大樣本總體比例下事故責(zé)任比例的單側(cè)置信度為1-5%的置信區(qū)間:兀1-兀1-兀0>(P1-P0)-Z■0.05V■P(1—P)丄卩(1—P)11+00-nn10i'0.8125(1-0.8125)__0.5833(1-0.5833)1200800=(0.8125-0.5833)—1.64、:'1200800=0.2292-1.64*J0.000190429+0.00020255=0.2292-0.0325=19.67%c)、由于H0假設(shè)A=n1-n0=0,而實際上這個數(shù)值落在了置信區(qū)間(0.1967,4外,否定虛無假設(shè),拒絕H0接受H1;d)、結(jié)論:在5%的錯誤水平下,差異在統(tǒng)計上是可以分辨的,酒精增加了事故的發(fā)生率。6-9、1974年,美國蓋洛普公司的一次調(diào)查表明,在750名美國男子的樣本中,有45%抽煙;在另一個相互獨(dú)立的750名女子的樣本中,36%抽煙,1)構(gòu)造男性總體和女性總體中抽煙比例之差的95%單側(cè)置信區(qū)間;2)計算沒有差異這一原假設(shè)的概值;3)在錯誤水平a=0.05下,45%與36%之差在統(tǒng)計上是可以分辨的嗎?(或是顯著的嗎?)即,能拒絕H0嗎?用兩種方式回答,并說明兩種答案是一致的:1)H是否沒有落入95%的置信區(qū)間之內(nèi)?02)對H的概值是否小于0.05?答:(1)令P]=男性樣本抽煙比例,兀1=男性總體抽煙比例;

P2=女性樣本抽煙比例,兀2=女性總體抽煙比例。

男性總體與女性總體抽煙比例之差的95%置信區(qū)間冗1冗1一冗2>(P1-P2)-Z叭空也+型込?n2=(0.45—0.36)—Z0.05:0.45(1-0.45)0.36(1=(0.45—0.36)—Z0.05I750+7500.049(2)%△=冗1-冗2=0(即,男性與女性總體的抽煙比例無顯著差異)H1:^=冗1—冗2=0.45-0.36=0.09-0.025cI出(1-P)P2(1-P2)10.45(1-0.45)0.36(1-0.36)-0.025SE「+^T^=7^+750因為樣本量比較大,所以我們直接查Z分布的表Z=估計值=_0.09=36—SE—0.025—.查表得,Pr(Z>3.6)<0.0002333)在0.05的錯誤水平下,男性和女性總體抽煙比例的差異是統(tǒng)計上可以分辨的。1和2的小問題答案都是“是”。第七章回歸分析7-7、假定一個4家庭的隨機(jī)樣本的年收入和年節(jié)余如下表所示(單位:千元):1)估計總體回歸直線Y=a+PX家庭編號收入X節(jié)余Y12344.87.28.59.51.23.03.53.52)構(gòu)造斜率B的95%置信區(qū)間;3)作圖畫出4個樣本點和擬合的直線,然后盡你所能在圖中表示由2)的置信區(qū)間所給出的可接受的斜率(范圍)。答:表:4個家庭的隨機(jī)樣本的年收入和年節(jié)余(千元)家庭編號收入X節(jié)余Y14.81.2

27.23.038.53.549.53.5X=7.5Y=2.8^X2=12.38,》y2=3.58,^xy=6.36可以知道是簡單線性回歸,于是建立年節(jié)余Y對年收入X的簡單回歸方程:Y=a+可以知道是簡單線性回歸,于是建立年節(jié)余Y對年收入X的簡單回歸方程:Y=a+bX1)、由X預(yù)測Y的回歸方程已經(jīng)列出,現(xiàn)在求其中的參數(shù)a、b:6.3612.38=0.51則a=Y-bX=2.8—0.51*7.5=-1.05圖:4個家庭的隨機(jī)樣本的年收入和年節(jié)余的散點圖即:Y=-1.05+0.51X2)、斜率卩的數(shù)學(xué)期望為b=0.51,標(biāo)準(zhǔn)差為:表:回歸方程的剩余方差S2的計算XYYY-Y(Y-Y)24.81.21.398-0.1980.03927.232.6220.3780.14298.53.53.2850.2150.04629.53.53.795-0.2950.08700.3153S2=-—-4-2=0.1577自由度df=2,t0.025=4.303,又b=0.51,Ex2=12.38,,代入“的置信區(qū)間公式:得:J0.1577B=0.51土4.303V'12.38=0.51土4.303*0.1129=0.51土0.4856即:0.0244VB<0.9956表:斜率“的置信區(qū)間給出的回歸線范圍0V=-1.05+0.^56K*N7=—1?UPLI/T才卞J1,:r=-1.()5+0.024Kfai-i19—1V$$LQ諄1"1T年敕入或十比》〔吒卜〕哦F廿7-11、從某單位隨機(jī)地抽取了相互獨(dú)立的兩個樣本(男、女職工收入),其月收入數(shù)據(jù)如下:男:2300,2500,3000,2800,2600;女:2400,2200,2000,2500,2700用Y表示收入,用啞變量X表示性別:其中對于男性X=1,對于女性X=0。1)畫出Y對X的圖形;2)用眼睛擬合一條Y對X的回歸線;3)計算Y對X的回歸線;與2)中用眼睛擬合的相比,后者的精度如何?4)構(gòu)造一個斜率為95%的置信區(qū)間,用簡單的語言解釋一下它的意義;5)在5%的錯誤水平下,檢驗收入是否與性別無關(guān);6)4)和5)的結(jié)果是否度量了該單位對女性的歧視?答:表:某單位男女職工收入隨機(jī)抽樣調(diào)查表性別X0000011111收入Y2400220020002500270023002500300028002600

表:某單位男女職工收入隨機(jī)抽樣調(diào)查運(yùn)算表XYx=X-Xy=Y-YxyX2YY-Y(Y-Y)202400-0.5-100500.25236040160002200-0.5-3001500.252360-1602560002000-0.5-5002500.252360-36012960002500-0.5000.2523601401960002700-0.5200-1000.252360340115600123000.5-200-1000.252640-340115600125000.5000.252640-14019600130000.55002500.252640360129600128000.53001500.25264016025600126000.5100500.252640-401600X=0.5Y=250000》xy=700為x2=2.5584000S2—10-2=73000圖:收入Y對性別X的圖形7002.5=280,則a=Y-bX圖:收入Y對性別X的圖形7002.5Y=2360+280X4)、B的95%置信區(qū)間如下計算:又b=280,1x2=2.5,,代入B的又b=280,1x2=2.5,,代入B的95%置信區(qū)間公式:得:陸b±仏5B=B=280土2.306<73000=280±2.306*170=280土394即B的95%置信區(qū)間為:(-114,674)該置信區(qū)間來自假設(shè)檢驗:虛無假設(shè)H0:B=0;表明收入Y與性別X之間沒有什么線性聯(lián)系;備擇假設(shè)H1:B豐0;表明收入Y與性別X之間有線性相關(guān);5)、在5%的錯誤水平下,無法拒絕虛無假設(shè),可以認(rèn)為收入與性別無關(guān)6)、這幾個結(jié)果都說明了,不能認(rèn)為該單位在收入方面對女性有歧視。第八章方差分析8-4、1977年,美國的某項調(diào)查從三種受過不同教育類型的婦女中各分別抽取了50位全日制工作的婦女樣本,她們的年收入(單位:千美元)數(shù)據(jù)整理后歸納如下:完成的學(xué)歷年數(shù)收入平均值Xy(x-x)2初中(8年)7.81835高中(12年)9.72442大學(xué)(16年)14.04707答:表:1977年美國某項對不同教育程度婦女收入的調(diào)查結(jié)果(比-n2-n3-50)初中8年(組1)高中12年(組2)大學(xué)16年(組3)X1=7.8X2=9.7X3=14.0S2=1835S2=2442S2=4707123建立虛無假設(shè)H0:=n=“3;表明不同教育程度的婦女收入上沒有顯著差異;備擇假設(shè)H:“祎“2豐“3;表明不同教育程度的婦女收入上存在顯著差異;三組樣本的總平均值:TOC\o"1-5"\h\z1y1X=—yX=三(7.8+9.7+14.0)=10.5c3樣本均值X相對于其總均值X的總方差:S2=丄^y(X—X)2=[[(7.8-10.5)2+(9.7-10.5)2+(14-10.5)2]xc—1211=2[7.29+0.64+12.25]=-*20.18=10.09計算兩組的聯(lián)合方差:

工(X-X)2+工(X-X)2+工(X-X)21122331835+2442+47071478984147=61.123(501835+2442+47071478984147=61.12計算F比值:nS250x10.09504.5F=x===8.2561.1261.12分子自由度df1=3-1=2;分母自由度"2=3*(50-1)=147;查表IV對應(yīng)于自由度2和8的那一列有5個臨界值,這次計算的F=8.25值比臨界值F0.001=6.91還要大。因此,虛無假設(shè)成立的概值應(yīng)該:概值<0.001可以知道,否定虛無假設(shè),三組收入不同,也就是說婦女隨教育程度差異而收入顯著不同方差分析表如下:方差分析表變差來源變差自由度方差F比值概值組間20.18*50=1009210.09*50=504.58.25<0.001組內(nèi)898414761.12總和99931498-9、月收入數(shù)據(jù):男:2500,2550,2050,2300,1900女:2200,2300,1900,2000,1800如果用Y表示收入,啞變量X表示性別(X=l為女性),計算Y對X的回歸方程,并在5%的水平下檢驗收入是否與性別無關(guān)(先求回歸系數(shù)的置信區(qū)間)。答:表:某單位男女職工月收入隨機(jī)抽樣調(diào)查表(單位:兀,性別X=1表女性)性別X0000011111收入Y2500255020502300190022002300190020001800表:收入Y對性別X的回歸圖形y=-22x+2250y=-22x+2250501性別:1二女表:某單位男女職工收入隨機(jī)抽樣調(diào)查運(yùn)算表XYx=X-XXYx=X-X02500-0.502550-0.502050-0.502300-0.501900-0.5122000.5123000.5119000.5120000.5118000.5X=0.5Y=21500y=Y-YxyX2350-1750.25400-2000.25-100500.25150-750.25-2501250.2550250.25150750.25-250-1250.25-150-750.25-350-1750.250Zxy=-55002=2.5Y-Y(Y-Y)22260240576002260290841002260-2104410022604016002260-3601296002040160256002040260676002040-140196002040-4016002040-24057600489000S2—10-2=61125-5502.5=-220-5502.5=-220,貝9a=Y-bX=2150+220*0.5=2260Y=2260-220XB的95%置信區(qū)間如下計算:自由度df=10-2=8,t0.025=2.306又b=-220,1x2=2.5,,代入B的95%置信區(qū)間公式:得:B=b±t得:B=b±t0.025SB=-220±2.306v61125=-220±2.306*156.4=-220±360.6即B的95%置信區(qū)間為:(-580.6,140.6)該置信區(qū)間來自假設(shè)檢驗:虛無假設(shè)H0:B=0;表明收入Y與性別X之間沒有什么線性聯(lián)系;備擇假設(shè)H1:B豐0;表明收入Y與性別X之間有線性相關(guān);

在5%的錯誤水平下,無法拒絕虛無假設(shè),可以認(rèn)為收入與性別無關(guān);第九章相關(guān)分析9-1、10對夫婦的一個隨機(jī)樣本給出了如下的結(jié)婚年齡數(shù)據(jù)結(jié)婚時丈夫的年齡24222620232124252223結(jié)婚時妻子的年齡241825222023192423221)2)3)計算樣本相關(guān)系數(shù)r;求總體相關(guān)系數(shù)P的95%置信區(qū)間;以5%的水平,檢驗“夫妻的結(jié)婚年齡之間沒有什么線性聯(lián)系”這一原假設(shè)。結(jié)婚時丈夫的年齡X242226202321242522結(jié)婚時妻子的年齡Y241825222023192423進(jìn)行主要參數(shù)計算:XYxyxyX2y22424122142218-1-441162625339992022-3009023200-20042123-21-24124191-3-3192524224442223-11-111232200000X=23Y=22Exy=13為x2=30Zy2=48由公式計算樣本相關(guān)系數(shù)r:工xyr氏J,Ix2V答:表:10對夫婦結(jié)婚年齡表232213頁菽=0.3426由公式計算t統(tǒng)計量(n=10,df=10-2=8):rt=—■1-r2n-20.34260.3426===1.0314;1—0.34262O.3322V10-2由n=10,df=8,r=0.3426查P209的總體相關(guān)系數(shù)95%置信區(qū)間圖,得-0.35vp<0.77對總體的相關(guān)系數(shù)p建立虛無假設(shè)H0:p0;由t分布表V查得,df=8時:T0.25=0.706,T0.10=1.397,貝V虛無假設(shè)成立的概值為:0.10<單側(cè)概值<0.250.20<雙側(cè)概值<0.5在5%的統(tǒng)計顯著性水平上,“夫妻的結(jié)婚年齡之間沒有什么線性聯(lián)系”這一假設(shè)成立。第十章卡方檢驗和交互分析10-14、為了研究性別和“最希望看到的有關(guān)奧運(yùn)會的電視節(jié)目類型”之間的關(guān)系,2004年在10城市調(diào)查了1000個樣

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論