統(tǒng)計學(xué)(賈俊平)第五版課后題答案全_第1頁
統(tǒng)計學(xué)(賈俊平)第五版課后題答案全_第2頁
統(tǒng)計學(xué)(賈俊平)第五版課后題答案全_第3頁
統(tǒng)計學(xué)(賈俊平)第五版課后題答案全_第4頁
統(tǒng)計學(xué)(賈俊平)第五版課后題答案全_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、統(tǒng)計學(xué)第五版課后答案第一章 導(dǎo)論一、思考題1.1 統(tǒng)計學(xué)是關(guān)于數(shù)據(jù)的一門學(xué)科,它收集,處理,分析,解釋來自各個領(lǐng)域的數(shù)據(jù)并從中得出結(jié)論。1.2 描述統(tǒng)計;它研究的是數(shù)據(jù)收集,處理,匯總,圖表描述,概括與分析等統(tǒng)計方法。 推斷統(tǒng)計;它是研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計方法。1.3 統(tǒng)計數(shù)據(jù);按所采用的計量尺度不同分; (定性數(shù)據(jù))分類數(shù)據(jù):只能歸于某一類別的非數(shù)字型數(shù)據(jù),它是對事物進行分類的結(jié)果,數(shù)據(jù)表現(xiàn)為類別,用文字來表述; (定性數(shù)據(jù))順序數(shù)據(jù):只能歸于某一有序類別的非數(shù)字型數(shù)據(jù)。它也是有類別的,但這些類別是有序的。 (定量數(shù)據(jù))數(shù)值型數(shù)據(jù):按數(shù)字尺度測量的觀察值,其結(jié)果表

2、現(xiàn)為具體的數(shù)值。 統(tǒng)計數(shù)據(jù);按統(tǒng)計數(shù)據(jù)都收集方法分; 觀測數(shù)據(jù):是通過調(diào)查或觀測而收集到的數(shù)據(jù),這類數(shù)據(jù)是在沒有對事物人為控制的條件下得到的。 實驗數(shù)據(jù):在實驗中控制實驗對象而收集到的數(shù)據(jù)。 統(tǒng)計數(shù)據(jù);按被描述的現(xiàn)象與實踐的關(guān)系分; 截面數(shù)據(jù):在相同或相似的時間點收集到的數(shù)據(jù),也叫靜態(tài)數(shù)據(jù)。 時間序列數(shù)據(jù):按時間順序收集到的,用于描述現(xiàn)象隨時間變化的情況,也叫動態(tài)數(shù)據(jù)。1.4 同上1.5 對一千燈泡進行壽命測試,那么這千個燈泡就是總體,從中抽取一百個進行檢測,這一百個燈泡的集合就是樣本,這一千個燈泡的壽命的平均值和標準差還有合格率等描述特征的數(shù)值就是參數(shù),這一百個燈泡的壽命的平均值和標準差還有

3、合格率等描述特征的數(shù)值就是統(tǒng)計量,變量就是說明現(xiàn)象某種特征的概念,比如說燈泡的壽命。1.6 變量可以分為分類變量,順序變量,數(shù)值型變量。 變量也可以分為隨機變量和非隨機變量、經(jīng)驗變量和理論變量。1.7 離散型變量,只能取有限個值,取值以整數(shù)位斷開,比如“企業(yè)數(shù)” 連續(xù)型變量,取之連續(xù)不斷,不能一一列舉,比如“溫度”。1.8 人口普查,商場的名意調(diào)查等。 1.9 經(jīng)濟分析和政府分析還有物理,生物等等各個領(lǐng)域。二、練習(xí)題1.1 (1)數(shù)值型變量。 (2)分類變量。 (3)離散型變量。 (4)順序變量。 (5)分類變量。1.2 (1)總體是該市所有職工家庭的集合;樣本是抽中的2000個職工

4、家庭的集合。 (2)參數(shù)是該市所有職工家庭的年人均收入;統(tǒng)計量是抽中的2000個職工家庭的年人均收入。1.3 (1)總體是所有IT從業(yè)者的集合。(2)數(shù)值型變量。 (3)分類變量。(4)截面數(shù)據(jù)。1.4 (1)總體是所有在網(wǎng)上購物的消費者的集合。 (2)分類變量。 (3)參數(shù)是所有在網(wǎng)上購物者的月平均花費。(4)參數(shù) (5)推斷統(tǒng)計方法。第二章數(shù)據(jù)的搜集1.什么是二手資料?使用二手資料需要注意些什么?與研究內(nèi)容有關(guān)的原始信息已經(jīng)存在,是由別人調(diào)查和實驗得來的,并會被我們利用的資料稱為“二手資料”。 使用二手資料時需要注意:資料的原始搜集人、搜集資料的目的、搜集資料的途徑、搜集資料的時間,要注意

5、數(shù)據(jù)的定義、含義、計算口徑和計算方法,避免錯用、誤用、濫用。在引用二手資料時,要注明數(shù)據(jù)來源。2.比較概率抽樣和非概率抽樣的特點,舉例說明什么情況下適合采用概率抽樣,什么情況下適合采用非概率抽樣。概率抽樣是指抽樣時按一定概率以隨機原則抽取樣本。每個單位被抽中的概率已知或可以計算,當用樣本對總體目標量進行估計時,要考慮到每個單位樣本被抽中的概率,概率抽樣的技術(shù)含量和成本都比較高。如果調(diào)查的目的在于掌握和研究總體的數(shù)量特征,得到總體參數(shù)的置信區(qū)間,就使用概率抽樣。非概率抽樣是指抽取樣本時不是依據(jù)隨機原則,而是根據(jù)研究目的對數(shù)據(jù)的要求,采用某種方式從總體中抽出部分單位對其實施調(diào)查。非概率抽樣操作簡單

6、、實效快、成本低,而且對于抽樣中的專業(yè)技術(shù)要求不是很高。它適合探索性的研究,調(diào)查結(jié)果用于發(fā)現(xiàn)問題,為更深入的數(shù)量分析提供準備。非概率抽樣也適合市場調(diào)查中的概念測試。3.搜集數(shù)據(jù)的方法主要有自填式、面訪式、電話式,除此之外,還有那些搜集數(shù)據(jù)的方法?實驗式、觀察式等。4. 自填式、面方式、電話式調(diào)查個有什么利弊?自填式優(yōu)點:調(diào)查組織者管理容易,成本低,可以進行較大規(guī)模調(diào)查,對被調(diào)查者可以刻選擇方便時間答卷,減少回答敏感問題的壓力。缺點:返回率低,調(diào)查時間長,在數(shù)據(jù)搜集過程中遇到問題不能及時調(diào)整。面談式優(yōu)點:回答率高,數(shù)據(jù)質(zhì)量高,在數(shù)據(jù)搜集過程中遇到問題可以及時調(diào)整可以充分發(fā)揮調(diào)查員的作用。缺點:成

7、本比較高,對調(diào)查過程的質(zhì)量控制有一定難度。對于敏感問題,被訪者會有壓力。電話式優(yōu)點:速度快,對調(diào)查員比較安全,對訪問過程的控制比較容易,缺點:實施地區(qū)有限,調(diào)查時間不宜過長,問卷要簡單,被訪者不愿回答時,不宜勸服。5.請舉出(或設(shè)計)幾個實驗數(shù)據(jù)的例子。不同飼料對牲畜增重有無影響,新舊技術(shù)的機器對組裝同一產(chǎn)品所需時間的影響。6.你認為應(yīng)當如何控制調(diào)查中的回答誤差?對于理解誤差,要注意表述中的措辭,學(xué)習(xí)一定的心理學(xué)知識。對于記憶誤差,盡量縮短所涉及問題的時間范圍。對于有意識誤差,調(diào)查人員要想法打消被調(diào)查者得思想顧慮,調(diào)查人員要遵守職業(yè)道德,為被調(diào)查者保密,盡量避免敏感問題。7.怎樣減少無回答?請

8、通過一個例子,說明你所考慮到的減少無回答的具體措施。對于隨機誤差,可以通過增加樣本容量來控制。對于系統(tǒng)誤差,做好預(yù)防,在調(diào)查前做好各方面的準備工作,盡量把無回答率降到最低程度。無回答出現(xiàn)后,分析無回答產(chǎn)生的原因,采取補救措施。比如要收回一百份,就要做好一百二十份或一百三十份問卷的準備,當被調(diào)查者不愿意回答時,可以通過一定的方法勸服被訪者,還可以通過饋贈小禮品等的方式提高回收率。第三章 數(shù)據(jù)的圖表搜集一、思考題3.1數(shù)據(jù)的預(yù)處理包括哪些內(nèi)容? 答:審核、篩選、排序等。3.2分類數(shù)據(jù)和順序數(shù)據(jù)的整理和顯示方法各有哪些?答:分類數(shù)據(jù)在整理時候先列出所分的類別,計算各組的頻數(shù)、頻率,得到頻數(shù)分布表,如

9、果是兩個或兩個以上變量可以制作交叉表。對于分類數(shù)據(jù)可以繪制條形圖、帕累托圖、餅圖、環(huán)形圖等。根據(jù)不同的資料或者目的選擇不同的圖。對于順序數(shù)據(jù),可以計算各種的頻數(shù)、頻率,和累計頻數(shù)、累計頻率??筛鶕?jù)需要繪制條形圖、餅圖、環(huán)形圖等。3.3數(shù)值型數(shù)據(jù)的分組方法有哪些?簡述組距分組的步驟。答:單變量值分組和組距分組。其中組距分組:第一步,確定組數(shù),組數(shù)多少由數(shù)據(jù)的多少和特點等決定,一般515組;第二步,確定各組組距,宜取5或10的倍數(shù);第三步,根據(jù)分組整理出頻數(shù)分布表,注意遵循“不重不漏”和“上限不在內(nèi)”的原則。3.4直方圖和條形圖有何區(qū)別?答:1,條形圖使用圖形的長度表示各類別頻數(shù)的多少,其寬度固定

10、,直方圖用面積表示各組頻數(shù),矩形的高度表示每一組的頻數(shù)或頻率,寬度表示組距,高度與寬度都有意義;2直方圖各矩形連續(xù)排列,條形圖分開排列;3條形圖主要展示分類數(shù)據(jù),直方圖主要展示數(shù)值型數(shù)據(jù)。3.5繪制線圖應(yīng)注意問題?答:時間在橫軸,觀測值繪在縱軸。一般是長寬比例10:7的長方形,縱軸下端一般從0開始,數(shù)據(jù)與0距離過大的話用折斷符號折斷。3.6餅圖和環(huán)形圖的不同?答:餅圖只能顯示一個樣本或總體各部分所占比例,環(huán)形圖可以同時繪制多個樣本或總體的數(shù)據(jù)系列,其圖形中間有個“空洞”,每個樣本或總體的數(shù)據(jù)系類為一個環(huán)。3.7莖葉圖比直方圖的優(yōu)勢,他們各自的應(yīng)用場合?答:莖葉圖既能給出數(shù)據(jù)的分布情況,又能給出

11、每一個原始數(shù)據(jù),即保留了原始數(shù)據(jù)的信息。在應(yīng)用方面,直方圖通常適用于大批量數(shù)據(jù),莖葉圖適用于小批量數(shù)據(jù)。3.8鑒別圖標優(yōu)劣的準則?答:詳見P653.9制作統(tǒng)計表應(yīng)注意的問題?答:1,合理安排統(tǒng)計表結(jié)構(gòu);2表頭一般包括表號,總標題和表中數(shù)據(jù)的單位等內(nèi)容;3表中的上下兩條橫線一般用粗線,中間的其他用細線,兩端開口,數(shù)字右對齊,不要有空白格;4在使用統(tǒng)計表時,必要時可在下方加注釋,注明數(shù)據(jù)來源。二、練習(xí)題3.1答: (1)表中數(shù)據(jù)屬于順序數(shù)據(jù)。(2)用Excel制作一張頻數(shù)分布表。 服務(wù)等級家庭數(shù)目(個)好14較好21一般32較差18差15(3)繪制一張條形圖,反映評價等級的分布。 (4)繪制評價等

12、級的帕累托圖。32 某行業(yè)管理局所屬40個企業(yè)2002年的產(chǎn)品銷售收入數(shù)據(jù)如下:1521241291161001039295127104105119114115871031181421351251171081051101071371201361171089788123115119138112146113126要求:(1)根據(jù)上面的數(shù)據(jù)進行適當?shù)姆纸M,編制頻數(shù)分布表,并計算出累積頻數(shù)和累積頻率。1、確定組數(shù):,取k=62、確定組距:組距( 最大值 - 最小值)÷ 組數(shù)=(152-87)÷6=10.83,取103、分組頻數(shù)表銷售收入頻數(shù)頻率%向上累計頻數(shù)向上累計頻率%80 90

13、252590 10037.5512.5100- 110922.51435110 12012302665120 130717.53382.5130 1404103792.5140 15025.03997.5150以上12.540100合計40100.0(2)按規(guī)定,銷售收入在125萬元以上為先進企業(yè),115125萬元為良好企業(yè),105115 萬元為一般企業(yè),105萬元以下為落后企業(yè),按先進企業(yè)、良好企業(yè)、一般企業(yè)、落后企業(yè)進行分組。頻數(shù)頻率%向上累計頻數(shù)向上累計頻率%先進企業(yè)10251025良好企業(yè)12302255一般企業(yè)922.53177.5落后企業(yè)922.540100合計4010033 某百

14、貨公司連續(xù)40天的商品銷售額如下: 單位:萬元41252947383430384340463645373736454333443528463430374426384442363737493942323635要求:根據(jù)上面的數(shù)據(jù)進行適當?shù)姆纸M,編制頻數(shù)分布表,并繪制直方圖。答 :1、確定組數(shù): ,取k=62、確定組距: 組距( 最大值 - 最小值)÷ 組數(shù)=(49-25)÷6=4,取53、分組頻數(shù)表(根據(jù)實際資料,調(diào)整成分5個組)銷售收入(萬元)頻數(shù)頻率%向上累計頻數(shù)向上累計頻率%30以下41041030 - 35615102535 - 401537.52562.540 -

15、45922.5348545以上61540100合計40100.04、直方圖34 利用下面的數(shù)據(jù)構(gòu)建莖葉圖和箱線圖。572929363123472328283551391846182650293321464152282143194220答:莖葉圖 Frequency Stem & Leaf 3.00 1 . 889 5.00 2 . 01133 7.00 2 . 6888999 2.00 3 . 13 3.00 3 . 569 3.00 4 . 123 3.00 4 . 667 3.00 5 . 012 1.00 5 . 7箱線圖3.5答 :頻數(shù)分布表燈泡壽命頻率向上累積頻率(%)660

16、以下22%660-67057%670-680613%680-6901427%690-7002653%700-7101871%710-7201384%720-7301094%730-740397% 740以上3100%合計100直方圖 從直方圖看,數(shù)據(jù)的分布呈左偏分布。3.6答 :頻數(shù)分布表,取k=72、確定組距: 組距( 最大值 - 最小值)÷ 組數(shù)=(61-40)÷7=3,取33、分組頻數(shù)表(根據(jù)實際資料,調(diào)整成分5個組)食品重量(g)頻數(shù)頻率%向上累計頻數(shù)向上累計頻率%43以下334343 - 4699121246 - 492424363649 - 5219195555

17、52 -5524247979 55 - 5814149393 58 以上77100100合計100100.0從直方圖看,數(shù)據(jù)的分布呈雙峰分布。3.7頻數(shù)分布表重量誤差(g)頻數(shù)頻率%向上累計頻數(shù)向上累計頻率%19-2951051029-39714122439-49816204049-591326336659-69918428469-79612489679-892450100合計50100從直方圖看,數(shù)據(jù)的分布呈左偏分布3.8(1)數(shù)值型數(shù)據(jù)(2)頻數(shù)分布表,取k=72、確定組距: 組距( 最大值 - 最小值)÷ 組數(shù)=(9+25)÷7=4.86,取5氣溫()頻數(shù)頻率%向上累

18、計頻數(shù)向上累計頻率%(-25,-20)610.00610.00(-20,-15)813.331423.33(-15,-10)1016.672440.00(-10.-5)1321.673761.67(-5.0)1220.004981.67(0,5)46.675388.33(5,10)711.6760100.00合計60100從直方圖看,數(shù)據(jù)的分布呈左偏分布。3.9 自學(xué)考試人員年齡分布集中在20-24之間,分布圖呈右偏。3.103.11 3.12 (1)復(fù)式條形圖(2)甲班成績分布圖近似正態(tài)分布,分布較均衡;乙班成績分布圖右偏。(3)根據(jù)雷達圖,兩班成績分布不相似。3.133.14 第四章習(xí)題答

19、案4.1數(shù)據(jù)排列:2,4,7,10,10,10,12,12,14,15(1)眾數(shù):10; 中位數(shù):10 平均數(shù):9.6(2)四分位數(shù):Q位置=2.5.所以Q=5.5Q位置=7.5,所以Q=13(3)標準差:4.17(4)峰度0.25,偏度0.694.2 (1)眾數(shù):19;23 中位數(shù):23 平均數(shù):24(2)四分位數(shù):Q位置=6.25.所以Q=19+0.250=19 Q位置=18.75,所以Q=25+20.75=26.5(3)標準差:6.65(4)峰度0.77,偏度1.084.3 (2) 平均數(shù):7,標準差0.71(3)第一種方式的離散系數(shù)=0.28第二種方式的離散系數(shù)=0.10所以,第二種排

20、隊方式等待時間更集中。(4)選擇第二種,因為平均等待的時間短,而且等待時間的集中程度高4.4 (1)平均數(shù):274.1,中位數(shù):272.5(2)Q位置=7.5.所以Q=258+0.253=258.75Q位置=22.5,所以Q=284+70.75=289.25(3)日銷售額的標準差:21.174.5產(chǎn)品名稱單位成本(元)總成本/元產(chǎn)量甲企業(yè)乙企業(yè)甲企業(yè)乙企業(yè)A1521003255140217B203000150015075C30150015005050合計66006255340342甲企業(yè)總平均成本=19.41(元)乙企業(yè)總平均成本=所以甲企業(yè)的總平均成本比乙企業(yè)的高,原因是甲企業(yè)高成本的產(chǎn)品B

21、生產(chǎn)的產(chǎn)量比乙企業(yè)多,所以把總平均成本提高了。4.6計算數(shù)據(jù)如表:按利潤額分組(萬元)組中值企業(yè)數(shù)(個)利潤額2003002501947505930333004003503010500176349400500450421890022860500600550189900273785600以上650117150548639合計-120512001614666利潤總額的平均數(shù)=利潤總額標準差= 峰態(tài)系數(shù)偏態(tài)系數(shù)=4.7(1)不同。1000名的平均身高較高;(2)不同。100名的樣本容量的標準差更大;(3)不同,調(diào)查1000名的樣本容量得到最高和最低者的機會較大。4.8對于不同的總體的差異程度的比較采

22、用標準差系數(shù),計算如下:; (1)女生的體重差異大,因為離散系數(shù)大;(2)以磅為單位,男生平均體重為132.6磅,標準差為11.05磅;女生的平均體重為110.5磅,標準差為11.05磅(3),所以大約有68%的人體重在55kg65kg之間;(4),所以大約有95%的女生體重在40kg60kg之間。4.9; ;由此可以判斷第二項測試更理想。4.10時間周一周二周三周四周五周六周日產(chǎn)量3850367036903720361035903700z值30.60.20.41.82.20可以看出,周一和周六兩天生產(chǎn)線失去了控制。4.11(1)采用離散系數(shù),因為如果比較身高差異,兒童和成年人屬于不同的總體;

23、(2),所以,兒童的身高差異更大。4.12(1)對集中程度和離散程度分別評價,選擇集中趨勢數(shù)值大的,而且離散程度數(shù)值小的方式(2)選擇方法A,因為A方法下,工人的平均組裝數(shù)量為165.6,而且該方法下,工人組裝數(shù)量的離散系數(shù)只有0.012,所以選擇A方法。4.13(1)用離散系數(shù) (2)商業(yè)類 (3)高科技第六章 統(tǒng)計量與抽樣分布1、設(shè)X1,X2,X3,Xn 是從總體X中抽取的容量為n的一個樣本,如果由此樣本構(gòu)造的一個函數(shù)T(X1,X2,X3,Xn),不依賴于任何未知參數(shù),則稱函數(shù)T(X1,X2,X3,Xn)是一個統(tǒng)計量。由樣本構(gòu)建具體的統(tǒng)計量,實際上是對樣本所含的總體信息按某種要求進行加工處

24、理,把分散在樣本中的信息集中到統(tǒng)計量的取值上,不同的統(tǒng)計推斷問題要求構(gòu)造不同的統(tǒng)計量。構(gòu)造統(tǒng)計量的主要目的就是對總體的未知參數(shù)進行推斷,如果統(tǒng)計量中含有總體的未知參數(shù)就沒辦法再對參數(shù)進行統(tǒng)計推斷。2、是統(tǒng)計量,在不是統(tǒng)計量。3、設(shè)X1,X2,X3,Xn 是從總體X中抽取的一個樣本,X(i)稱為第i個次序統(tǒng)計量,它是樣本(X1,X2,X3,Xn)滿足如下條件的函數(shù):每當樣本得到一組觀測值x1 ,x2, xn時,其由小到大的排序x1 x2, xixn中,第i個值xi就作為次數(shù)統(tǒng)計量X(i)的觀測值,而X1,X2,X3,Xn稱為次序統(tǒng)計量。其中X(i)和X(n)分別為最小和最大次序統(tǒng)計量。4、假若一

25、個統(tǒng)計量能把含在樣本中有關(guān)總體的信息一點都不損失地提取出來,這樣的統(tǒng)計量稱充分統(tǒng)計量。5、統(tǒng)計學(xué)上的自由度指當以樣本的統(tǒng)計量來估計總體的參數(shù)時,樣本中獨立或能自由變化的資料的個數(shù)。6、X2分布和正態(tài)分布的關(guān)系:當n時,X2分布的極限分布是正態(tài)分布 T分布和正態(tài)分布的關(guān)系:t分布的密度函數(shù)曲線與標準正態(tài)分布的密度函數(shù)曲線非常相似,但t分布的密度函數(shù)在兩側(cè)的尾部都要比標準正態(tài)的兩側(cè)尾部粗一些,放茶葉比標準正態(tài)分布的方差大。隨著自由度n的增加,t分布的密度函數(shù)越來越接近標準正態(tài)分布的密度函數(shù)。F分布和正態(tài)分布關(guān)系:若Xt(n),則X2F(1,n),并且隨著自由度的增加,X也越來越接近標準正態(tài)分布,若

26、把X看成近似服從標準正態(tài)分布的一個隨機變量,則X2F(1,n)7、在重復(fù)選取容量為n的樣本時,由樣本統(tǒng)計量的所有取值形成的相對頻數(shù)分布為統(tǒng)計量的抽樣分布。 8、中心極限定理:設(shè)從均值為、方差為2(有限)的任意一個總體中抽取樣本量為n的樣本,當n充分大時,樣本均值的抽樣分布近似服從均值為、方差為2/n 的正態(tài)分布。二、練習(xí)1、由這臺機器灌裝的9個瓶子形成的樣本,其平均灌裝量服從正態(tài)分布,均值為標準差為,故 2、若,則,即,又知,故。3、易知服從自由度為6的卡方分布,得(左側(cè)分位數(shù))4、因為服從分布,我們已知,故服從9)分布,我們?nèi)羧?,則可以得到,故。(題中均為左側(cè)分位數(shù))第七章 參數(shù)估計7.1

27、(1)(2)由于1-=95% =5% 所以 估計誤差7.2 (1)(2)因為 所以(3)的置信區(qū)間為7.3 由于 n=100所以的95%置信區(qū)間為 7.4(1)的90%置信區(qū)間為(2)的95%置信區(qū)間為(3)的99%置信區(qū)間為7.5 (1)(2)(3)7.6 (1)(2)(3)(4)7.7 90%置信區(qū)間為95%置信區(qū)間為99%置信區(qū)間為7.8 所以95%置信區(qū)間為7.9 由于 所以95%置信區(qū)間為7.10 (1)(2)中心極限定理7.11 (1)(2)由于所以 合格率的95%置信區(qū)間為7.12 由于 所以99%置信區(qū)間為7.13 所以90%置信區(qū)間為7.14(1)(2)(3)7.15(1)9

28、0%置信區(qū)間為(2)95%置信區(qū)間為7.16 所以n為1667.17(1) 所以n為254(2) 所以n為151(3) 所以n為2687.18(1)(2) 所以n為627.19(1) 所以(2) (3) 7.20(1) (2)7.21 =(1)的90%置信區(qū)間為: = =(2)的95%置信區(qū)間為: = =(3)的99%置信區(qū)間為: =7.22(1)=(2)=18=(3)=17.78=(4)=18.714= =(5)=20.05 =7.23(1) =(2)=7.24 , 的置信區(qū)間為:=7.25(1)=(2)=7.26 =2.464=0.405767.27 =47.06所以 n =487.28=

29、138.30所以 n =139第8章 假設(shè)檢驗 二、練習(xí)題(說明:為了便于查找書后正態(tài)分布表,本答案中,正態(tài)分布的分位點均采用了下側(cè)分位點。其他分位點也可。為了便于查找書后t分布表方便,本答案中,正態(tài)分布的分位點均采用了上側(cè)分位點。)8.1解:根據(jù)題意,這是雙側(cè)檢驗問題。 已知:總體方差 當,查表得。 拒絕域W= 因為,所以不能拒絕H0,認為現(xiàn)在生產(chǎn)的鐵水平均含碳量為4.55。(注:為正態(tài)分布的1-/2下側(cè)分位點 )8.2解:根據(jù)題意,這是左單側(cè)檢驗問題。 已知:總體方差 當,查表得。 拒絕域W= 因為,所以拒絕H0,認為該元件的使用壽命低于700小時。(注:為正態(tài)分布的1-下側(cè)分位點 )8.

30、3解:根據(jù)題意,這是右單側(cè)檢驗問題。 已知:總體方差 當,查表得。拒絕域W= 因為,所以拒絕H0,認為這種化肥能使小麥明顯增產(chǎn)。(注:為正態(tài)分布的1-下側(cè)分位點 )8.4解:根據(jù)題意,這是雙側(cè)檢驗問題。 方差未知。 已知:總體 根據(jù)樣本計算得: 當,查表得。 拒絕域W=因為,所以不能拒絕H0,認為該日打包機工作正常。(注:為t分布的/2上側(cè)分位點 )8.5解:根據(jù)題意,這是右單側(cè)檢驗問題。 已知: 當,查表得。拒絕域W= 因為,所以拒絕H0,認為不符合標準的比例超過5%,該批食品不能出廠。(注:為正態(tài)分布的1-下側(cè)分位點 )8.6解:根據(jù)題意,這是右單側(cè)檢驗問題。 已知: 當,查表得。拒絕域W

31、= 因為,所以不能拒絕H0,認為該廠家的廣告不真實。(注:為t分布的上側(cè)分位點 )8.7解:根據(jù)題意,這是右單側(cè)檢驗問題。 已知: 當,查表得。拒絕域W= 因為,所以不能拒絕H0,認為元件的平均壽命不大于225小時。(注:為t分布的上側(cè)分位點 )8.8解:根據(jù)題意,這是右側(cè)檢驗問題。 已知: 當,查表得。拒絕域W= 因為,所以拒絕H0,認為成立。(注:為-分布的上側(cè)分位點 )8.9解:根據(jù)題意,這是雙側(cè)檢驗問題。 已知:總體方差 當,查表得。拒絕域W= 因為,所以拒絕H0,可以認為A,B兩廠生產(chǎn)的材料平均抗壓強度不相同。(注:為正態(tài)分布的1-/2下側(cè)分位點 )8.10解:根據(jù)題意,這是雙側(cè)檢驗

32、問題。 已知:總體方差,但未知 2.3579 當,查表得。拒絕域W= 因為,所以拒絕H0,認為兩種方法的裝配時間有顯著差異。(注:為t分布的上側(cè)分位點 )8.11解:根據(jù)題意,這是雙側(cè)檢驗問題。 已知: 在大樣本條件下 當,查表得。拒絕域W= 因為,所以拒絕H0,認為調(diào)查數(shù)據(jù)支持“吸煙者容易患慢性氣管炎”這種觀點。(注:為正態(tài)分布的1-/2下側(cè)分位點 )8.12解:根據(jù)題意,這是右單側(cè)檢驗問題。 (1)等同于(2) 已知: 在n=144情況下,(2)中的H0成立時,t近似服從標準正態(tài)分布。 因此P=P(t >2.16)=1-0.9846=0.0154。所以在=0.01的顯著水平,不能拒絕

33、H0,認為貸款的平均規(guī)模沒有明顯超過60萬元。8.13解:根據(jù)題意,這是左單側(cè)檢驗問題。 已知: 在大樣本條件下 當,查表得。拒絕域W= 因為,所以拒絕H0,認為阿司匹林可以降低心臟病發(fā)生率。(注:為正態(tài)分布的1-下側(cè)分位點 )8.14解:(1)根據(jù)題意,這是雙側(cè)檢驗問題。 已知: 當,利用EXCEL提供的統(tǒng)計函數(shù)“CHIINV”,得。拒絕域W= 因為,所以不能拒絕H0,認為成立。(注:為-分布的上側(cè)分位點 )(2)根據(jù)題意,這是雙側(cè)檢驗問題。 已知:總體方差 當,查表得。 拒絕域W= 因為,所以不能拒絕H0,認為螺栓口徑為7.0cm 。(注:為正態(tài)分布的1-/2下側(cè)分位點 )因此,由(1)和

34、(2)可得:這批螺栓達到了規(guī)定的要求。8.15(1)根據(jù)題意,這是雙側(cè)檢驗問題。 已知: 當,利用EXCEL提供的統(tǒng)計函數(shù)“FINV”,得。拒絕域W= 因為,所以不能拒絕H0,認為成立。(注:為F-分布的/2上側(cè)分位點 )(2)根據(jù)題意,這是右單側(cè)檢驗問題。 由(1)的分析可知:總體方差,但未知 當,查表得。拒絕域W= 因為,所以拒絕H0,認為有顯著大學(xué)中男生學(xué)習(xí)成績比女生好。(注:為t分布的上側(cè)分位點 )第十章 方差分析一、思考題10.1 什么是方差分析?它研究的是什么? 答:方差分析就是通過檢驗各總體的均值是否相等來判斷分類型自變量對數(shù)值型因變量是否有顯著影響。它所研究的是分類型自變量對數(shù)

35、值型因變量的影響。10.2 要檢驗多個總體均值是否相等時,為什么不作兩兩比較,而用方差分析方法? 答:做兩兩比較十分繁瑣,進行檢驗的次數(shù)較多,會使得犯第I類錯誤的概率相應(yīng)增加,而且隨著增加個體顯著性檢驗的次數(shù),偶然因素導(dǎo)致差別的可能性也會增加。而方差分析方法是同時考慮所有的樣本,因此排除了錯誤累積的概率,從而避免一個真實的原假設(shè)。10.3 方差分析包括哪些類型?它們有何區(qū)別? 答:方差分析可分為單因素方差分析和雙因素方差分析。區(qū)別:單因素方差分析研究的是一個分類自變量對一個數(shù)值型因變量的影響,而雙因素涉及兩個分類型自變量。10.4 方差分析中有哪些基本假定? 答:(1)每個總體都應(yīng)服從正態(tài)分布

36、 (2)各個總體的方差必須相同 (3)觀測值是獨立的10.5 簡述方差分析的基本思想 答:它是通過對數(shù)據(jù)誤差來源的分析來判斷不同總體的均值是否相等,進而分析自變量對因變量是否有顯著影響。10.6 解釋因子和處理的含義 答:在方差分析中,所要檢驗的對象稱為因素或因子,因素的不同表現(xiàn)稱為水平或處理。10.7 解釋組內(nèi)誤差和組間誤差的含義 答:組內(nèi)平均值誤差的誤差(SSE)是指每個水平或組的各個樣本數(shù)據(jù)與其組平均值誤差平方和,反映了每個樣本個觀測值的離散狀況;組間誤差(SSA)是指各組平均值與總平均值的誤差平方和,反映了各樣本均值之間的差異程度。10.8 解釋組內(nèi)方差和組間方差的含義 答:組內(nèi)方差指

37、因素的同一個水平下樣本數(shù)據(jù)的方差;組間方差指因素的不同水平下各個樣本之間的方差。10.9 簡述方差分析的基本步驟 答:(1)提出假設(shè) (2)構(gòu)造檢驗統(tǒng)計量 (3)統(tǒng)計決策10.10 方差分析中多重比較的作用是什么? 答:通過對總體均值之間的配對比較來進一步檢驗?zāi)男┚抵g存在差異。二、練習(xí)題10.1 解: 方差分析差異源SSdfMSFP-value組間618.91672309.45834.65740.04087724組內(nèi)598966.44444總計1216.91711相同10.2 解:方差分析差異源SSdfMSFP-value組間93.76812423.4420315.823371.02431

38、E-05組內(nèi)26.66667181.481481總計120.434822不相同10.3 解:ANOVA每桶容量(L) 平方和df均方F顯著性組間0.00730.0028.7210.001組內(nèi)0.004150.000總數(shù)0.01118不相同。10.4 解: 方差分析差異源SSdfMSFP-value組間29.60952214.8047611.755730.000849組內(nèi)18.89048151.259365總計48.517有顯著性差異。10.5 解:方差分析差異源SSdfMSFP-value組間615.62307.817.068390.00031組內(nèi)216.41218.03333總計83214有

39、顯著差異。LSD檢驗:計算得,有因為,則決策:(1),所以A生產(chǎn)企業(yè)生產(chǎn)的電池與B生產(chǎn)企業(yè)生產(chǎn)的電池平均壽命有顯著差異;(2),所以不能認為A生產(chǎn)企業(yè)生產(chǎn)的電池與C生產(chǎn)企業(yè)生產(chǎn)的電池平均壽命有顯著差異;(3),所以B生產(chǎn)企業(yè)生產(chǎn)的電池與C生產(chǎn)企業(yè)生產(chǎn)的電池平均壽命有顯著差異。10.6 解:方差分析差異源SSdfMSFP-value組間5.34915622.6745788.2745180.001962組內(nèi)7.434306230.323231總計12.7834625有顯著性差異107 (1) 方差分析表差異源SSDfMSFP-valueF crit組間42022101.478102190.2459

40、463.354131組內(nèi)383627142.0740741總計425629 (2)若顯著性水平a=0.05,檢驗三種方法組裝的產(chǎn)品數(shù)量之間是否有顯著差異?P=0.025a=0.05,沒有顯著差異。10.8 解:方差分析差異源SSdfMSFP-valueF crit行1.54933340.38733321.719630.0002367.006077列3.48421.74297.682242.39E-068.649111誤差0.14266780.017833總計5.17614(1)或p=0.000236<,所以不同車速對磨損程度有顯著性差異;(2) 或p=2.39E-06<,所以不同供

41、應(yīng)商生產(chǎn)的輪胎的磨損程度有顯著性差異。10.9 解: 方差分析差異源SSdfMSFP-valueF crit行19.06744.766757.2397160.0033153.259167列18.181536.06059.2046580.0019493.490295誤差7.901120.658417總計45.149519結(jié)果表明施肥方法和品種都對收獲量有顯著影響。10.10 解:方差分析差異源SSdfMSFP-valueF crit行22.22222211.111110.0727270.9310566.944272列955.55562477.77783.1272730.1521556.94427

42、2誤差611.11114152.7778總計1588.8898(1)或p=0.931056>,所以不同銷售地區(qū)對食品的銷售量無顯著性差異;(2) 或p=0.152>,所以不同包裝對食品的銷售量無顯著性差異。10.11 解:方差分析差異源SSdfMSFP-valueF crit樣本1752287648.666675.49E-086.012905列798239922.166671.4E-056.012905交互182.6667445.666672.5370370.0759024.579036內(nèi)部3241818總計3056.66726(1) 競爭者的數(shù)量對銷售額有顯著影響(2) 超市位置

43、對銷售額有顯著影響(3) 無交互作用10.12 解:方差分析差異源SSdfMSFP-valueF crit樣本344217210.750.0103865.143253列4814830.1339755.987378交互562281.750.2519325.143253內(nèi)部96616總計54411(1) 廣告方案對銷售量有顯著影響(2) 廣告媒體形式對銷售量無顯著影響(3) 無交互作用第11章 一元線性回歸一、思考題111變量之間存在的互相依存的不確定的數(shù)量關(guān)系,稱為相關(guān)關(guān)系。相關(guān)關(guān)系的特點:變量之間確實存在著數(shù)量上的依存關(guān)系;變量之間數(shù)量上的關(guān)系是不確定、不嚴格的依存關(guān)系。112相關(guān)分析通過對兩

44、個變量之間的線性關(guān)系的描述與度量,主要解決的問題包括:變量之間是否存在關(guān)系?如果存在關(guān)系,它們之間是什么樣的關(guān)系?變量之間的關(guān)系強度如何?樣本所反映的變量之間的關(guān)系能否代表總體變量之間的關(guān)系?113在進行相關(guān)分析時,對總體主要有以下兩個假定:兩個變量之間是線性關(guān)系;兩個變量都是隨機變量。114相關(guān)系數(shù)的性質(zhì):r的取值范圍是-1,1,r為正表示正相關(guān),r為負表示負相關(guān),r絕對值的大小表示相關(guān)程度的高低;對稱性:X與Y的相關(guān)系數(shù)和Y與X之間的相關(guān)系數(shù)相等;相關(guān)系數(shù)與原點和尺度無關(guān);相關(guān)系數(shù)是線性關(guān)聯(lián)或線性相依的一個度量,它不能用于描述非線性關(guān)系;相關(guān)系數(shù)只是兩個變量之間線性關(guān)聯(lián)的一個度量,卻不一定

45、意味兩個變量之間有因果關(guān)系;若X與Y統(tǒng)計上獨立,則它們之間的相關(guān)系數(shù)為零;但r=0不等于說兩個變量是獨立的。即零相關(guān)并不一定意味著獨立性。115在實際的客觀現(xiàn)象分析研究中,相關(guān)系數(shù)一般都是利用樣本數(shù)據(jù)計算的,因而帶有一定的隨機性。樣本容量越小,其可信程度就越差,抽取的樣本不同,r的取值也會不同,因此r是一個隨機變量。能否用樣本相關(guān)系數(shù)來反映總體的相關(guān)程度,需要考察樣本相關(guān)系數(shù)的可靠性,因此要進行顯著性檢驗。116相關(guān)系數(shù)顯著性檢驗的步驟:提出假設(shè);計算檢驗統(tǒng)計量t值;在給定的顯著性水平和自由度,查t分布表中相應(yīng)的臨界值,作出決策。117回歸模型是對統(tǒng)計關(guān)系進行定量描述的一種數(shù)學(xué)模型,例如:對于

46、具有線性關(guān)系的兩個變量,可以有一元線性方程來描述它們之間的關(guān)系,描述因變量y如何依賴自變量x和誤差項的方程稱為回歸模型?;貧w方程是對變量之間統(tǒng)計關(guān)系進行定量描述的一種數(shù)學(xué)表達式。指具有相關(guān)的隨機變量和固定變量之間關(guān)系的方程。當總體回歸系數(shù)未知時,必須用樣本數(shù)據(jù)去估計,用樣本統(tǒng)計量代替回歸方程中的未知參數(shù),就得到了估計的回歸方程。118一元線性回歸模型通常有以下幾條基本的假定:變量之間存在線性關(guān)系;在重復(fù)抽樣中,自變量x的取值是固定的;誤差項是一個期望為零的隨機變量;)對于所有的x值,誤差項的方差都相同;誤差項是一個服從正態(tài)分布的隨機變量,且相互獨立。即。119參數(shù)最小二乘法的基本原理是:因變量的觀測值與估計值之間的離差平方和最小。1110總平方和指n次觀測值的的離差平方和,衡量的是被解釋變量y波動的程度或不確定性的程度。回歸平方和反映y的總變差中由于x與y之間的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論