版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第一章 導(dǎo)論 1.11(1)數(shù)值型變量。(2)分類變量。(3)離散型變量。(4)順序變量。(5)分類變量。1.2 (1)總體是該市所有職工家庭的集合;樣本是抽中的2000個(gè)職工家庭的集合。 (2)參數(shù)是該市所有職工家庭的年人均收入;統(tǒng)計(jì)量是抽中的2000個(gè)職工家庭的年人均收入。1.3 (1)總體是所有it從業(yè)者的集合。 (2)數(shù)值型變量。 (3)分類變量。 (4)截面數(shù)據(jù)。1.4 (1)總體是所有在網(wǎng)上購(gòu)物的消費(fèi)者的集合。 (2)分類變量。 (3)參數(shù)是所有在網(wǎng)上購(gòu)物者的月平均花費(fèi)。 (4)參數(shù) (5)推斷統(tǒng)計(jì)方法。第二章數(shù)據(jù)的搜集1.什么是二手資料?使用二手資料需要注意些什么?與研究?jī)?nèi)容有關(guān)
2、的原始信息已經(jīng)存在,是由別人調(diào)查和實(shí)驗(yàn)得來的,并會(huì)被我們利用的資料稱為“二手資料”。 使用二手資料時(shí)需要注意:資料的原始搜集人、搜集資料的目的、搜集資料的途徑、搜集資料的時(shí)間,要注意數(shù)據(jù)的定義、含義、計(jì)算口徑和計(jì)算方法,避免錯(cuò)用、誤用、濫用。在引用二手資料時(shí),要注明數(shù)據(jù)來源。2.比較概率抽樣和非概率抽樣的特點(diǎn),舉例說明什么情況下適合采用概率抽樣,什么情況下適合采用非概率抽樣。概率抽樣是指抽樣時(shí)按一定概率以隨機(jī)原則抽取樣本。每個(gè)單位被抽中的概率已知或可以計(jì)算,當(dāng)用樣本對(duì)總體目標(biāo)量進(jìn)行估計(jì)時(shí),要考慮到每個(gè)單位樣本被抽中的概率,概率抽樣的技術(shù)含量和成本都比較高。如果調(diào)查的目的在于掌握和研究總體的數(shù)量
3、特征,得到總體參數(shù)的置信區(qū)間,就使用概率抽樣。非概率抽樣是指抽取樣本時(shí)不是依據(jù)隨機(jī)原則,而是根據(jù)研究目的對(duì)數(shù)據(jù)的要求,采用某種方式從總體中抽出部分單位對(duì)其實(shí)施調(diào)查。非概率抽樣操作簡(jiǎn)單、實(shí)效快、成本低,而且對(duì)于抽樣中的專業(yè)技術(shù)要求不是很高。它適合探索性的研究,調(diào)查結(jié)果用于發(fā)現(xiàn)問題,為更深入的數(shù)量分析提供準(zhǔn)備。非概率抽樣也適合市場(chǎng)調(diào)查中的概念測(cè)試。3.調(diào)查中搜集數(shù)據(jù)的方法主要有自填式、面方式、電話式,除此之外,還有那些搜集數(shù)據(jù)的方法?實(shí)驗(yàn)式、觀察式等。4. 自填式、面方式、電話式調(diào)查個(gè)有什么利弊?自填式優(yōu)點(diǎn):調(diào)查組織者管理容易,成本低,可以進(jìn)行較大規(guī)模調(diào)查,對(duì)被調(diào)查者可以刻選擇方便時(shí)間答卷,減少回
4、答敏感問題的壓力。缺點(diǎn):返回率低,調(diào)查時(shí)間長(zhǎng),在數(shù)據(jù)搜集過程中遇到問題不能及時(shí)調(diào)整。面談式優(yōu)點(diǎn):回答率高,數(shù)據(jù)質(zhì)量高,在數(shù)據(jù)搜集過程中遇到問題可以及時(shí)調(diào)整可以充分發(fā)揮調(diào)查員的作用。缺點(diǎn):成本比較高,對(duì)調(diào)查過程的質(zhì)量控制有一定難度。對(duì)于敏感問題,被訪者會(huì)有壓力。電話式優(yōu)點(diǎn):速度快,對(duì)調(diào)查員比較安全,對(duì)訪問過程的控制比較容易,缺點(diǎn):實(shí)施地區(qū)有限,調(diào)查時(shí)間不宜過長(zhǎng),問卷要簡(jiǎn)單,被訪者不愿回答時(shí),不宜勸服。5.請(qǐng)舉出(或設(shè)計(jì))幾個(gè)實(shí)驗(yàn)數(shù)據(jù)的例子。不同飼料對(duì)牲畜增重有無影響,新舊技術(shù)的機(jī)器對(duì)組裝同一產(chǎn)品所需時(shí)間的影響。6.你認(rèn)為應(yīng)當(dāng)如何控制調(diào)查中的回答誤差?對(duì)于理解誤差,要注意表述中的措辭,學(xué)習(xí)一定的心
5、里學(xué)知識(shí)。對(duì)于記憶誤差,盡量縮短所涉及問題的時(shí)間范圍。對(duì)于有意識(shí)誤差,調(diào)查人員要想法打消被調(diào)查者得思想顧慮,調(diào)查人員要遵守職業(yè)道德,為被調(diào)查者保密,盡量避免敏感問題。7.怎樣減少無回答?請(qǐng)通過一個(gè)例子,說明你所考慮到的減少無回答的具體措施。對(duì)于隨機(jī)誤差,可以通過增加樣本容量來控制。對(duì)于系統(tǒng)誤差,做好預(yù)防,在調(diào)查前做好各方面的準(zhǔn)備工作,盡量把無回答率降到最低程度。無回答出現(xiàn)后,分析武回答產(chǎn)生的原因,采取補(bǔ)救措施。比如要收回一百份,就要做好一百二十份或一百三十份問卷的準(zhǔn)備,當(dāng)被調(diào)查者不愿意回答時(shí),可以通過一定的方法勸服被訪者,還可以通過饋贈(zèng)小禮品等的方式提高回收率。第三章 數(shù)據(jù)的圖表搜集一、思考題
6、3.1數(shù)據(jù)的預(yù)處理包括哪些內(nèi)容?答:審核、篩選、排序等。3.2分類數(shù)據(jù)和順序數(shù)據(jù)的整理和顯示方法各有哪些?答:分類數(shù)據(jù)在整理時(shí)候先列出所分的類別,計(jì)算各組的頻數(shù)、頻率,得到頻數(shù)分布表,如果是兩個(gè)或兩個(gè)以上變量可以制作交叉表。對(duì)于分類數(shù)據(jù)可以繪制條形圖、帕累托圖、餅圖、環(huán)形圖等。根據(jù)不同的資料或者目的選擇不同的圖。對(duì)于順序數(shù)據(jù),可以計(jì)算各種的頻數(shù)、頻率,以及累計(jì)頻數(shù)、累計(jì)頻率??筛鶕?jù)需要繪制條形圖、餅圖、環(huán)形圖等。3.3數(shù)值型數(shù)據(jù)的分組方法有哪些?簡(jiǎn)述組距分組的步驟。答:?jiǎn)巫兞恐捣纸M和組距分組。其中組距分組:第一步,確定組數(shù),組數(shù)多少由數(shù)據(jù)的多少和特點(diǎn)等決定,一般515組;第二步,確定各組組距,
7、宜取5或10的倍數(shù);第三步,根據(jù)分組整理出頻數(shù)分布表,注意遵循“不重不漏”和“上限不在內(nèi)”的原則。3.4直方圖和條形圖有何區(qū)別?答:1,條形圖使用圖形的長(zhǎng)度表示各類別頻數(shù)的多少,其寬度固定,直方圖用面積表示各組頻數(shù),矩形的高度表示每一組的頻數(shù)或頻率,寬度表示組距,高度與寬度都有意義;2直方圖各矩形連續(xù)排列,條形圖分開排列;3條形圖主要展示分類數(shù)據(jù),直方圖主要展示數(shù)值型數(shù)據(jù)。3.5繪制線圖應(yīng)注意問題?答:時(shí)間在橫軸,觀測(cè)值繪在縱軸。一般是長(zhǎng)寬比例10:7的長(zhǎng)方形,縱軸下端一般從0開始,數(shù)據(jù)與0距離過大的話用折斷符號(hào)折斷。3.6餅圖和環(huán)形圖的不同?答:餅圖只能顯示一個(gè)樣本或總體各部分所占比例,環(huán)形
8、圖可以同時(shí)繪制多個(gè)樣本或總體的數(shù)據(jù)系列,其圖形中間有個(gè)“空洞”,每個(gè)樣本或總體的數(shù)據(jù)系類為一個(gè)環(huán)。3.7莖葉圖比直方圖的優(yōu)勢(shì),他們各自的應(yīng)用場(chǎng)合?答:莖葉圖既能給出數(shù)據(jù)的分布情況,又能給出每一個(gè)原始數(shù)據(jù),即保留了原始數(shù)據(jù)的信息。在應(yīng)用方面,直方圖通常適用于大批量數(shù)據(jù),莖葉圖適用于小批量數(shù)據(jù)。3.8鑒別圖標(biāo)優(yōu)劣的準(zhǔn)則?答:p65明確有答案,我就不寫了。3.9制作統(tǒng)計(jì)表應(yīng)注意的問題?答:1,合理安排統(tǒng)計(jì)表結(jié)構(gòu);2表頭一般包括表號(hào),總標(biāo)題和表中數(shù)據(jù)的單位等內(nèi)容;3表中的上下兩條橫線一般用粗線,中間的其他用細(xì)線,兩端開口,數(shù)字右對(duì)齊,不要有空白格;4在使用統(tǒng)計(jì)表時(shí),必要時(shí)可在下方加注釋,注明數(shù)據(jù)來源。
9、二、練習(xí)題3.1答: (1)表中數(shù)據(jù)屬于順序數(shù)據(jù)。(2)用excel制作一張頻數(shù)分布表。 服務(wù)等級(jí)家庭數(shù)目(個(gè))好14較好21一般32較差18差15(3)繪制一張條形圖,反映評(píng)價(jià)等級(jí)的分布。 (4)繪制評(píng)價(jià)等級(jí)的帕累托圖。32 某行業(yè)管理局所屬40個(gè)企業(yè)2002年的產(chǎn)品銷售收入數(shù)據(jù)如下:1521241291161001039295127104105119114115871031181421351251171081051101071371201361171089788123115119138112146113126要求:(1)根據(jù)上面的數(shù)據(jù)進(jìn)行適當(dāng)?shù)姆纸M,編制頻數(shù)分布表,并計(jì)算出累積頻數(shù)和累積頻
10、率。1、確定組數(shù):,取k=62、確定組距:組距( 最大值 - 最小值)÷ 組數(shù)=(152-87)÷6=10.83,取103、分組頻數(shù)表銷售收入頻數(shù)頻率%向上累計(jì)頻數(shù)向上累計(jì)頻率%80 90252590 10037.5512.5100- 110922.51435110 12012302665120 130717.53382.5130 1404103792.5140 15025.03997.5150以上12.540100合計(jì)40100.0(2)按規(guī)定,銷售收入在125萬元以上為先進(jìn)企業(yè),115125萬元為良好企業(yè),105115 萬元為一般企業(yè),105萬元以下為落后企業(yè),按先進(jìn)企
11、業(yè)、良好企業(yè)、一般企業(yè)、落后企業(yè)進(jìn)行分組。頻數(shù)頻率%向上累計(jì)頻數(shù)向上累計(jì)頻率%先進(jìn)企業(yè)10251025良好企業(yè)12302255一般企業(yè)922.53177.5落后企業(yè)922.540100合計(jì)4010033 某百貨公司連續(xù)40天的商品銷售額如下: 單位:萬元41252947383430384340463645373736454333443528463430374426384442363737493942323635要求:根據(jù)上面的數(shù)據(jù)進(jìn)行適當(dāng)?shù)姆纸M,編制頻數(shù)分布表,并繪制直方圖。答 :1、確定組數(shù): ,取k=62、確定組距:組距( 最大值 - 最小值)÷ 組數(shù)=(49-25)÷
12、6=4,取53、分組頻數(shù)表(根據(jù)實(shí)際資料,調(diào)整成分5個(gè)組)銷售收入(萬元)頻數(shù)頻率%向上累計(jì)頻數(shù)向上累計(jì)頻率%30以下41041030 - 35615102535 - 401537.52562.540 - 45922.5348545以上61540100合計(jì)40100.04、直方圖34 利用下面的數(shù)據(jù)構(gòu)建莖葉圖和箱線圖。572929363123472328283551391846182650293321464152282143194220答:莖葉圖 frequency stem & leaf 3.00 1 . 889 5.00 2 . 01133 7.00 2 . 6888999 2.0
13、0 3 . 13 3.00 3 . 569 3.00 4 . 123 3.00 4 . 667 3.00 5 . 012 1.00 5 . 7箱線圖3.5答 :頻數(shù)分布表燈泡壽命頻率向上累積頻率(%)660以下22%660-67057%670-680613%680-6901427%690-7002653%700-7101871%710-7201384%720-7301094%730-740397% 740以上3100%合計(jì)100直方圖 從直方圖看,數(shù)據(jù)的分布呈左偏分布。3.6答 :頻數(shù)分布表,取k=72、確定組距:組距( 最大值 - 最小值)÷ 組數(shù)=(61-40)÷7=3
14、,取33、分組頻數(shù)表(根據(jù)實(shí)際資料,調(diào)整成分5個(gè)組)食品重量(g)頻數(shù)頻率%向上累計(jì)頻數(shù)向上累計(jì)頻率%43以下334343 - 4699121246 - 492424363649 - 521919555552 -5524247979 55 - 5814149393 58 以上77100100合計(jì)100100.0從直方圖看,數(shù)據(jù)的分布呈雙峰分布。3.7頻數(shù)分布表重量誤差(g)頻數(shù)頻率%向上累計(jì)頻數(shù)向上累計(jì)頻率%19-2951051029-39714122439-49816204049-591326336659-69918428469-79612489679-892450100合計(jì)50100從直方
15、圖看,數(shù)據(jù)的分布呈左偏分布3.8(1)數(shù)值型數(shù)據(jù)(2)頻數(shù)分布表,取k=72、確定組距: 組距( 最大值 - 最小值)÷ 組數(shù)=(9+25)÷7=4.86,取5氣溫()頻數(shù)頻率%向上累計(jì)頻數(shù)向上累計(jì)頻率%(-25,-20)610.00610.00(-20,-15)813.331423.33(-15,-10)1016.672440.00(-10.-5)1321.673761.67(-5.0)1220.004981.67(0,5)46.675388.33(5,10)711.6760100.00合計(jì)60100從直方圖看,數(shù)據(jù)的分布呈左偏分布。3.9 自學(xué)考試人員年齡分布集中在20
16、-24之間,分布圖呈右偏。3.103.11 3.12 (1)復(fù)式條形圖(2)甲班成績(jī)分布圖近似正態(tài)分布,分布較均衡;乙班成績(jī)分布圖右偏。(3)根據(jù)雷達(dá)圖,兩班成績(jī)分布不相似。3.133.14 第四章習(xí)題答案4.1數(shù)據(jù)排列:2,4,7,10,10,10,12,12,14,15(1)眾數(shù):10;中位數(shù):10平均數(shù):9.6(2)四分位數(shù):q位置=2.5.所以q=5.5q位置=7.5,所以q=13(3)標(biāo)準(zhǔn)差:4.17(4)峰度0.25,偏度0.694.2 (1)眾數(shù):19;23中位數(shù):23平均數(shù):24(2)四分位數(shù):q位置=6.25.所以q=19+0.250=19q位置=18.75,所以q=25+2
17、0.75=26.5(3)標(biāo)準(zhǔn)差:6.65(4)峰度0.77,偏度1.084.3(1)莖葉圖略(2) 平均數(shù):7,標(biāo)準(zhǔn)差0.71(3)第一種方式的離散系數(shù)=0.28第二種方式的離散系數(shù)=0.10所以,第二種排隊(duì)方式等待時(shí)間更集中。(4)選擇第二種,因?yàn)槠骄却臅r(shí)間短,而且等待時(shí)間的集中程度高4.4 (1)平均數(shù):274.1,中位數(shù):272.5(2)q位置=7.5.所以q=258+0.253=258.75q位置=22.5,所以q=284+70.75=289.25(3)日銷售額的標(biāo)準(zhǔn)差:21.174.5產(chǎn)品名稱單位成本(元)總成本/元產(chǎn)量甲企業(yè)乙企業(yè)甲企業(yè)乙企業(yè)a1521003255140217b
18、203000150015075c30150015005050合計(jì)66006255340342甲企業(yè)總平均成本=19.41(元)乙企業(yè)總平均成本=所以甲企業(yè)的總平均成本比乙企業(yè)的高,原因是甲企業(yè)高成本的產(chǎn)品b生產(chǎn)的產(chǎn)量比乙企業(yè)多,所以把總平均成本提高了。4.6計(jì)算數(shù)據(jù)如表:按利潤(rùn)額分組(萬元)組中值企業(yè)數(shù)(個(gè))利潤(rùn)額2003002501947505930333004003503010500176349400500450421890022860500600550189900273785600以上650117150548639合計(jì)-120512001614666利潤(rùn)總額的平均數(shù)=利潤(rùn)總額標(biāo)準(zhǔn)差= 峰
19、態(tài)系數(shù)偏態(tài)系數(shù)=4.7(1)不同。1000名的平均身高較高;(2)不同。100名的樣本容量的標(biāo)準(zhǔn)差更大;(3)不同,調(diào)查1000名的樣本容量得到最高和最低者的機(jī)會(huì)較大。4.8對(duì)于不同的總體的差異程度的比較采用標(biāo)準(zhǔn)差系數(shù),計(jì)算如下:; (1)女生的體重差異大,因?yàn)殡x散系數(shù)大;(2)以磅為單位,男生的平均體重為132.6磅,標(biāo)準(zhǔn)差為11.05磅;女生的平均體重為110.5磅,標(biāo)準(zhǔn)差為11.05磅(3),所以大約有68%的人體重在55kg65kg之間;(4),所以大約有95%的女生體重在40kg60kg之間。4.9;由此可以判斷第二項(xiàng)測(cè)試更理想。4.10時(shí)間周一周二周三周四周五周六周日產(chǎn)量38503
20、67036903720361035903700z值30.60.20.41.82.20可以看出,周一和周六兩天生產(chǎn)線失去了控制。4.11(1)采用離散系數(shù),因?yàn)槿绻容^身高差異,兒童和成年人屬于不同的總體;(2),所以,兒童的身高差異更大。4.12(1)對(duì)集中程度和離散程度分別評(píng)價(jià),選擇集中趨勢(shì)數(shù)值大的,而且離散程度數(shù)值小的方式(2)選擇方法a,因?yàn)閍方法下,工人的平均組裝數(shù)量為165.6,而且該方法下,工人組裝數(shù)量的離散系數(shù)只有0.012,所以選擇a方法。4.13(1)用離散系數(shù)(2)商業(yè)類(3)高科技第六章 統(tǒng)計(jì)量與抽樣分布 由樣本構(gòu)建具體的統(tǒng)計(jì)量,實(shí)際上是對(duì)樣本所含的總體信息按某種要求進(jìn)行
21、加工處理,把分散在樣本中的信息集中到統(tǒng)計(jì)量的取值上,不同的統(tǒng)計(jì)推斷問題要求構(gòu)造不同的統(tǒng)計(jì)量。構(gòu)造統(tǒng)計(jì)量的主要目的就是對(duì)總體的未知參數(shù)進(jìn)行推斷,如果統(tǒng)計(jì)量中含有總體的未知參數(shù)就沒辦法再對(duì)參數(shù)進(jìn)行統(tǒng)計(jì)推斷。2、是統(tǒng)計(jì)量,在不是統(tǒng)計(jì)量。 4、假若一個(gè)統(tǒng)計(jì)量能把含在樣本中有關(guān)總體的信息一點(diǎn)都不損失地提取出來,這樣的統(tǒng)計(jì)量稱充分統(tǒng)計(jì)量。5、統(tǒng)計(jì)學(xué)上的自由度指當(dāng)以樣本的統(tǒng)計(jì)量來估計(jì)總體的參數(shù)時(shí),樣本中獨(dú)立或能自由變化的資料的個(gè)數(shù)。6、 7、在重復(fù)選取容量為n的樣本時(shí),由樣本統(tǒng)計(jì)量的所有取值形成的相對(duì)頻數(shù)分布為統(tǒng)計(jì)量的抽樣分布。 二、練習(xí)1、易知由這臺(tái)機(jī)器灌裝的9個(gè)瓶子形成的樣本,其平均灌裝量服從正態(tài)分布,
22、均值為標(biāo)準(zhǔn)差為,故 2、若,則,即,又知,故。3、易知服從自由度為6的卡方分布,得(左側(cè)分位數(shù))4、因?yàn)榉姆植?,我們已知,故服?)分布,我們?nèi)羧。瑒t可以得到,故。(題中均為左側(cè)分位數(shù))第七章 參數(shù)估計(jì)7.1 (1)(2)由于1-=95% =5% 所以 估計(jì)誤差7.2 (1)(2)因?yàn)?所以(3)的置信區(qū)間為7.3 由于 n=100所以的95%置信區(qū)間為7.4(1)的90%置信區(qū)間為(2)的95%置信區(qū)間為(3)的99%置信區(qū)間為7.5 (1)(2)(3)7.6 (1)(2)(3)(4)7.7 90%置信區(qū)間為95%置信區(qū)間為99%置信區(qū)間為7.8 所以95%置信區(qū)間為7.9 由于 所以95
23、%置信區(qū)間為7.10 (1)(2)中心極限定理7.11 (1)(2)由于所以 合格率的95%置信區(qū)間為7.12 由于 所以99%置信區(qū)間為7.13 所以90%置信區(qū)間為7.14(1)(2)(3)7.15(1)90%置信區(qū)間為(2)95%置信區(qū)間為7.16 所以n為1667.17(1) 所以n為254(2) 所以n為151(3) 所以n為2687.18(1)(2) 所以n為627.19(1) 所以(2) (3) 7.20(1) (2)7.21 =(1)的90%置信區(qū)間為: = =(2)的95%置信區(qū)間為: = =(3)的99%置信區(qū)間為: =7.22(1)=(2)=18=(3)=17.78=(4
24、)=18.714= =(5)=20.05 =7.23(1) =(2)=7.24 , 的置信區(qū)間為:=7.25(1)=(2)=7.26 =2.464=0.405767.27 =47.06所以 n =487.28=138.30所以 n =139第8章 假設(shè)檢驗(yàn) 二、練習(xí)題(說明:為了便于查找書后正態(tài)分布表,本答案中,正態(tài)分布的分位點(diǎn)均采用了下側(cè)分位點(diǎn)。其他分位點(diǎn)也可。為了便于查找書后t分布表方便,本答案中,正態(tài)分布的分位點(diǎn)均采用了上側(cè)分位點(diǎn)。)8.1解:根據(jù)題意,這是雙側(cè)檢驗(yàn)問題。 已知:總體方差 當(dāng),查表得。 拒絕域w= 因?yàn)椋圆荒芫芙^h0,認(rèn)為現(xiàn)在生產(chǎn)的鐵水平均含碳量為4.55。(注:為正
25、態(tài)分布的1-/2下側(cè)分位點(diǎn) )8.2解:根據(jù)題意,這是左單側(cè)檢驗(yàn)問題。 已知:總體方差 當(dāng),查表得。 拒絕域w= 因?yàn)?,所以拒絕h0,認(rèn)為該元件的使用壽命低于700小時(shí)。(注:為正態(tài)分布的1-下側(cè)分位點(diǎn) )8.3解:根據(jù)題意,這是右單側(cè)檢驗(yàn)問題。 已知:總體方差 當(dāng),查表得。拒絕域w= 因?yàn)?,所以拒絕h0,認(rèn)為這種化肥能使小麥明顯增產(chǎn)。(注:為正態(tài)分布的1-下側(cè)分位點(diǎn) )8.4解:根據(jù)題意,這是雙側(cè)檢驗(yàn)問題。 方差未知。 已知:總體 根據(jù)樣本計(jì)算得: 當(dāng),查表得。 拒絕域w=因?yàn)?,所以不能拒絕h0,認(rèn)為該日打包機(jī)工作正常。(注:為t分布的/2上側(cè)分位點(diǎn) )8.5解:根據(jù)題意,這是右單側(cè)檢驗(yàn)問題
26、。 已知: 當(dāng),查表得。拒絕域w= 因?yàn)椋跃芙^h0,認(rèn)為不符合標(biāo)準(zhǔn)的比例超過5%,該批食品不能出廠。(注:為正態(tài)分布的1-下側(cè)分位點(diǎn) )8.6解:根據(jù)題意,這是右單側(cè)檢驗(yàn)問題。 已知: 當(dāng),查表得。拒絕域w= 因?yàn)?,所以不能拒絕h0,認(rèn)為該廠家的廣告不真實(shí)。(注:為t分布的上側(cè)分位點(diǎn) )8.7解:根據(jù)題意,這是右單側(cè)檢驗(yàn)問題。 已知: 當(dāng),查表得。拒絕域w= 因?yàn)?,所以不能拒絕h0,認(rèn)為元件的平均壽命不大于225小時(shí)。(注:為t分布的上側(cè)分位點(diǎn) )8.8解:根據(jù)題意,這是右側(cè)檢驗(yàn)問題。 已知: 當(dāng),查表得。拒絕域w= 因?yàn)椋跃芙^h0,認(rèn)為成立。(注:為-分布的上側(cè)分位點(diǎn) )8.9解:根
27、據(jù)題意,這是雙側(cè)檢驗(yàn)問題。 已知:總體方差 當(dāng),查表得。拒絕域w= 因?yàn)?,所以拒絕h0,可以認(rèn)為a,b兩廠生產(chǎn)的材料平均抗壓強(qiáng)度不相同。(注:為正態(tài)分布的1-/2下側(cè)分位點(diǎn) )8.10解:根據(jù)題意,這是雙側(cè)檢驗(yàn)問題。 已知:總體方差,但未知 2.3579 當(dāng),查表得。拒絕域w= 因?yàn)?,所以拒絕h0,認(rèn)為兩種方法的裝配時(shí)間有顯著差異。(注:為t分布的上側(cè)分位點(diǎn) )8.11解:根據(jù)題意,這是雙側(cè)檢驗(yàn)問題。 已知: 在大樣本條件下 當(dāng),查表得。拒絕域w= 因?yàn)?,所以拒絕h0,認(rèn)為調(diào)查數(shù)據(jù)支持“吸煙者容易患慢性氣管炎”這種觀點(diǎn)。(注:為正態(tài)分布的1-/2下側(cè)分位點(diǎn) )8.12解:根據(jù)題意,這是右單側(cè)檢
28、驗(yàn)問題。 (1)等同于(2) 已知: 在n=144情況下,(2)中的h0成立時(shí),t近似服從標(biāo)準(zhǔn)正態(tài)分布。 因此p=p(t >2.16)=1-0.9846=0.0154。所以在=0.01的顯著水平,不能拒絕h0,認(rèn)為貸款的平均規(guī)模沒有明顯超過60萬元。8.13解:根據(jù)題意,這是左單側(cè)檢驗(yàn)問題。 已知: 在大樣本條件下 當(dāng),查表得。拒絕域w= 因?yàn)?,所以拒絕h0,認(rèn)為阿司匹林可以降低心臟病發(fā)生率。(注:為正態(tài)分布的1-下側(cè)分位點(diǎn) )8.14解:(1)根據(jù)題意,這是雙側(cè)檢驗(yàn)問題。 已知: 當(dāng),利用excel提供的統(tǒng)計(jì)函數(shù)“chiinv”,得。拒絕域w= 因?yàn)?,所以不能拒絕h0,認(rèn)為成立。(注:
29、為-分布的上側(cè)分位點(diǎn) )(2)根據(jù)題意,這是雙側(cè)檢驗(yàn)問題。 已知:總體方差 當(dāng),查表得。 拒絕域w= 因?yàn)椋圆荒芫芙^h0,認(rèn)為螺栓口徑為7.0cm 。(注:為正態(tài)分布的1-/2下側(cè)分位點(diǎn) )因此,由(1)和(2)可得:這批螺栓達(dá)到了規(guī)定的要求。8.15(1)根據(jù)題意,這是雙側(cè)檢驗(yàn)問題。 已知: 當(dāng),利用excel提供的統(tǒng)計(jì)函數(shù)“finv”,得。拒絕域w= 因?yàn)椋圆荒芫芙^h0,認(rèn)為成立。(注:為f-分布的/2上側(cè)分位點(diǎn) )(2)根據(jù)題意,這是右單側(cè)檢驗(yàn)問題。 由(1)的分析可知:總體方差,但未知 當(dāng),查表得。拒絕域w= 因?yàn)?,所以拒絕h0,認(rèn)為有顯著大學(xué)中男生學(xué)習(xí)成績(jī)比女生好。(注:為t
30、分布的上側(cè)分位點(diǎn) )第十章 方差分析一、思考題10.1 什么是方差分析?它研究的是什么? 答:方差分析就是通過檢驗(yàn)各總體的均值是否相等來判斷分類型自變量對(duì)數(shù)值型因變量是否有顯著影響。它所研究的是分類型自變量對(duì)數(shù)值型因變量的影響。10.2 要檢驗(yàn)多個(gè)總體均值是否相等時(shí),為什么不作兩兩比較,而用方差分析方法? 答:做兩兩比較十分繁瑣,進(jìn)行檢驗(yàn)的次數(shù)較多,會(huì)使得犯第i類錯(cuò)誤的概率相應(yīng)增加,而且隨著增加個(gè)體顯著性檢驗(yàn)的次數(shù),偶然因素導(dǎo)致差別的可能性也會(huì)增加。而方差分析方法是同時(shí)考慮所有的樣本,因此排除了錯(cuò)誤累積的概率,從而避免一個(gè)真實(shí)的原假設(shè)。10.3 方差分析包括哪些類型?它們有何區(qū)別? 答:方差分
31、析可分為單因素方差分析和雙因素方差分析。區(qū)別:?jiǎn)我蛩胤讲罘治鲅芯康氖且粋€(gè)分類自變量對(duì)一個(gè)數(shù)值型因變量的影響,而雙因素涉及兩個(gè)分類型自變量。10.4 方差分析中有哪些基本假定? 答:(1)每個(gè)總體都應(yīng)服從正態(tài)分布 (2)各個(gè)總體的方差2必須相同 (3)觀測(cè)值是獨(dú)立的10.5 簡(jiǎn)述方差分析的基本思想 答:它是通過對(duì)數(shù)據(jù)誤差來源的分析來判斷不同總體的均值是否相等,進(jìn)而分析自變量對(duì)因變量是否有顯著影響。10.6 解釋因子和處理的含義 答:在方差分析中,所要檢驗(yàn)的對(duì)象稱為因素或因子,因素的不同表現(xiàn)稱為水平或處理。10.7 解釋組內(nèi)誤差和組間誤差的含義 答:組內(nèi)平均值誤差的誤差(sse)是指每個(gè)水平或組的
32、各個(gè)樣本數(shù)據(jù)與其組平均值誤差平方和,反映了每個(gè)樣本個(gè)觀測(cè)值的離散狀況;組間誤差(ssa)是指各組平均值與總平均值的誤差平方和,反映了各樣本均值之間的差異程度。10.8 解釋組內(nèi)方差和組間方差的含義 答:組內(nèi)方差指因素的同一個(gè)水平下樣本數(shù)據(jù)的方差;組間方差指因素的不同水平下各個(gè)樣本之間的方差。10.9 簡(jiǎn)述方差分析的基本步驟 答:(1)提出假設(shè) (2)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量 (3)統(tǒng)計(jì)決策10.10 方差分析中多重比較的作用是什么? 答:通過對(duì)總體均值之間的配對(duì)比較來進(jìn)一步檢驗(yàn)?zāi)男┚抵g存在差異。二、練習(xí)題10.1 解: 方差分析差異源ssdfmsfp-value組間618.91672309.4583
33、4.65740.04087724組內(nèi)598966.44444總計(jì)1216.91711相同10.2 解:方差分析差異源ssdfmsfp-value組間93.76812423.4420315.823371.02431e-05組內(nèi)26.66667181.481481總計(jì)120.434822不相同10.3 解:anova每桶容量(l) 平方和df均方f顯著性組間0.00730.0028.7210.001組內(nèi)0.004150.000總數(shù)0.01118不相同。10.4 解: 方差分析差異源ssdfmsfp-value組間29.60952214.8047611.755730.000849組內(nèi)18.89048
34、151.259365總計(jì)48.517有顯著性差異。10.5 解:方差分析差異源ssdfmsfp-value組間615.62307.817.068390.00031組內(nèi)216.41218.03333總計(jì)83214有顯著差異。lsd檢驗(yàn):計(jì)算得,有因?yàn)?,則決策:(1),所以a生產(chǎn)企業(yè)生產(chǎn)的電池與b生產(chǎn)企業(yè)生產(chǎn)的電池平均壽命有顯著差異;(2),所以不能認(rèn)為a生產(chǎn)企業(yè)生產(chǎn)的電池與c生產(chǎn)企業(yè)生產(chǎn)的電池平均壽命有顯著差異;(3),所以b生產(chǎn)企業(yè)生產(chǎn)的電池與c生產(chǎn)企業(yè)生產(chǎn)的電池平均壽命有顯著差異。10.6 解:方差分析差異源ssdfmsfp-value組間5.34915622.6745788.2745180
35、.001962組內(nèi)7.434306230.323231總計(jì)12.7834625有顯著性差異107 (1) 方差分析表差異源ssdfmsfp-valuef crit組間42022101.478102190.2459463.354131組內(nèi)383627142.0740741總計(jì)425629 (2)若顯著性水平a=0.05,檢驗(yàn)三種方法組裝的產(chǎn)品數(shù)量之間是否有顯著差異?p=0.025a=0.05,沒有顯著差異。10.8 解:方差分析差異源ssdfmsfp-valuef crit行1.54933340.38733321.719630.0002367.006077列3.48421.74297.68224
36、2.39e-068.649111誤差0.14266780.017833總計(jì)5.17614(1)或p=0.000236<,所以不同車速對(duì)磨損程度有顯著性差異;(2) 或p=2.39e-06<,所以不同供應(yīng)商生產(chǎn)的輪胎的磨損程度有顯著性差異。10.9 解: 方差分析差異源ssdfmsfp-valuef crit行19.06744.766757.2397160.0033153.259167列18.181536.06059.2046580.0019493.490295誤差7.901120.658417總計(jì)45.149519結(jié)果表明施肥方法和品種都對(duì)收獲量有顯著影響。10.10 解:方差分析
37、差異源ssdfmsfp-valuef crit行22.22222211.111110.0727270.9310566.944272列955.55562477.77783.1272730.1521556.944272誤差611.11114152.7778總計(jì)1588.8898(1)或p=0.931056>,所以不同銷售地區(qū)對(duì)食品的銷售量無顯著性差異;(2) 或p=0.152>,所以不同包裝對(duì)食品的銷售量無顯著性差異。10.11 解:方差分析差異源ssdfmsfp-valuef crit樣本1752287648.666675.49e-086.012905列798239922.16667
38、1.4e-056.012905交互182.6667445.666672.5370370.0759024.579036內(nèi)部3241818總計(jì)3056.66726(1) 競(jìng)爭(zhēng)者的數(shù)量對(duì)銷售額有顯著影響(2) 超市位置對(duì)銷售額有顯著影響(3) 無交互作用10.12 解:方差分析差異源ssdfmsfp-valuef crit樣本344217210.750.0103865.143253列4814830.1339755.987378交互562281.750.2519325.143253內(nèi)部96616總計(jì)54411(1) 廣告方案對(duì)銷售量有顯著影響(2) 廣告媒體形式對(duì)銷售量無顯著影響(3) 無交互作用第1
39、1章 一元線性回歸一、思考題111變量之間存在的互相依存的不確定的數(shù)量關(guān)系,稱為相關(guān)關(guān)系。相關(guān)關(guān)系的特點(diǎn):變量之間確實(shí)存在著數(shù)量上的依存關(guān)系;變量之間數(shù)量上的關(guān)系是不確定、不嚴(yán)格的依存關(guān)系。112相關(guān)分析通過對(duì)兩個(gè)變量之間的線性關(guān)系的描述與度量,主要解決的問題包括:變量之間是否存在關(guān)系?如果存在關(guān)系,它們之間是什么樣的關(guān)系?變量之間的關(guān)系強(qiáng)度如何?樣本所反映的變量之間的關(guān)系能否代表總體變量之間的關(guān)系?113在進(jìn)行相關(guān)分析時(shí),對(duì)總體主要有以下兩個(gè)假定:兩個(gè)變量之間是線性關(guān)系;兩個(gè)變量都是隨機(jī)變量。114相關(guān)系數(shù)的性質(zhì):r的取值范圍是-1,1,r為正表示正相關(guān),r為負(fù)表示負(fù)相關(guān),r絕對(duì)值的大小表示
40、相關(guān)程度的高低;對(duì)稱性:x與y的相關(guān)系數(shù)和y與x之間的相關(guān)系數(shù)相等;相關(guān)系數(shù)與原點(diǎn)和尺度無關(guān);相關(guān)系數(shù)是線性關(guān)聯(lián)或線性相依的一個(gè)度量,它不能用于描述非線性關(guān)系;相關(guān)系數(shù)只是兩個(gè)變量之間線性關(guān)聯(lián)的一個(gè)度量,卻不一定意味兩個(gè)變量之間有因果關(guān)系;若x與y統(tǒng)計(jì)上獨(dú)立,則它們之間的相關(guān)系數(shù)為零;但r=0不等于說兩個(gè)變量是獨(dú)立的。即零相關(guān)并不一定意味著獨(dú)立性。115在實(shí)際的客觀現(xiàn)象分析研究中,相關(guān)系數(shù)一般都是利用樣本數(shù)據(jù)計(jì)算的,因而帶有一定的隨機(jī)性。樣本容量越小,其可信程度就越差,抽取的樣本不同,r的取值也會(huì)不同,因此r是一個(gè)隨機(jī)變量。能否用樣本相關(guān)系數(shù)來反映總體的相關(guān)程度,需要考察樣本相關(guān)系數(shù)的可靠性,
41、因此要進(jìn)行顯著性檢驗(yàn)。116相關(guān)系數(shù)顯著性檢驗(yàn)的步驟:提出假設(shè);計(jì)算檢驗(yàn)統(tǒng)計(jì)量t值;在給定的顯著性水平和自由度,查t分布表中相應(yīng)的臨界值,作出決策。117回歸模型是對(duì)統(tǒng)計(jì)關(guān)系進(jìn)行定量描述的一種數(shù)學(xué)模型,例如:對(duì)于具有線性關(guān)系的兩個(gè)變量,可以有一元線性方程來描述它們之間的關(guān)系,描述因變量y如何依賴自變量x和誤差項(xiàng)的方程稱為回歸模型?;貧w方程是對(duì)變量之間統(tǒng)計(jì)關(guān)系進(jìn)行定量描述的一種數(shù)學(xué)表達(dá)式。指具有相關(guān)的隨機(jī)變量和固定變量之間關(guān)系的方程。當(dāng)總體回歸系數(shù)未知時(shí),必須用樣本數(shù)據(jù)去估計(jì),用樣本統(tǒng)計(jì)量代替回歸方程中的未知參數(shù),就得到了估計(jì)的回歸方程。118一元線性回歸模型通常有以下幾條基本的假定:變量之間存
42、在線性關(guān)系;在重復(fù)抽樣中,自變量x的取值是固定的;誤差項(xiàng)是一個(gè)期望為零的隨機(jī)變量;)對(duì)于所有的x值,誤差項(xiàng)的方差都相同;誤差項(xiàng)是一個(gè)服從正態(tài)分布的隨機(jī)變量,且相互獨(dú)立。即。119參數(shù)最小二乘法的基本原理是:因變量的觀測(cè)值與估計(jì)值之間的離差平方和最小。1110總平方和指n次觀測(cè)值的的離差平方和,衡量的是被解釋變量y波動(dòng)的程度或不確定性的程度?;貧w平方和反映y的總變差中由于x與y之間的線性關(guān)系引起的y的變化部分,這是可以由回歸直線來解釋的部分,衡量的是被解釋變量y不確定性程度中能被解釋變量x解釋的部分。殘差平方和是除了x對(duì)y的線性影響之外的其他因素引起的y的變化部分,是不能由回歸直線來解釋的部分。
43、它們之間的關(guān)系是: 總平方和=回歸平方和 + 殘差平方和。 1111回歸平方和占總平方和的比例稱為判定系數(shù)。判定系數(shù)測(cè)量了回歸直線對(duì)觀測(cè)數(shù)據(jù)的擬合程度。1112在回歸分析中,f檢驗(yàn)是為檢驗(yàn)自變量和因變量之間的線性關(guān)系是否顯著,通過均方回歸與均方殘差之比,構(gòu)造f檢驗(yàn)統(tǒng)計(jì)量,提出假設(shè),根據(jù)顯著性水平,作出判斷。t檢驗(yàn)是回歸系數(shù)的顯著性檢驗(yàn),要檢驗(yàn)自變量對(duì)因變量的影響是否顯著,通過構(gòu)造t檢驗(yàn)統(tǒng)計(jì)量,提出假設(shè),根據(jù)顯著性水平,作出判斷。1113線性關(guān)系檢驗(yàn)的步驟:提出假設(shè);構(gòu)造f檢驗(yàn)統(tǒng)計(jì)量;根據(jù)顯著性水平,作出判斷?;貧w系數(shù)檢驗(yàn)的步驟:提出假設(shè);構(gòu)造t檢驗(yàn)統(tǒng)計(jì)量;根據(jù)顯著性水平,作出判斷。1114回歸
44、分析結(jié)果的評(píng)價(jià)可以從以下幾個(gè)方面:回歸系數(shù)的符號(hào)是否與理論或事先預(yù)期相一致;自變量與因變量之間的線性關(guān)系,在統(tǒng)計(jì)上是否顯著;根據(jù)判定系數(shù)的大小,判斷回歸模型解釋因變量取值差異的程度;誤差項(xiàng)的正態(tài)假定是否成立。1115置信區(qū)間估計(jì)是對(duì)x的一個(gè)給定值,求出y的平均值的區(qū)間估計(jì)。預(yù)測(cè)區(qū)間估計(jì)是對(duì)x的一個(gè)給定值,求出y的一個(gè)個(gè)別值的區(qū)間估計(jì)。二者的區(qū)別是:置信區(qū)間估計(jì)的區(qū)間長(zhǎng)度通常較短,而預(yù)測(cè)區(qū)間估計(jì)的區(qū)間長(zhǎng)度要長(zhǎng),也就是說,估計(jì)y的平均值比預(yù)測(cè)y的一個(gè)特定值或個(gè)別值更精確。1116殘差分析在回歸分析中的作用:回歸分析是確定兩種或兩種以上變量間的定量關(guān)系的一種統(tǒng)計(jì)分析方法判斷回歸模型的擬合效果是回歸分
45、析的重要內(nèi)容,在回歸分析中,通常用殘差分析來判斷回歸模型的擬合效果,并判定關(guān)于誤差項(xiàng)的正態(tài)假設(shè)是否成立。二、練習(xí)題111(1)散點(diǎn)圖如下:從散點(diǎn)圖可以看出,產(chǎn)量與生產(chǎn)費(fèi)用之間為正的線性相關(guān)關(guān)系。(2)利用excel的“correl”函數(shù)計(jì)算的相關(guān)系數(shù)為。(3)首先提出如下假設(shè):,。計(jì)算檢驗(yàn)的統(tǒng)計(jì)量 當(dāng)時(shí),。由于檢驗(yàn)統(tǒng)計(jì)量,拒絕原假設(shè)。表明產(chǎn)量與生產(chǎn)費(fèi)用之間的線性關(guān)系顯著。112(1)散點(diǎn)圖如下:從散點(diǎn)圖可以看出,復(fù)習(xí)時(shí)間與考試分?jǐn)?shù)之間為正的線性相關(guān)關(guān)系。(2)利用excel的“correl”函數(shù)計(jì)算的相關(guān)系數(shù)為。相關(guān)系數(shù),表明復(fù)習(xí)時(shí)間與考試分?jǐn)?shù)之間有較強(qiáng)的正線性相關(guān)關(guān)系。113.(1)表示當(dāng)時(shí)的期望值為10。(2)表示每增加一個(gè)單位,平均下降0.5個(gè)單位。(3)時(shí),。14(1)表示,在因變量取值的變差中,有90%可以由與之間的線性關(guān)系來解釋。(2)表示,當(dāng)用來預(yù)測(cè)時(shí),平均的預(yù)測(cè)誤差為0.5。115(1)散點(diǎn)圖如下:從散點(diǎn)圖可以看出,運(yùn)送距離與運(yùn)送時(shí)間之
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 有關(guān)道德的課程設(shè)計(jì)
- 格柵排污機(jī)課程設(shè)計(jì)
- 2024年肉羊養(yǎng)殖與電商平臺(tái)數(shù)據(jù)共享購(gòu)銷協(xié)議2篇
- 2024年私人定制無人機(jī)攝影合同3篇
- 電工電子課程設(shè)計(jì)臺(tái)燈
- 2024年版建設(shè)工程施工合同
- 2024年新型擔(dān)保借款協(xié)議范本及風(fēng)險(xiǎn)評(píng)估報(bào)告3篇
- 粘土烘干機(jī)課程設(shè)計(jì)
- 2024年汽車金融合約3篇
- 用戶成長(zhǎng)課程設(shè)計(jì)
- 2024年02月天津市口腔醫(yī)院派遣制人員招考聘用40人筆試歷年(2016-2023年)真題薈萃帶答案解析
- 評(píng)判創(chuàng)業(yè)計(jì)劃書
- 銀行信訪工作培訓(xùn)課件
- 北京市西城區(qū)2023-2024學(xué)年部編版七年級(jí)上學(xué)期期末歷史試卷
- 廣東省博物館
- 徐州市2023-2024學(xué)年九年級(jí)上學(xué)期期末道德與法治試卷(含答案解析)
- 農(nóng)業(yè)信息化實(shí)現(xiàn)農(nóng)業(yè)現(xiàn)代化的數(shù)字化轉(zhuǎn)型
- 《義務(wù)教育道德與法治課程標(biāo)準(zhǔn)(2022年版)》
- 學(xué)校食堂廚房規(guī)范化操作程序
- 醫(yī)保飛檢工作方案
- 招投標(biāo)基礎(chǔ)知識(shí)講解
評(píng)論
0/150
提交評(píng)論