版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
.PAGE.v第三章節(jié):數(shù)據(jù)的圖表展示…………………1第四章節(jié):數(shù)據(jù)的概括性度量………………15第六章節(jié):統(tǒng)計量及其抽樣分布……………26第七章節(jié):參數(shù)估計…………28第八章節(jié):假設(shè)檢驗…………38第九章節(jié):列聯(lián)分析…………41第十章節(jié):方差分析…………433.1為評價家電行業(yè)售后服務(wù)的質(zhì)量,隨機抽取了由100個家庭構(gòu)成的一個樣本。服務(wù)質(zhì)量的等級分別表示為:A.好;B.較好;C一般;D.較差;E.差。調(diào)查結(jié)果如下:BECCADCBAEDACBCDECEEADBCCAEDCBBACDEABDDCCBCEDBCCBCDACBCDECEBBECCADCBAEBACEEABDDCADBCCAEDCBCBCEDBCCBC要求:(1)指出上面的數(shù)據(jù)屬于什么類型。順序數(shù)據(jù)(2)用Excel制作一張頻數(shù)分布表。用數(shù)據(jù)分析——直方圖制作:接收頻率E16D17C32B21A14(3)繪制一張條形圖,反映評價等級的分布。用數(shù)據(jù)分析——直方圖制作:(4)繪制評價等級的帕累托圖。逆序排序后,制作累計頻數(shù)分布表:接收頻數(shù)頻率(%)累計頻率(%)C323232B212153D171770E161686A14141003.2某行業(yè)管理局所屬40個企業(yè)2002年的產(chǎn)品銷售收入數(shù)據(jù)如下:1521241291161001039295127104105119114115871031181421351251171081051101071371201361171089788123115119138112146113126要求:(1)根據(jù)上面的數(shù)據(jù)進行適當?shù)姆纸M,編制頻數(shù)分布表,并計算出累積頻數(shù)和累積頻率。1、確定組數(shù):,取k=62、確定組距:組距=(最大值-最小值)÷組數(shù)=(152-87)÷6=10.83,取103、分組頻數(shù)表銷售收入頻數(shù)頻率%累計頻數(shù)累計頻率%80.00-89.0025.025.090.00-99.0037.5512.5100.00-109.00922.51435.0110.00-119.001230.02665.0120.00-129.00717.53382.5130.00-139.00410.03792.5140.00-149.0025.03997.5150.00+12.540100.0總和40100.0(2)按規(guī)定,銷售收入在125萬元以上為先進企業(yè),115~125萬元為良好企業(yè),105~115萬元為一般企業(yè),105萬元以下為落后企業(yè),按先進企業(yè)、良好企業(yè)、一般企業(yè)、落后企業(yè)進行分組。頻數(shù)頻率%累計頻數(shù)累計頻率%先進企業(yè)1025.01025.0良好企業(yè)1230.02255.0一般企業(yè)922.53177.5落后企業(yè)922.540100.0總和40100.03.3某百貨公司連續(xù)40天的商品銷售額如下:單位:萬元41252947383430384340463645373736454333443528463430374426384442363737493942323635要求:根據(jù)上面的數(shù)據(jù)進行適當?shù)姆纸M,編制頻數(shù)分布表,并繪制直方圖。1、確定組數(shù):,取k=62、確定組距:組距=(最大值-最小值)÷組數(shù)=(49-25)÷6=4,取53、分組頻數(shù)表銷售收入(萬元)頻數(shù)頻率%累計頻數(shù)累計頻率%<=2512.512.526-30512.5615.031-35615.01230.036-401435.02665.041-451025.03690.046+410.040100.0總和40100.03.4利用下面的數(shù)據(jù)構(gòu)建莖葉圖和箱線圖。572929363123472328283551391846182650293321464152282143194220dataStem-and-LeafPlotFrequencyStem&Leaf3.001.8895.002.011337.002.68889992.003.133.003.5693.004.1233.004.6673.005.0121.005.7Stemwidth:10Eachleaf:1case(s)3.6一種袋裝食品用生產(chǎn)線自動裝填,每袋重量大約為50g,但由于某些原因,每袋重量不會恰好是50g。下面是隨機抽取的100袋食品,測得的重量數(shù)據(jù)如下:單位:g57464954555849615149516052545155605647475351485350524045575352514648475347534447505253474548545248464952595350435346574949445752424943474648515945454652554749505447484457475358524855535749565657534148要求:(1)構(gòu)建這些數(shù)據(jù)的頻數(shù)分布表。(2)繪制頻數(shù)分布的直方圖。(3)說明數(shù)據(jù)分布的特征。解:(1)根據(jù)上面的數(shù)據(jù)進行適當?shù)姆纸M,編制頻數(shù)分布表,并計算出累積頻數(shù)和累積頻率。1、確定組數(shù):,取k=6或72、確定組距:組距=(最大值-最小值)÷組數(shù)=(61-40)÷6=3.5,取3或者4、5組距=(最大值-最小值)÷組數(shù)=(61-40)÷7=3,3、分組頻數(shù)表組距3,上限為小于頻數(shù)百分比累計頻數(shù)累積百分比有效40.00-42.0033.033.043.00-45.0099.01212.046.00-48.002424.03636.049.00-51.001919.05555.052.00-54.002424.07979.055.00-57.001414.09393.058.00+77.0100100.0合計100100.0直方圖:組距4,上限為小于等于頻數(shù)百分比累計頻數(shù)累積百分比有效<=40.0011.011.041.00-44.0077.088.045.00-48.002828.03636.049.00-52.002828.06464.053.00-56.002222.08686.057.00-60.001313.09999.061.00+11.0100100.0合計100100.0直方圖:組距5,上限為小于等于頻數(shù)百分比累計頻數(shù)累積百分比有效<=45.001212.012.012.046.00-50.003737.049.049.051.00-55.003434.083.083.056.00-60.001616.099.099.061.00+11.0100.0100.0合計100100.0直方圖:分布特征:左偏鐘型。3.8下面是北方某城市1——2月份各天氣溫的記錄數(shù)據(jù):-32-4-7-11-1789-614-18-15-9-6-105-4-96-8-12-16-19-15-22-25-24-19-8-6-15-11-12-19-25-24-18-17-14-22-13-9-60-15-4-9-32-4-4-16-175-6-5要求:(1)指出上面的數(shù)據(jù)屬于什么類型。數(shù)值型數(shù)據(jù)(2)對上面的數(shù)據(jù)進行適當?shù)姆纸M。1、確定組數(shù):,取k=72、確定組距:組距=(最大值-最小值)÷組數(shù)=(14-(-25))÷7=5.57,取53、分組頻數(shù)表溫度頻數(shù)頻率%累計頻數(shù)累計頻率%-25--21610.0610.0-20--16813.31423.3-15--11915.02338.3-10--61220.03558.3-5--11220.04778.30-446.75185.05-9813.35998.310+11.760100.0合計60100.0(3)繪制直方圖,說明該城市氣溫分布的特點。3.11對于下面的數(shù)據(jù)繪制散點圖。x234187y252520301618解:3.12甲乙兩個班各有40名學(xué)生,期末統(tǒng)計學(xué)考試成績的分布如下:考試成績?nèi)藬?shù)甲班乙班優(yōu)良中及格不及格361894615982要求:(1)根據(jù)上面的數(shù)據(jù),畫出兩個班考試成績的對比條形圖和環(huán)形圖。(2)比較兩個班考試成績分布的特點。甲班成績中的人數(shù)較多,高分和低分人數(shù)比乙班多,乙班學(xué)習(xí)成績較甲班好,高分較多,而低分較少。(3)畫出雷達圖,比較兩個班考試成績的分布是否相似。分布不相似。3.14已知1995—2004年我國的國內(nèi)生產(chǎn)總值數(shù)據(jù)如下(按當年價格計算):單位:億元年份國內(nèi)生產(chǎn)總值第一產(chǎn)業(yè)第二產(chǎn)業(yè)第三產(chǎn)業(yè)199519961997199819992000200120022003200458478.167884.674462.678345.282067.589468.197314.8105172.3117390.2136875.91199313844.214211.214552.414471.9614628.215411.816117.316928.120768.072853833613372233861940558449354875052980612747238717947204282302925174270382990533153360753918843721要求:(1)用Excel繪制國內(nèi)生產(chǎn)總值的線圖。(2)繪制第一、二、三產(chǎn)業(yè)國內(nèi)生產(chǎn)總值的線圖。(3)根據(jù)2004年的國內(nèi)生產(chǎn)總值及其構(gòu)成數(shù)據(jù)繪制餅圖。
第四章統(tǒng)計數(shù)據(jù)的概括性描述4.1一家汽車零售店的10名銷售人員5月份銷售的汽車數(shù)量(單位:臺)排序后如下:24710101012121415要求:(1)計算汽車銷售量的眾數(shù)、中位數(shù)和平均數(shù)。(2)根據(jù)定義公式計算四分位數(shù)。(3)計算銷售量的標準差。(4)說明汽車銷售量分布的特征。解:Statistics汽車銷售數(shù)量NValid10Missing0Mean9.60Median10.00Mode10Std.Deviation4.169Percentiles256.255010.007512.504.2隨機抽取25個網(wǎng)絡(luò)用戶,得到他們的年齡數(shù)據(jù)如下:單位:周歲19152925242321382218302019191623272234244120311723要求;(1)計算眾數(shù)、中位數(shù):1、排序形成單變量分值的頻數(shù)分布和累計頻數(shù)分布:網(wǎng)絡(luò)用戶的年齡FrequencyPercentCumulativeFrequencyCumulativePercentValid1514.014.01614.028.01714.0312.01814.0416.019312.0728.02028.0936.02114.01040.02228.01248.023312.01560.02428.01768.02514.01872.02714.01976.02914.02080.03014.02184.03114.02288.03414.02392.03814.02496.04114.025100.0Total25100.0從頻數(shù)看出,眾數(shù)Mo有兩個:19、23;從累計頻數(shù)看,中位數(shù)Me=23。(2)根據(jù)定義公式計算四分位數(shù)。Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一個,因此Q3也可等于25+0.75×2=26.5。(3)計算平均數(shù)和標準差;Mean=24.00;Std.Deviation=6.652(4)計算偏態(tài)系數(shù)和峰態(tài)系數(shù):Skewness=1.080;Kurtosis=0.773(5)對網(wǎng)民年齡的分布特征進行綜合分析:分布,均值=24、標準差=6.652、呈右偏分布。如需看清楚分布形態(tài),需要進行分組。為分組情況下的直方圖:為分組情況下的概率密度曲線:分組:1、確定組數(shù):,取k=62、確定組距:組距=(最大值-最小值)÷組數(shù)=(41-15)÷6=4.3,取53、分組頻數(shù)表網(wǎng)絡(luò)用戶的年齡(Binned)FrequencyPercentCumulativeFrequencyCumulativePercentValid<=1514.014.016-20832.0936.021-25936.01872.026-30312.02184.031-3528.02392.036-4014.02496.041+14.025100.0Total25100.0分組后的均值與方差:Mean23.3000Std.Deviation7.02377Variance49.333Skewness1.163Kurtosis1.302分組后的直方圖:4.3某銀行為縮短顧客到銀行辦理業(yè)務(wù)等待的時間。準備采用兩種排隊方式進行試驗:一種是所有頤客都進入一個等待隊列:另—種是顧客在三千業(yè)務(wù)窗口處列隊3排等待。為比較哪種排隊方式使顧客等待的時間更短.兩種排隊方式各隨機抽取9名顧客。得到第一種排隊方式的平均等待時間為7.2分鐘,標準差為1.97分鐘。第二種排隊方式的等待時間(單位:分鐘)如下:5.56.66.76.87.17.37.47.87.8要求:(1)畫出第二種排隊方式等待時間的莖葉圖。第二種排隊方式的等待時間(單位:分鐘)Stem-and-LeafPlotFrequencyStem&Leaf1.00Extremes(=<5.5)3.006.6783.007.1342.007.88Stemwidth:1.00Eachleaf:1case(s)(2)計算第二種排隊時間的平均數(shù)和標準差。Mean7Std.Deviation0.714143Variance0.51(3)比較兩種排隊方式等待時間的離散程度。第二種排隊方式的離散程度小。(4)如果讓你選擇一種排隊方式,你會選擇哪—種.試說明理由。選擇第二種,均值小,離散程度小。4.4某百貨公司6月份各天的銷售額數(shù)據(jù)如下:單位:萬元257276297252238310240236265278271292261281301274267280291258272284268303273263322249269295要求:(1)計算該百貨公司日銷售額的平均數(shù)和中位數(shù)。(2)按定義公式計算四分位數(shù)。(3)計算日銷售額的標準差。解:Statistics百貨公司每天的銷售額(萬元)NValid30Missing0Mean274.1000Median272.5000Std.Deviation21.17472Percentiles25260.250050272.500075291.25004.5甲乙兩個企業(yè)生產(chǎn)三種產(chǎn)品的單位成本和總成本資料如下:產(chǎn)品單位成本總成本(元)名稱(元)甲企業(yè)乙企業(yè)ABC152030210030001500325515001500要求:比較兩個企業(yè)的總平均成本,哪個高,并分析其原因。產(chǎn)品名稱單位成本(元)甲企業(yè)乙企業(yè)總成本(元)產(chǎn)品數(shù)總成本(元)產(chǎn)品數(shù)A1521001403255217B203000150150075C30150050150050平均成本(元)19.4117647118.28947368調(diào)和平均數(shù)計算,得到甲的平均成本為19.41;乙的平均成本為18.29。甲的中間成本的產(chǎn)品多,乙的低成本的產(chǎn)品多。4.6在某地區(qū)抽取120家企業(yè),按利潤額進行分組,結(jié)果如下:按利潤額分組(萬元)企業(yè)數(shù)(個)200~300300~400400~500500~600600以上1930421811合計120要求:(1)計算120家企業(yè)利潤額的平均數(shù)和標準差。(2)計算分布的偏態(tài)系數(shù)和峰態(tài)系數(shù)。解:Statistics企業(yè)利潤組中值Mi(萬元)NValid120Missing0Mean426.6667Std.Deviation116.48445Skewness0.208Std.ErrorofSkewness0.221Kurtosis-0.625Std.ErrorofKurtosis0.4384.7為研究少年兒童的成長發(fā)育狀況,某研究所的一位調(diào)查人員在某城市抽取100名7~17歲的少年兒童作為樣本,另一位調(diào)查人員則抽取了1000名7~17歲的少年兒童作為樣本。請回答下面的問題,并解釋其原因。(1)兩位調(diào)查人員所得到的樣本的平均身高是否相同"如果不同,哪組樣本的平均身高較大"(2)兩位調(diào)查人員所得到的樣本的標準差是否相同"如果不同,哪組樣本的標準差較大"(3)兩位調(diào)查人員得到這l100名少年兒童身高的最高者或最低者的機會是否相同"如果不同,哪位調(diào)查研究人員的機會較大"解:(1)不一定相同,無法判斷哪一個更高,但可以判斷,樣本量大的更接近于總體平均身高。(2)不一定相同,樣本量少的標準差大的可能性大。(3)機會不相同,樣本量大的得到最高者和最低者的身高的機會大。4.8一項關(guān)于大學(xué)生體重狀況的研究發(fā)現(xiàn).男生的平均體重為60kg,標準差為5kg;女生的平均體重為50kg,標準差為5kg。請回答下面的問題:(1)是男生的體重差異大還是女生的體重差異大"為什么"女生,因為標準差一樣,而均值男生大,所以,離散系數(shù)是男生的小,離散程度是男生的小。(2)以磅為單位(1ks=2.2lb),求體重的平均數(shù)和標準差。都是各乘以2.21,男生的平均體重為60kg×2.21=132.6磅,標準差為5kg×2.21=11.05磅;女生的平均體重為50kg×2.21=110.5磅,標準差為5kg×2.21=11.05磅。(3)粗略地估計一下,男生中有百分之幾的人體重在55kg一65kg之間"計算標準分數(shù):Z1===-1;Z2===1,根據(jù)經(jīng)驗規(guī)則,男生大約有68%的人體重在55kg一65kg之間。(4)粗略地估計一下,女生中有百分之幾的人體重在40kg~60kg之間"計算標準分數(shù):Z1===-2;Z2===2,根據(jù)經(jīng)驗規(guī)則,女生大約有95%的人體重在40kg一60kg之間。4.9一家公司在招收職員時,首先要通過兩項能力測試。在A項測試中,其平均分數(shù)是100分,標準差是15分;在B項測試中,其平均分數(shù)是400分,標準差是50分。一位應(yīng)試者在A項測試中得了115分,在B項測試中得了425分。與平均分數(shù)相比,該應(yīng)試者哪一項測試更為理想"解:應(yīng)用標準分數(shù)來考慮問題,該應(yīng)試者標準分數(shù)高的測試理想。ZA===1;ZB===0.5因此,A項測試結(jié)果理想。4.10一條產(chǎn)品生產(chǎn)線平均每天的產(chǎn)量為3700件,標準差為50件。如果某一天的產(chǎn)量低于或高于平均產(chǎn)量,并落人士2個標準差的范圍之外,就認為該生產(chǎn)線“失去控制”。下面是一周各天的產(chǎn)量,該生產(chǎn)線哪幾天失去了控制"時間周一周二周三周四周五周六周日產(chǎn)量(件)3850367036903720361035903700時間周一周二周三周四周五周六周日產(chǎn)量(件)3850367036903720361035903700日平均產(chǎn)量3700日產(chǎn)量標準差50標準分數(shù)Z3-0.6-0.20.4-1.8-2.20標準分數(shù)界限-2-2-2-2-2-2-22222222周六超出界限,失去控制。4.11對10名成年人和10名幼兒的身高進行抽樣調(diào)查,結(jié)果如下:成年組166169l72177180170172174168173幼兒組686968707l7372737475要求:(1)如果比較成年組和幼兒組的身高差異,你會采用什么樣的統(tǒng)計量"為什么"均值不相等,用離散系數(shù)衡量身高差異。(2)比較分析哪一組的身高差異大"成年組幼兒組平均172.1平均71.3標準差4.201851標準差2.496664離散系數(shù)0.024415離散系數(shù)0.035016幼兒組的身高差異大。4.12一種產(chǎn)品需要人工組裝,現(xiàn)有三種可供選擇的組裝方法。為檢驗?zāi)姆N方法更好,隨機抽取15個工人,讓他們分別用三種方法組裝。下面是15個工人分別用三種方法在相同的時間內(nèi)組裝的產(chǎn)品數(shù)量:單位:個方法A方法B方法C164167168165170165164168164162163166167166165129130129130131]30129127128128127128128125132125126126127126128127126127127125126116126125要求:(1)你準備采用什么方法來評價組裝方法的優(yōu)劣"(2)如果讓你選擇一種方法,你會作出怎樣的選擇"試說明理由。解:對比均值和離散系數(shù)的方法,選擇均值大,離散程度小的。方法A方法B方法C平均165.6平均128.7333333平均125.5333333標準差2.131397932標準差1.751190072標準差2.774029217離散系數(shù):VA=0.01287076,VB=0.013603237,VC=0.022097949均值A(chǔ)方法最大,同時A的離散系數(shù)也最小,因此選擇A方法。4.13在金融證券領(lǐng)域,一項投資的預(yù)期收益率的變化通常用該項投資的風(fēng)險來衡量。預(yù)期收益率的變化越小,投資風(fēng)險越低;預(yù)期收益率的變化越大,投資風(fēng)險就越高。下面的兩個直方圖,分別反映了200種商業(yè)類股票和200種高科技類股票的收益率分布。在股票市場上,高收益率往往伴隨著高風(fēng)險。但投資于哪類股票,往往與投資者的類型有一定關(guān)系。(1)你認為該用什么樣的統(tǒng)計量來反映投資的風(fēng)險"標準差或者離散系數(shù)。(2)如果選擇風(fēng)險小的股票進行投資,應(yīng)該選擇商業(yè)類股票還是高科技類股票"選擇離散系數(shù)小的股票,則選擇商業(yè)股票。(3)如果進行股票投資,你會選擇商業(yè)類股票還是高科技類股票"考慮高收益,則選擇高科技股票;考慮風(fēng)險,則選擇商業(yè)股票。
6.1調(diào)節(jié)一個裝瓶機使其對每個瓶子的灌裝量均值為盎司,通過觀察這臺裝瓶機對每個瓶子的灌裝量服從標準差盎司的正態(tài)分布。隨機抽取由這臺機器灌裝的9個瓶子形成一個樣本,并測定每個瓶子的灌裝量。試確定樣本均值偏離總體均值不超過0.3盎司的概率。解:總體方差知道的情況下,均值的抽樣分布服從的正態(tài)分布,由正態(tài)分布,標準化得到標準正態(tài)分布:z=~,因此,樣本均值不超過總體均值的概率P為:====2-1,查標準正態(tài)分布表得=0.8159因此,=0.63186.3,,……,表示從標準正態(tài)總體中隨機抽取的容量,n=6的一個樣本,試確定常數(shù)b,使得解:由于卡方分布是由標準正態(tài)分布的平方和構(gòu)成的:設(shè)Z1,Z2,……,Zn是來自總體N(0,1)的樣本,則統(tǒng)計量服從自由度為n的χ2分布,記為χ2~χ2(n)因此,令,則,那么由概率,可知:b=,查概率表得:b=12.596.4在習(xí)題6.1中,假定裝瓶機對瓶子的灌裝量服從方差的標準正態(tài)分布。假定我們計劃隨機抽取10個瓶子組成樣本,觀測每個瓶子的灌裝量,得到10個觀測值,用這10個觀測值我們可以求出樣本方差,確定一個合適的范圍使得有較大的概率保證S2落入其中是有用的,試求b1,b2,使得解:更加樣本方差的抽樣分布知識可知,樣本統(tǒng)計量:此處,n=10,,所以統(tǒng)計量根據(jù)卡方分布的可知:又因為:因此:則:查概率表:=3.325,=19.919,則=0.369,=1.887.2某快餐店想要估計每位顧客午餐的平均花費金額。在為期3周的時間里選取49名顧客組成了一個簡單隨機樣本。(1)假定總體標準差為15元,求樣本均值的抽樣標準誤差。=2.143(2)在95%的置信水平下,求邊際誤差。,由于是大樣本抽樣,因此樣本均值服從正態(tài)分布,因此概率度t=因此,=1.96×2.143=4.2(3)如果樣本均值為120元,求總體均值的95%的置信區(qū)間。置信區(qū)間為:==(115.8,124.2)7.4從總體中抽取一個n=100的簡單隨機樣本,得到=81,s=12。要求:大樣本,樣本均值服從正態(tài)分布:或置信區(qū)間為:,==1.2(1)構(gòu)建的90%的置信區(qū)間。==1.645,置信區(qū)間為:=(79.03,82.97)(2)構(gòu)建的95%的置信區(qū)間。==1.96,置信區(qū)間為:=(78.65,83.35)(3)構(gòu)建的99%的置信區(qū)間。==2.576,置信區(qū)間為:=(77.91,84.09)7.7某大學(xué)為了解學(xué)生每天上網(wǎng)的時間,在全校7500名學(xué)生中采取重復(fù)抽樣方法隨機抽取36人,調(diào)查他們每天上網(wǎng)的時間,得到下面的數(shù)據(jù)(單位:小時):3.33.16.25.82.34.15.44.53.24.42.05.42.66.41.83.55.72.32.11.91.25.14.34.23.60.81.54.71.41.22.93.52.40.53.62.5求該校大學(xué)生平均上網(wǎng)時間的置信區(qū)間,置信水平分別為90%,95%和99%。解:(1)樣本均值=3.32,樣本標準差s=1.61;(2)抽樣平均誤差:重復(fù)抽樣:==1.61/6=0.268不重復(fù)抽樣:===0.268×=0.268×0.998=0.267(3)置信水平下的概率度:=0.9,t===1.645=0.95,t===1.96=0.99,t===2.576(4)邊際誤差(極限誤差):=0.9,=重復(fù)抽樣:==1.645×0.268=0.441不重復(fù)抽樣:==1.645×0.267=0.439=0.95,=重復(fù)抽樣:==1.96×0.268=0.525不重復(fù)抽樣:==1.96×0.267=0.523=0.99,=重復(fù)抽樣:==2.576×0.268=0.69不重復(fù)抽樣:==2.576×0.267=0.688(5)置信區(qū)間:=0.9,重復(fù)抽樣:==(2.88,3.76)不重復(fù)抽樣:==(2.88,3.76)=0.95,重復(fù)抽樣:==(2.79,3.85)不重復(fù)抽樣:==(2.80,3.84)=0.99,重復(fù)抽樣:==(2.63,4.01)不重復(fù)抽樣:==(2.63,4.01)7.9某居民小區(qū)為研究職工上班從家里到單位的距離,抽取了由16個人組成的一個隨機樣本,他們到單位的距離(單位:km)分別是:103148691211751015916132假定總體服從正態(tài)分布,求職工上班從家里到單位平均距離的95%的置信區(qū)間。解:小樣本,總體方差未知,用t統(tǒng)計量均值=9.375,樣本標準差s=4.11置信區(qū)間:=0.95,n=16,==2.13==(7.18,11.57)7.11某企業(yè)生產(chǎn)的袋裝食品采用自動打包機包裝,每袋標準重量為l00g?,F(xiàn)從某天生產(chǎn)的一批產(chǎn)品中按重復(fù)抽樣隨機抽取50包進行檢查,測得每包重量(單位:g)如下:每包重量(g)包數(shù)96~9898~100100~102102~104104~106233474合計50已知食品包重量服從正態(tài)分布,要求:(1)確定該種食品平均重量的95%的置信區(qū)間。解:大樣本,總體方差未知,用z統(tǒng)計量樣本均值=101.4,樣本標準差s=1.829置信區(qū)間:=0.95,==1.96==(100.89,101.91)(2)如果規(guī)定食品重量低于l00g屬于不合格,確定該批食品合格率的95%的置信區(qū)間。解:總體比率的估計大樣本,總體方差未知,用z統(tǒng)計量樣本比率=(50-5)/50=0.9置信區(qū)間:=0.95,==1.96==(0.8168,0.9832)7.13一家研究機構(gòu)想估計在網(wǎng)絡(luò)公司工作的員工每周加班的平均時間,為此隨機抽取了18個員工。得到他們每周加班的時間數(shù)據(jù)如下(單位:小時):63218171220117902182516152916假定員工每周加班的時間服從正態(tài)分布。估計網(wǎng)絡(luò)公司員工平均每周加班時間的90%的置信區(qū)間。解:小樣本,總體方差未知,用t統(tǒng)計量均值=13.56,樣本標準差s=7.801置信區(qū)間:=0.90,n=18,==1.7369==(10.36,16.75)7.15在一項家電市場調(diào)查中.隨機抽取了200個居民戶,調(diào)查他們是否擁有某一品牌的電視機。其中擁有該品牌電視機的家庭占23%。求總體比例的置信區(qū)間,置信水平分別為90%和95%。解:總體比率的估計大樣本,總體方差未知,用z統(tǒng)計量樣本比率=0.23置信區(qū)間:=0.90,==1.645==(0.1811,0.2789)=0.95,==1.96==(0.1717,0.2883)7.20顧客到銀行辦理業(yè)務(wù)時往往需要等待一段時間,而等待時間的長短與許多因素有關(guān),比如,銀行業(yè)務(wù)員辦理業(yè)務(wù)的速度,顧客等待排隊的方式等。為此,某銀行準備采取兩種排隊方式進行試驗,第一種排隊方式是:所有顧客都進入一個等待隊列;第二種排隊方式是:顧客在三個業(yè)務(wù)窗口處列隊三排等待。為比較哪種排隊方式使顧客等待的時間更短,銀行各隨機抽取10名顧客,他們在辦理業(yè)務(wù)時所等待的時間(單位:分鐘)如下:方式16.56.66.76.87.17.37.47.77.77.7方式24.25.45.86.26.77.77.78.59.310要求:(1)構(gòu)建第一種排隊方式等待時間標準差的95%的置信區(qū)間。解:估計統(tǒng)計量經(jīng)計算得樣本標準差=3.318置信區(qū)間:=0.95,n=10,==19.02,==2.7==(0.1075,0.7574)因此,標準差的置信區(qū)間為(0.3279,0.8703)(2)構(gòu)建第二種排隊方式等待時間標準差的95%的置信區(qū)間。解:估計統(tǒng)計量經(jīng)計算得樣本標準差=0.2272置信區(qū)間:=0.95,n=10,==19.02,==2.7==(1.57,11.06)因此,標準差的置信區(qū)間為(1.25,3.33)(3)根據(jù)(1)和(2)的結(jié)果,你認為哪種排隊方式更好"第一種方式好,標準差小!7.23下表是由4對觀察值組成的隨機樣本。配對號來自總體A的樣本來自總體B的樣本1234251080765(1)計算A與B各對觀察值之差,再利用得出的差值計算和。=1.75,=2.62996(2)設(shè)分別為總體A和總體B的均值,構(gòu)造的95%的置信區(qū)間。解:小樣本,配對樣本,總體方差未知,用t統(tǒng)計量均值=1.75,樣本標準差s=2.62996置信區(qū)間:=0.95,n=4,==3.182==(-2.43,5.93)7.25從兩個總體中各抽取一個=250的獨立隨機樣本,來自總體1的樣本比例為=40%,來自總體2的樣本比例為=30%。要求:(1)構(gòu)造的90%的置信區(qū)間。(2)構(gòu)造的95%的置信區(qū)間。解:總體比率差的估計大樣本,總體方差未知,用z統(tǒng)計量樣本比率p1=0.4,p2=0.3置信區(qū)間:=0.90,==1.645==(3.02%,16.98%)=0.95,==1.96==(1.68%,18.32%)7.26生產(chǎn)工序的方差是工序質(zhì)量的一個重要度量。當方差較大時,需要對序進行改進以減小方差。下面是兩部機器生產(chǎn)的袋茶重量(單位:g)的數(shù)據(jù):機器1機器23.453.223.93.223.283.353.22.983.73.383.193.33.223.753.283.33.23.053.53.383.353.33.293.332.953.453.23.343.353.273.163.483.123.283.163.283.23.183.253.33.343.25要求:構(gòu)造兩個總體方差比/的95%的置信區(qū)間。解:統(tǒng)計量:置信區(qū)間:=0.058,=0.006n1=n2=21=0.95,==2.4645,====0.4058=(4.05,24.6)7.27根據(jù)以往的生產(chǎn)數(shù)據(jù),某種產(chǎn)品的廢品率為2%。如果要求95%的置信區(qū)間,若要求邊際誤差不超過4%,應(yīng)抽取多大的樣本"解:=0.95,==1.96==47.06,取n=48或者50。7.28某超市想要估計每個顧客平均每次購物花費的金額。根據(jù)過去的經(jīng)驗,標準差大約為120元,現(xiàn)要求以95%的置信水平估計每個顧客平均購物金額的置信區(qū)間,并要求邊際誤差不超過20元,應(yīng)抽取多少個顧客作為樣本"解:,=0.95,==1.96,=138.3,取n=139或者140,或者150。7.29假定兩個總體的標準差分別為:,,若要求誤差范圍不超過5,相應(yīng)的置信水平為95%,假定,估計兩個總體均值之差時所需的樣本量為多大"解:n1=n2=,=0.95,==1.96,n1=n2===56.7,取n=58,或者60。7.30假定,邊際誤差E=0.05,相應(yīng)的置信水平為95%,估計兩個總體比例之差時所需的樣本量為多大"解:n1=n2=,=0.95,==1.96,取p1=p2=0.5,n1=n2===768.3,取n=769,或者780或800。8.2一種元件,要求其使用壽命不得低于700小時?,F(xiàn)從一批這種元件中隨機抽取36件,測得其平均壽命為680小時。已知該元件壽命服從正態(tài)分布,=60小時,試在顯著性水平0.05下確定這批元件是否合格。解:H0:μ≥700;H1:μ<700已知:=680=60由于n=36>30,大樣本,因此檢驗統(tǒng)計量:==-2當α=0.05,查表得=1.645。因為z<-,故拒絕原假設(shè),接受備擇假設(shè),說明這批產(chǎn)品不合格。8.4糖廠用自動打包機打包,每包標準重量是100千克。每天開工后需要檢驗一次打包機工作是否正常。某日開工后測得9包重量(單位:千克)如下:99.398.7100.5101.298.399.799.5102.1100.5已知包重服從正態(tài)分布,試檢驗該日打包機工作是否正常(a=0.05)"解:H0:μ=100;H1:μ≠100經(jīng)計算得:=99.9778S=1.21221檢驗統(tǒng)計量:==-0.055當α=0.05,自由度n-1=9時,查表得=2.262。因為<,樣本統(tǒng)計量落在接受區(qū)域,故接受原假設(shè),拒絕備擇假設(shè),說明打包機工作正常。8.5某種大量生產(chǎn)的袋裝食品,按規(guī)定不得少于250克。今從一批該食品中任意抽取50袋,發(fā)現(xiàn)有6袋低于250克。若規(guī)定不符合標準的比例超過5%就不得出廠,問該批食品能否出廠(a=0.05)"解:解:H0:π≤0.05;H1:π>0.05已知:p=6/50=0.12檢驗統(tǒng)計量:==2.271當α=0.05,查表得=1.645。因為>,樣本統(tǒng)計量落在拒絕區(qū)域,故拒絕原假設(shè),接受備擇假設(shè),說明該批食品不能出廠。8.7某種電子元件的壽命x(單位:小時)服從正態(tài)分布?,F(xiàn)測得16只元件的壽命如下:159280101212224379179264222362168250149260485170問是否有理由認為元件的平均壽命顯著地大于225小時(a=0.05)"解:H0:μ≤225;H1:μ>225經(jīng)計算知:=241.5s=98.726檢驗統(tǒng)計量:==0.669當α=0.05,自由度n-1=15時,查表得=1.753。因為t<,樣本統(tǒng)計量落在接受區(qū)域,故接受原假設(shè),拒絕備擇假設(shè),說明元件壽命沒有顯著大于225小時。8.10裝配一個部件時可以采用不同的方法,所關(guān)心的問題是哪一個方法的效率更高。勞動效率可以用平均裝配時間反映?,F(xiàn)從不同的裝配方法中各抽取12件產(chǎn)品,記錄各自的裝配時間(單位:分鐘)如下:甲方法:313429323538343029323126乙方法:262428293029322631293228兩總體為正態(tài)總體,且方差相同。問兩種方法的裝配時間有無顯著不同(a=0.05)"解:建立假設(shè)H0:μ1-μ2=0H1:μ1-μ2≠0總體正態(tài),小樣本抽樣,方差未知,方差相等,檢驗統(tǒng)計量根據(jù)樣本數(shù)據(jù)計算,得=12,=12,=31.75,=3.19446,=28.6667,=2.46183。==8.1326=2.648α=0.05時,臨界點為==2.074,此題中>,故拒絕原假設(shè),認為兩種方法的裝配時間有顯著差異。8.11調(diào)查了339名50歲以上的人,其中205名吸煙者中有43個患慢性氣管炎,在134名不吸煙者中有13人患慢性氣管炎。調(diào)查數(shù)據(jù)能否支持“吸煙者容易患慢性氣管炎”這種觀點(a=0.05)"解:建立假設(shè)H0:π1≤π2;H1:π1>π2p1=43/205=0.2097n1=205p2=13/134=0.097n2=134檢驗統(tǒng)計量==3當α=0.05,查表得=1.645。因為>,拒絕原假設(shè),說明吸煙者容易患慢性氣管炎。8.12為了控制貸款規(guī)模,某商業(yè)銀行有個內(nèi)部要求,平均每項貸款數(shù)額不能超過60萬元。隨著經(jīng)濟的發(fā)展,貸款規(guī)模有增大的趨勢。銀行經(jīng)理想了解在同樣項目條件下,貸款的平均規(guī)模是否明顯地超過60萬元,故一個n=144的隨機樣本被抽出,測得=68.1萬元,s=45。用a=0.01的顯著性水平,采用p值進行檢驗。解:H0:μ≤60;H1:μ>60已知:=68.1s=45由于n=144>30,大樣本,因此檢驗統(tǒng)計量:==2.16由于>μ,因此P值=P(z≥2.16)=1-,查表的=0.9846,P值=0.0154由于P>α=0.01,故不能拒絕原假設(shè),說明貸款的平均規(guī)模沒有明顯地超過60萬元。8.13有一種理論認為服用阿司匹林有助于減少心臟病的發(fā)生,為了進行驗證,研究人員把自愿參與實驗的22000人隨機平均分成兩組,一組人員每星期服用三次阿司匹林(樣本1),另一組人員在相同的時間服用安慰劑(樣本2)持續(xù)3年之后進行檢測,樣本1中有104人患心臟病,樣本2中有189人患心臟病。以a=0.05的顯著性水平檢驗服用阿司匹林是否可以降低心臟病發(fā)生率。解:建立假設(shè)H0:π1≥π2;H1:π1<π2p1=104/11000=0.00945n1=11000p2=189/11000=0.01718n2=11000檢驗統(tǒng)計量==-5當α=0.05,查表得=1.645。因為<-,拒絕原假設(shè),說明用阿司匹林可以降低心臟病發(fā)生率。8.15有人說在大學(xué)中男生的學(xué)習(xí)成績比女生的學(xué)習(xí)成績好?,F(xiàn)從一個學(xué)校中隨機抽取了25名男生和16名女生,對他們進行了同樣題目的測試。測試結(jié)果表明,男生的平均成績?yōu)?2分,方差為56分,女生的平均成績?yōu)?8分,方差為49分。假設(shè)顯著性水平α=0.02,從上述數(shù)據(jù)中能得到什么結(jié)論"解:首先進行方差是否相等的檢驗:建立假設(shè)H0:=;H1:≠n1=25,=56,n2=16,=49==1.143當α=0.02時,=3.294,=0.346。由于<F<,檢驗統(tǒng)計量的值落在接受域中,所以接受原假設(shè),說明總體方差無顯著差異。檢驗均值差:建立假設(shè)H0:μ1-μ2≤0H1:μ1-μ2>0總體正態(tài),小樣本抽樣,方差未知,方差相等,檢驗統(tǒng)計量根據(jù)樣本數(shù)據(jù)計算,得=25,=16,=82,=56,=78,=49=53.308=1.711α=0.02時,臨界點為==2.125,t<,故不能拒絕原假設(shè),不能認為大學(xué)中男生的學(xué)習(xí)成績比女生的學(xué)習(xí)成績好。
10.3一家牛奶公司有4臺機器裝填牛奶,每桶的容量為4L。下面是從4臺機器中抽取的樣本數(shù)據(jù):機器l機器2機器3機器44.053.993.974.004.014.023.984.024.024.013.973.994.043.993.954.0l4.004.004.00取顯著性水平a=0.01,檢驗4臺機器的裝填量是否相同"解:ANOVA每桶容量(L)平方和df均方F顯著性組間0.00730.0028.7210.001組內(nèi)0.004150.000總數(shù)0.01118不相同。10.7某企業(yè)準備用三種方法組裝一種新的產(chǎn)品,為確定哪種方法每小時生產(chǎn)的產(chǎn)品數(shù)量最多,隨機抽取了30名工人,并指定每個人使用其中的一種方法。通過對每個工人生產(chǎn)的產(chǎn)品數(shù)進行方差分析得到下面的結(jié)果;方差分析表差異源SSdfMSFP-valueFcrit組間42022101.478102190.2459463.354131組內(nèi)383627142.0740741———總計425629————要求:(1)完成上面的方差分析表。(2)若顯著性水平a=0.05,檢驗三種方法組裝的產(chǎn)品數(shù)量之間是否有顯著差異"解:(2)P=0.025>a=0.05,沒有顯著差異。10.9有5種不同品種的種子和4種不同的施肥方案,在20塊同樣面積的土地上,分別采用5種種子和4種施肥方案搭配進行試驗,取得的收獲量數(shù)據(jù)如下表:品種施肥方案1234112.09.510.49.7213.711.512.49.6314.312.311.411.1414.214.012.512.0513.014.013.111.4檢驗種子的不同品種對收獲量的影響是否有顯著差異"不同的施肥方案對收獲量的影響是否有顯著差異(a=0.05)"解:這線圖:__似乎交互作用不明顯:(1)考慮無交互作用下的方差分析:主體間效應(yīng)的檢驗因變量:收獲量源III型平方和df均方FSig.校正模型37.249(a)75.3218.0820.001截距2,930.62112,930.6214,451.0120.000Fertilization_Methods18.18236.0619.2050.002Variety19.06744.7677.2400.003誤差7.901120.658總計2,975.77020校正的總計45.15019a.R方=.825(調(diào)整R方=.723)結(jié)果表明施肥方法和品種都對收獲量有顯著影響。(2)考慮有交互作用下的方差分析:主體間效應(yīng)的檢驗因變量:收獲量源III型平方和df均方FSig.校正模型45.150(a)192.376..截距2,930.62112,930.621..Fertilization_Methods18.18236.061..Variety19.06744.767..Fertilization_Methods*Variety7.901120.658..誤差0.0000.總計2,975.77020校正的總計45.15019a.R方=1.000(調(diào)整R方=.)由于觀測數(shù)太少,得不到結(jié)果!10.11一家超市連鎖店進行一項研究,確定超市所在的位置和競爭者的數(shù)量對銷售額是否有顯著影響。下面是獲得的月銷售額數(shù)據(jù)(單位:萬元)。超市位置競爭者數(shù)量0123個以h位于市內(nèi)居民小區(qū)413859473031484045395139位于寫字樓252944433135484222305053位于郊區(qū)187229242917282733252632取顯著性水平a=0.01,檢驗:(1)競爭者的數(shù)量對銷售額是否有顯著影響"(2)超市的位置對銷售額是否有顯著影響"(3)競爭者的數(shù)量和超市的位置對銷售額是否有交互影響"解:畫折線圖:交互作用不十分明顯。(1)進行無交互方差分析:主體間效應(yīng)的檢驗因變量:月銷售額(萬元)源III型平方和df均方FSig.校正模型2814.556(a)5562.91115.2050.000截距44,802.778144,802.7781,210.1590.000Location_SuperMaket1,736.2222868.11123.4480.000Amount_competitors1,078.3333359.4449.7090.000誤差1,110.6673037.022總計48,728.00036校正的總計3,925.22235a.R方=.717(調(diào)整R方=.670)看到超市位置有顯著影響,而競爭者數(shù)量沒有顯著影響,且影響強度僅為0.327,因此考慮是否存在交互作用。(2)有交互方差分析:看到超市位置有顯著影響,而競爭者數(shù)量和交互作用均無顯著影響。主體間效應(yīng)的檢驗因變量:月銷售額(萬元)源III型平方和df均方FSig.校正模型3317.889(a)11301.62611.9190.000截距44,802.778144,802.7781,770.4720.000Location_SuperMaket1,736.2222868.11134.3050.000Amount_competitors1,078.3333359.44414.2040.000Location_SuperMaket*Amount_competitors503.333683.8893.3150.016誤差607.3332425.306總計48,728.00036校正的總計3,925.22235a.R方=.845(調(diào)整R方=.774)
11.5一家物流公司的管理人員想研究貨物的運輸距離和運輸時間的關(guān)系,為此,他抽出了公司最近10個卡車運貨記錄的隨機樣本,得到運送距離(單位:km)和運送時間(單位:天)的數(shù)據(jù)如下:運送距離x825215107055048092013503256701215運送時間y3.51.04.02.01.03.04.51.53.05.0要求:(1)繪制運送距離和運送時間的散點圖,判斷二者之間的關(guān)系形態(tài):(2)計算線性相關(guān)系數(shù),說明兩個變量之間的關(guān)系強度。(3)利用最小二乘法求出估計的回歸方程,并解釋回歸系數(shù)的實際意義。解:(1)__可能存在線性關(guān)系。(2)相關(guān)性x運送距離(km)y運送時間(天)x運送距離(km)Pearson相關(guān)性1.949(**)顯著性(雙側(cè))0.000N1010y運送時間(天)Pearson相關(guān)性.949(**)1顯著性(雙側(cè))0.000N1010**.在.01水平(雙側(cè))上顯著相關(guān)。有很強的線性關(guān)系。(3)系數(shù)(a)模型非標準化系數(shù)標準化系數(shù)t顯著性B標準誤Beta1(常量)0.1180.3550.3330.748x運送距離(km)0.0040.0000.9498.5090.000a.因變量:y運送時間(天)回歸系數(shù)的含義:每公里增加0.004天。11.6下面是7個地區(qū)2000年的人均國內(nèi)生產(chǎn)總值(GDP)和人均消費水平的統(tǒng)計數(shù)據(jù):地區(qū)人均GDP(元)人均消費水平(元)224601122634547485154442662454973264490115462396220816082035要求:(1)人均GDP作自變量,人均消費水平作因變量,繪制散點圖,并說明二者之間的關(guān)系形態(tài)。(2)計算兩個變量之間的線性相關(guān)系數(shù),說明兩個變量之間的關(guān)系強度。(3)利用最小二乘法求出估計的回歸方程,并解釋回歸系數(shù)的實際意義。(4)計算判定系數(shù),并解釋其意義。(5)檢驗回歸方程線性關(guān)系的顯著性(a=0.05)。(6)如果某地區(qū)的人均GDP為5000元,預(yù)測其人均消費水平。(7)求人均GDP為5000元時,人均消費水平95%的置信區(qū)間和預(yù)測區(qū)間。解:(1)__可能存在線性關(guān)系。(2)相關(guān)系數(shù):相關(guān)性人均GDP(元)人均消費水平(元)人均GDP(元)Pearson相關(guān)性1.998(**)顯著性(雙側(cè))0.000N77人均消費水平(元)Pearson相關(guān)性.998(**)1顯著性(雙側(cè))0.000N77**.在.01水平(雙側(cè))上顯著相關(guān)。有很強的線性關(guān)系。(3)回歸方程:系數(shù)(a)模型非標準化系數(shù)標準化系數(shù)t顯著性B標準誤Beta1(常量)734.693139.5405.2650.003人均GDP(元)0.3090.0080.99836.4920.000a.因變量:人均消費水平(元)回歸系數(shù)的含義:人均GDP沒增加1元,人均消費增加0.309元。(4)模型摘要模型RR方調(diào)整的R方估計的標準差1.998(a)0.9960.996247.303a.預(yù)測變量:(常量),人均GDP(元)。人均GDP對人均消費的影響達到99.6%。(5)F檢驗:ANOVA(b)模型平方和df均方F顯著性1回歸81,444,968.680181,444,968.6801,331.692.000(a)殘差305,795.034561,159.007合計81,750,763.7146a.預(yù)測變量:(常量),人均GDP(元)。b.因變量:人均消費水平(元)回歸系數(shù)的檢驗:t檢驗系數(shù)(a)模型非標準化系數(shù)標準化系數(shù)t顯著性B標準誤Beta1(常量)734.693139.5405.2650.003人均GDP(元)0.3090.0080.99836.4920.000a.因變量:人均消費水平(元)(6)某地區(qū)的人均GDP為5000元,預(yù)測其人均消費水平為2278.10657元。(7)人均GDP為5000元時,人均消費水平95%的置信區(qū)間為[1990.74915,2565.46399],預(yù)測區(qū)間為[1580.46315,2975.74999]。11.9某汽車生產(chǎn)商欲了解廣告費用(x)對銷售量(y)的影響,收集了過去12年的有關(guān)數(shù)據(jù)。通過計算得到下面的有關(guān)結(jié)果:方差分析表變差來源dfSSMSFSignificanceF回歸11602708.61602708.6399.10000652.17E—09殘差1040158.074015.807——總計111642866.67———參數(shù)估計表Coefficients標準誤差tStatP—valueIntercept363.689162.455295.8231910.000168XVariable11.4202110.07109119.977492.17E—09要求:(1)完成上面的方差分析表。(2)汽車銷售量的變差中有多少是由于廣告費用的變動引起的"(3)銷售量與廣告費用之間的相關(guān)系數(shù)是多少"(4)寫出估計的回歸方程并解釋回歸系數(shù)的實際意義。(5)檢驗線性關(guān)系的顯著性(a=0.05)。解:(2)R2=0.9756,汽車銷售量的變差中有97.56%是由于廣告費用的變動引起的。(3)r=0.9877。(4)回歸系數(shù)的意義:廣告費用每增加一個單位,汽車銷量就增加1.42個單位。(5)回歸系數(shù)的檢驗:p=2.17E—09<α,回歸系數(shù)不等于0,顯著?;貧w直線的檢驗:p=2.17E—09<α,回歸直線顯著。11.11從20的樣本中得到的有關(guān)回歸結(jié)果是:SSR=60,SSE=40。要檢驗x與y之間的線性關(guān)系是否顯著,即檢驗假設(shè):。(1)線性關(guān)系檢驗的統(tǒng)計量F值是多少"(2)給定顯著性水平a=0.05,F(xiàn)a是多少"(3)是拒絕原假設(shè)還是不拒絕原假設(shè)"(4)假定x與y之間是負相關(guān),計算相關(guān)系數(shù)r。(5)檢驗x與y之間的線性關(guān)系是否顯著"解:(1)SSR的自由度為k=1;SSE的自由度為n-k-1=18;因此:F===27(2)==4.41(3)拒絕原假設(shè),線性關(guān)系顯著。(4)r===0.7746,由于是負相關(guān),因此r=-0.7746(5)從F檢驗看線性關(guān)系顯著。11.15隨機抽取7家超市,得到其廣告費支出和銷售額數(shù)據(jù)如下:超市廣告費支出(萬元)銷售額(萬元)ABCDEFGl24610142019324440525354要求:(1)用廣告費支出作自變量x,銷售額作因變量y,求出估計的回歸方程。(2)檢驗廣告費支出與銷售額之間的線性關(guān)系是否顯著(a=0.05)。(3)繪制關(guān)于x的殘差圖,你覺得關(guān)于誤差項的假定被滿足了嗎"(4)你是選用這個模型,還是另尋找一個更好的模型"解:(1)系數(shù)(a)模型非標準化系數(shù)標準化系數(shù)t顯著性B標準誤Beta1(常量)29.3994.8076.1160.002廣告費支出(萬元)1.5470.4630.8313.3390.021a.因變量:銷售額(萬元)(2)回歸直線的F檢驗:ANOVA(b)模型平方和df均方F顯著性1回歸691.7231691.72311.147.021(a)殘差310.277562.055合計1,002.0006a.預(yù)測變量:(常量),廣告費支出(萬元)。b.因變量:銷售額(萬元)顯著?;貧w系數(shù)的t檢驗:系數(shù)(a)模型非標準化系數(shù)標準化系數(shù)t顯著性B標準誤Beta1(常量)29.3994.8076.1160.002廣告費支出(萬元)1.5470.4630.8313.3390.021a.因變量:銷售額(萬元)顯著。(3)未標準化殘差圖:__標準化殘差圖:學(xué)生氏標準化殘差圖:看到殘差不全相等。(4)應(yīng)考慮其他模型??煽紤]對數(shù)曲線模型:y=b0+b1ln(x)=22.471+11.576ln(x)。
12.2根據(jù)下面Excel輸出的回歸結(jié)果,說明模型中涉及多少個自變量、少個觀察值.寫出回歸方程,并根據(jù)F,se,R2及調(diào)整的的值對模型進行討論。SUMMARYOUTPUT回歸統(tǒng)計MultipleRRSquareAdjustedRSquare標準誤差觀測值0.8424070.7096500.630463109.42959615方差分析dfSSMSFSignificanceF回歸3321946.8018107315.60068.9617590.002724殘差11131723.198211974.84總計14453670Coefficients標準誤差tStatP-valueInterceptXVariable1XVariable2XVariable3657.05345.710311-0.416917-3.471481167.4595391.7918360.3221931.4429353.9236553.186849-1.293998-2.4058470.0023780.0086550.2221740.034870解:自變量3個,觀察值15個?;貧w方程:=657.0534+5.710311X1-0.416917X2-3.471481X3擬合優(yōu)度:判定系數(shù)R2=0.70965,調(diào)整的=0.630463,說明三個自變量對因變量的影響的比例占到63%。估計的標準誤差=109.429596,說明隨即變動程度為109.429596回歸方程的檢驗:F檢驗的P=0.002724,在顯著性為5%的情況下,整個回歸方程線性關(guān)系顯著?;貧w系數(shù)的檢驗:的t檢驗的P=0.008655,在顯著性為5%的情況下,y與X1線性關(guān)系顯著。的t檢驗的P=0.222174,在顯著性為5%的情況下,y與X2線性關(guān)系不顯著。的t檢驗的P=0.034870,在顯著性為5%的情況下,y與X3線性關(guān)系顯著。因此,可以考慮采用逐步回歸去除X2,從新構(gòu)建線性回歸模型。12.3根據(jù)兩個自變量得到的多元回歸方程為,并且已知n=10,SST=6724.125,SSR=6216.375,,=0.0567。要求:(1)在a=0.05的顯著性水平下,與y的線性關(guān)系是否顯著"(2)在a=0.05的顯著性水平下,是否顯著"(3)在a=0.05的顯著性水平下,是否顯著"解(1)回歸方程的顯著性檢驗:假設(shè):H0:==0H1:,不全等于0SSE=SST-SSR=6724.125-6216.375=507.75F===42.85=4.74,F(xiàn)>,認為線性關(guān)系顯著。(2)回歸系數(shù)的顯著性檢驗:假設(shè):H0:=0H1:≠0t===24.72=2.36,>,認為y與x1線性關(guān)系顯著。(3)回歸系數(shù)的顯著性檢驗:假設(shè):H0:=0H1:≠0t===83.6=2.36,>,認為y與x2線性關(guān)系顯著。12.4一家電器銷售公司的管理人員認為,每月的銷售額是廣告費用的函數(shù),并想通過廣告費用對月銷售額作出估計。下面是近8個月的銷售額與廣告費用數(shù)據(jù):月銷售收入y(萬元)電視廣告費用工:x1(萬元)報紙廣告費用x2(萬元)96909592959494945.02.04.02.53.03.52.53.01.52.01.52.53.32.34.22.5要求:(1)用電視廣告費用作自變量,月銷售額作因變量,建立估計的回歸方程。(2)用電視廣告費用和報紙廣告費用作自變量,月銷售額作因變量,建立估計的回歸方程。(3)上述(1)和(2)所建立的估計方程,電視廣告費用的系數(shù)是否相同"對其回歸系數(shù)分別進行解釋。(4)根據(jù)問題(2)所建立的估計方程,在銷售收入的總變差中,被估計的回歸方程所解釋的比例是多少"(5)根據(jù)問題(2)所建立的估計方程,檢驗回歸系數(shù)是否顯著(a=0.05)。解:(1)回歸方程為:(2)回歸方程為:(3)不相同,(1)中表明電視廣告費用增加1萬元,月銷售額增加1.6萬元;(2)中表明,在報紙廣告費用不變的情況下,電視廣告費用增加1萬元,月銷售額增加2.29萬元。(4)判定系數(shù)R2=0.919,調(diào)整的=0.8866,比例為88.66%。(5)回歸系數(shù)的顯著性檢驗:Coefficients標準誤差tStatP-valueLower95%Upper95%下限95.0%上限95.0%Intercept83.230091.57386952.882484.57E-0879.1843387.2758579.1843387.27585電視廣告費用工:x1(萬元)2.2901840.3040657.5318990.0006531.5085613.0718061.5085613.071806報紙廣告費用x2(萬元)1.3009890.3207024.0566970.0097610.4765992.1253790.4765992.125379假設(shè):H0:=0H1:≠0t===7.53=2.57,>,認為y與x1線性關(guān)系顯著。(3)回歸系數(shù)的顯著性檢驗:假設(shè):H0:=0H1:≠0t===4.05=2.57,>,認為y與x2線性關(guān)系顯著。12.5某農(nóng)場通過試驗取得早稻收獲量與春季降雨量和春季溫度的數(shù)據(jù)如下:收獲量y(kg/hm2)降雨量x1(mm)溫度x2(℃)2250345045006750720075008250253345105110115120681013141617要求:(1)試確定早稻收獲量對春季降雨量和春季溫度的二元線性回歸方程。(2)解釋回歸系數(shù)的實際意義。(3)根據(jù)你的判斷,模型中是否存在多重共線性"解:(1)回歸方程為:(2)在溫度不變的情況下,降雨量每增加1mm,收獲量增加22.386kg/hm2,在降雨量不變的情況下,降雨量每增加1度,收獲量增加327.672kg/hm2。(3)與的相關(guān)系數(shù)=0.965,存在多重共線性。12.9下面是隨機抽取的15家大型商場銷售的同類產(chǎn)品的有關(guān)數(shù)據(jù)(單位:元)。企業(yè)編號銷售價格y購進價格x1銷售費用x2l23456789101112131415l238l266l200119311061303131311441286l084l120115610831263124696689444066479185280490577l51150585l659490696223257387310339283302214304326339235276390316要求:(1)計算y與x1、y與x2之間的相關(guān)系數(shù),是否有證據(jù)表明銷售價格與購進價格、銷售價格與銷售費用之間存在線性關(guān)系"(2)根據(jù)上述結(jié)果,你認為用購進價格和銷售費用來預(yù)測銷售價格是否有用"(3)用Excel進行回歸,并檢驗?zāi)P偷木€性關(guān)系是否顯著(a=0.05)。(4)解釋判定系數(shù)R2,所得結(jié)論與問題(2)中是否一致"(5)計算x1與x2之間的相關(guān)系數(shù),所得結(jié)果意味著什么"(6)模型中是否存在多重共線性"你對模型有何建議"解:(1)y與x1的相關(guān)系數(shù)=0.309,y與x2之間的相關(guān)系數(shù)=0.0012。對相關(guān)性進行檢驗:相關(guān)性銷售價格購進價格銷售費用銷售價格Pearson相關(guān)性10.3090.001顯著性(雙側(cè))0.2630.997N151515購進價格Pearson相關(guān)性0.3091-.853(**)顯著性(雙側(cè))0.2630.000N151515銷售費用Pearson相關(guān)性0.001-.853(**)1顯著性(雙側(cè))0.9970.000N151515**.在.01水平(雙側(cè))上顯著相關(guān)??梢钥吹?,兩個相關(guān)系數(shù)的P值都比較的,總體上線性關(guān)系也不現(xiàn)狀,因此沒有明顯的線性相關(guān)關(guān)系。(2)意義不大。(3)回歸統(tǒng)計MultipleR0.593684RSquare0.35246AdjustedRSquare0.244537標準誤差69.75121觀測值15方差分析dfSSMSFSignificanceF回歸分析231778.153915889.083.2658420.073722殘差1258382.77944865.232總計1490160.9333Coefficients標準誤差tStatP-valueLower95%Upper95%下限95.0%上限95.0%Intercept375.6018339.4105621.106630.290145-363.911115.114-363.911115.114購進價格x10.5378410.210446742.5557110.02520.0793170.9963650.0793170.996365銷售費用x21.4571940.667706592.1823860.0496810.0023862.9120010.0023862.912001從檢驗結(jié)果看,整個方程在5%下,不顯著;而回歸系數(shù)在5%下,均顯著,說明回歸方程
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版抵押貸款購銷合同起草指南3篇
- 二零二五年珠寶玉石交易合同3篇
- 二零二五版新型節(jié)能建材采購合同(工地裝修)3篇
- 二零二五年度餐飲泔水處理與有機垃圾資源化利用合同2篇
- 二零二五年教育信息化建設(shè)項目競標合同3篇
- 二零二五版新能源居間合同解析與合同屬性3篇
- 二零二五版高新技術(shù)研發(fā)項目合伙投資合同3篇
- 二零二五版數(shù)據(jù)中心基礎(chǔ)設(shè)施安裝合同6篇
- 二零二五版辦公文檔范本家政服務(wù)合同(雙方法律關(guān)系)3篇
- 二零二五版拉森鋼板樁租賃合同租賃日期及租期計算的詳細規(guī)定9篇
- GB/T 16895.3-2024低壓電氣裝置第5-54部分:電氣設(shè)備的選擇和安裝接地配置和保護導(dǎo)體
- 2025湖北襄陽市12345政府熱線話務(wù)員招聘5人高頻重點提升(共500題)附帶答案詳解
- 2025年河北省職業(yè)院校技能大賽智能節(jié)水系統(tǒng)設(shè)計與安裝(高職組)考試題庫(含答案)
- 2024年下半年鄂州市城市發(fā)展投資控股集團限公司社會招聘【27人】易考易錯模擬試題(共500題)試卷后附參考答案
- GB/T 29498-2024木門窗通用技術(shù)要求
- 《職業(yè)院校與本科高校對口貫通分段培養(yǎng)協(xié)議書》
- GJB9001C質(zhì)量管理體系要求-培訓(xùn)專題培訓(xùn)課件
- 人教版(2024)英語七年級上冊單詞表
- 中醫(yī)養(yǎng)生產(chǎn)業(yè)現(xiàn)狀及發(fā)展趨勢分析
- 2023年浙江省溫州市中考數(shù)學(xué)真題含解析
- 窗簾采購?fù)稑朔桨福夹g(shù)方案)
評論
0/150
提交評論