版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
PAGE138賈俊平_統(tǒng)計學(xué)第四版_習(xí)題答案第1章緒論1.什么是統(tǒng)計學(xué)?怎樣理解統(tǒng)計學(xué)與統(tǒng)計數(shù)據(jù)的關(guān)系?2.試舉出日常生活或工作中統(tǒng)計數(shù)據(jù)及其規(guī)律性的例子。3..一家大型油漆零售商收到了客戶關(guān)于油漆罐分量不足的許多抱怨。因此,他們開始檢查供貨商的集裝箱,有問題的將其退回。最近的一個集裝箱裝的是2440加侖的油漆罐。這家零售商抽查了50罐油漆,每一罐的質(zhì)量精確到4位小數(shù)。裝滿的油漆罐應(yīng)為4.536kg。要求:(1)描述總體;(2)描述研究變量;(3)描述樣本;(4)描述推斷。答:(1)總體:最近的一個集裝箱內(nèi)的全部油漆;(2)研究變量:裝滿的油漆罐的質(zhì)量;(3)樣本:最近的一個集裝箱內(nèi)的50罐油漆;(4)推斷:50罐油漆的質(zhì)量應(yīng)為4.536×50=226.84.“可樂戰(zhàn)”是描述市場上“可口可樂”與“百事可樂”激烈競爭的一個流行術(shù)語。這場戰(zhàn)役因影視明星、運動員的參與以及消費者對品嘗試驗優(yōu)先權(quán)的抱怨而頗具特色。假定作為百事可樂營銷戰(zhàn)役的一部分,選擇了1000名消費者進行匿名性質(zhì)的品嘗試驗(即在品嘗試驗中,兩個品牌不做外觀標(biāo)記),請每一名被測試者說出A品牌或B品牌中哪個口味更好。要求:(1)描述總體;(2)描述研究變量;(3)描述樣本;(4)一描述推斷。答:(1)總體:市場上的“可口可樂”與“百事可樂”(2)研究變量:更好口味的品牌名稱;(3)樣本:1000名消費者品嘗的兩個品牌(4)推斷:兩個品牌中哪個口味更好。第2章統(tǒng)計數(shù)據(jù)的描述——練習(xí)題●1.為評價家電行業(yè)售后服務(wù)的質(zhì)量,隨機抽取了由100家庭構(gòu)成的一個樣本。服務(wù)質(zhì)量的等級分別表示為:A.好;B.較好;C.一般;D.差;E.較差。調(diào)查結(jié)果如下:BECCADCBAEDACBCDECEEADBCCAEDCBBACDEABDDCCBCEDBCCBCDACBCDECEBBECCADCBAEBACDEABDDCADBCCAEDCBCBCEDBCCBC(1)指出上面的數(shù)據(jù)屬于什么類型;用Excel制作一張頻數(shù)分布表;(3)繪制一張條形圖,反映評價等級的分布。解:(1)由于表2.21中的數(shù)據(jù)為服務(wù)質(zhì)量的等級,可以進行優(yōu)劣等級比較,但不能計算差異大小,屬于順序數(shù)據(jù)。(2)頻數(shù)分布表如下:服務(wù)質(zhì)量等級評價的頻數(shù)分布服務(wù)質(zhì)量等級家庭數(shù)(頻數(shù))頻率%A1414B2121C3232D1818E1515合計100100(3)條形圖的制作:將上表(包含總標(biāo)題,去掉合計欄)復(fù)制到Excel表中,點擊:圖表向?qū)А鷹l形圖→選擇子圖表類型→完成(見Excel練習(xí)題2.1)。即得到如下的條形圖:●2.某行業(yè)管理局所屬40個企業(yè)2002年的產(chǎn)品銷售收入數(shù)據(jù)如下(單位:萬元):1521241291161001039295127104105119114115871031181421351251171081051101071371201361171089788123115119138112146113126(1)根據(jù)上面的數(shù)據(jù)進行適當(dāng)?shù)姆纸M,編制頻數(shù)分布表,并計算出累積頻數(shù)和累積頻率;(2)如果按規(guī)定:銷售收入在125萬元以上為先進企業(yè),115萬~125萬元為良好企業(yè),105萬~115萬元為一般企業(yè),105萬元以下為落后企業(yè),按先進企業(yè)、良好企業(yè)、一般企業(yè)、落后企業(yè)進行分組。解:(1)要求對銷售收入的數(shù)據(jù)進行分組,全部數(shù)據(jù)中,最大的為152,最小的為87,知數(shù)據(jù)全距為152-87=65;為便于計算和分析,確定將數(shù)據(jù)分為6組,各組組距為10,組限以整10劃分;為使數(shù)據(jù)的分布滿足窮盡和互斥的要求,注意到,按上面的分組方式,最小值87可能落在最小組之下,最大值152可能落在最大組之上,將最小組和最大組設(shè)計成開口形式;按照“上限不在組內(nèi)”的原則,用劃記法統(tǒng)計各組內(nèi)數(shù)據(jù)的個數(shù)——企業(yè)數(shù),也可以用Excel進行排序統(tǒng)計(見Excel練習(xí)題2.2),將結(jié)果填入表內(nèi),得到頻數(shù)分布表如下表中的左兩列;將各組企業(yè)數(shù)除以企業(yè)總數(shù)40,得到各組頻率,填入表中第三列;在向上的數(shù)軸中標(biāo)出頻數(shù)的分布,由下至上逐組計算企業(yè)數(shù)的向上累積及頻率的向上累積,由上至下逐組計算企業(yè)數(shù)的向下累積及頻率的向下累積。整理得到頻數(shù)分布表如下:40個企業(yè)按產(chǎn)品銷售收入分組表按銷售收入分組(萬元)企業(yè)數(shù)(個)頻率(%)向上累積向下累積企業(yè)數(shù)頻率企業(yè)數(shù)頻率100以下100~110110~120120~130130~140140以上591274312.522.530.017.510.07.55142633374012.535.065.082.592.5100.04035261473100.087.565.035.017.57.5合計40100.0————(2)按題目要求分組并進行統(tǒng)計,得到分組表如下:某管理局下屬40個企分組表按銷售收入分組(萬元)企業(yè)數(shù)(個)頻率(%)先進企業(yè)良好企業(yè)一般企業(yè)落后企業(yè)11119927.527.522.522.5合計40100.03.某百貨公司連續(xù)40天的商品銷售額如下(單位:萬元):41252947383430384340463645373736454333443528463430374426384442363737493942323635根據(jù)上面的數(shù)據(jù)進行適當(dāng)?shù)姆纸M,編制頻數(shù)分布表,并繪制直方圖。解:全部數(shù)據(jù)中,最大的為49,最小的為25,知數(shù)據(jù)全距為49-25=24;為便于計算和分析,確定將數(shù)據(jù)分為5組,各組組距為5,組限以整5的倍數(shù)劃分;為使數(shù)據(jù)的分布滿足窮盡和互斥的要求,注意到,按上面的分組方式,最小值24已落在最小組之中,最大值49已落在最大組之中,故將各組均設(shè)計成閉口形式;按照“上限不在組內(nèi)”的原則,用劃記法或用Excel統(tǒng)計各組內(nèi)數(shù)據(jù)的個數(shù)——天數(shù),(見Excel練習(xí)題2.3)并填入表內(nèi),得到頻數(shù)分布表如下表中的左兩列;將各組天數(shù)除以總天數(shù)40,得到各組頻率,填入表中第三列;得到頻數(shù)分布表如下:某百貨公司日商品銷售額分組表按銷售額分組(萬元)頻數(shù)(天)頻率(%)25~3030~3535~4040~4545~5046159610.015.037.522.515.0合計40100.0直方圖:將上表(包含總標(biāo)題,去掉合計欄)復(fù)制到Excel表中,點擊:圖表向?qū)А螆D→選擇子圖表類型→完成。即得到如下的直方圖:(見Excel練習(xí)題2.3)●4.為了確定燈泡的使用壽命(小時),在一批燈泡中隨機抽取100只進行測試,所得結(jié)果如下:700716728719685709691684705718706715712722691708690692707701708729694681695685706661735665668710693697674658698666696698706692691747699682698700710722694690736689696651673749708727688689683685702741698713676702701671718707683717733712683692693697664681721720677679695691713699725726704729703696717688(1)利用計算機對上面的數(shù)據(jù)進行排序;(2)以組距為10進行等距分組,整理成頻數(shù)分布表,并繪制直方圖;(3)繪制莖葉圖,并與直方圖作比較。解:(1)排序:將全部數(shù)據(jù)復(fù)制到Excel中,并移動到同一列,點擊:數(shù)據(jù)→排序→確定,即完成數(shù)據(jù)排序的工作。(見Excel練習(xí)題2.4)(2)按題目要求,利用已排序的Excel表數(shù)據(jù)進行分組及統(tǒng)計,得到頻數(shù)分布表如下:(見Excel練習(xí)題2.4)100只燈泡使用壽命非頻數(shù)分布按使用壽命分組(小時)燈泡個數(shù)(只)頻率(%)650~66022660~67055670~68066680~6901414690~7002626700~7101818710~7201313720~7301010730~74033740~75033合計=SUM(ABOVE)100=SUM(ABOVE)100制作直方圖:將上表(包含總標(biāo)題,去掉合計欄)復(fù)制到Excel表中,選擇全表后,點擊:圖表向?qū)А螆D→選擇子圖表類型→完成。即得到如下的直方圖:(見Excel練習(xí)題2.4)(3)制作莖葉圖:以十位以上數(shù)作為莖,填入表格的首列,將百、十位數(shù)相同的數(shù)據(jù)的個位數(shù)按由小到大的順序填入相應(yīng)行中,即成為葉,得到莖葉圖如下:651866145686713467968112333455588996900111122233445566677888899700011223456667788897100223356778897201225678997335674147將直方圖與莖葉圖對比,可見兩圖十分相似。●5.下面是北方某城市1~2月份各天氣溫的記錄數(shù)據(jù):-32-4-7-11-1789-6-7-14-18-15-9-6-105-4-9-3-6-8-12-16-19-15-22-25-24-19-21-8-6-15-11-12-19-25-24-18-17-24-14-22-13-9-60-15-4-9-3-32-4-4-16-175-6-5指出上面的數(shù)據(jù)屬于什么類型;對上面的數(shù)據(jù)進行適當(dāng)?shù)姆纸M;繪制直方圖,說明該城市氣溫分布的特點。解:(1)由于各天氣溫的記錄數(shù)據(jù)屬于數(shù)值型數(shù)據(jù),它們可以比較高低,且0不表示沒有,因此是定距數(shù)據(jù)。(2)分組如下:由于全部數(shù)據(jù)中,最大的為9,最小的為-25,知數(shù)據(jù)全距為9-(-25)=34;為便于計算和分析,確定將數(shù)據(jù)分為7組,各組組距為5,組限以整5的倍數(shù)劃分;為使數(shù)據(jù)的分布滿足窮盡和互斥的要求,注意到,按上面的分組方式,最小值-25已落在最小組之中,最大值9已落在最大組之中,故將各組均設(shè)計成閉口形式;按照“上限不在組內(nèi)”的原則,用劃記法(或Excel排序法,見Excel練習(xí)題2.5)統(tǒng)計各組內(nèi)數(shù)據(jù)的個數(shù)——天數(shù),并填入表內(nèi),得到頻數(shù)分布表如下表;北方某城市1~2月份各天氣溫分組天數(shù)(天)-25~-208-20~-158-15~-1010-10~-514-5~0140~545~107合計=SUM(ABOVE)65(3)制作直方圖:將上表(包含總標(biāo)題,去掉合計欄)復(fù)制到Excel表中,點擊:圖表向?qū)А螆D→選擇子圖表類型→完成。即得到如下的直方圖:(見Excel練習(xí)題2.5)●6.下面是某考試管理中心對2002年參加成人自學(xué)考試的12000名學(xué)生的年齡分組數(shù)據(jù):年齡18~1921~2122~2425~2930~3435~3940~4445~59%1.934.7對這個年齡分布作直方圖;從直方圖分析成人自學(xué)考試人員年齡分布的特點。解:(1)制作直方圖:將上表復(fù)制到Excel表中,點擊:圖表向?qū)А螆D→選擇子圖表類型→完成。即得到如下的直方圖:(見Excel練習(xí)題2.6)(2)年齡分布的特點:自學(xué)考試人員年齡的分布為右偏。7.下面是A、B兩個班學(xué)生的數(shù)學(xué)考試成績數(shù)據(jù):A班:4457596061616263636566666769707071727373737474747575757575767677777778787980808285858686909292929396B班:3539404444485152525455565657575758596061616263646668687070717173747479818283838485909191949596100100100將兩個班的考試成績用一個公共的莖制成莖葉圖;比較兩個班考試成績分布的特點。解:(1)將樹莖放置中間,A班樹葉向左生長,B班樹葉向右生長,得莖葉圖如下:A班樹莖B班數(shù)據(jù)個數(shù)樹葉樹葉數(shù)據(jù)個數(shù)03592144044842975122456677789121197665332110601123468892398877766555554443332100700113449876655200812334566632220901145660100003(2)比較可知:A班考試成績的分布比較集中,且平均分?jǐn)?shù)較高;B班考試成績的分布比A班分散,且平均成績較A班低。8.1997年我國幾個主要城市各月份的平均相對濕度數(shù)據(jù)如下表,試?yán)L制箱線圖,并分析各城市平均相對濕度的分布特征。月份北京長春南京鄭州武漢廣州成都昆明蘭州西安149707657777279655167241687157758083654167347507768818081584974450397267758479614670555566863718375584158657547357748782724342769708274818684845862874798271738478745755968667167718175775565104759755372807876456511665982777872787153731256578265827582715272資料來源:《中國統(tǒng)計年鑒1998》,中國統(tǒng)計出版社1998,第10頁。解:箱線圖如下:(特征請讀者自己分析)●9.某百貨公司6月份各天的銷售額數(shù)據(jù)如下(單位:萬元):257276297252238310240236265278271292261281301274267280291258272284268303273263322249269295(1)計算該百貨公司日銷售額的均值、中位數(shù)和四分位數(shù);(2)計算日銷售額的標(biāo)準(zhǔn)差。解:(1)將全部30個數(shù)據(jù)輸入Excel表中同列,點擊列標(biāo),得到30個數(shù)據(jù)的總和為8223,于是得該百貨公司日銷售額的均值:(見Excel練習(xí)題2.9)===274.1(萬元)或點選單元格后,點擊“自動求和”→“平均值”,在函數(shù)EVERAGE()的空格中輸入“A1:A30”,回車,得到均值也為274.1在Excel表中將30個數(shù)據(jù)重新排序,則中位數(shù)位于30個數(shù)據(jù)的中間位置,即靠中的第15、第16兩個數(shù)272和273的平均數(shù):Me==272.5(萬元)由于中位數(shù)位于第15個數(shù)靠上半位的位置上,所以前四分位數(shù)位于第1~第15個數(shù)據(jù)的中間位置(第8位)靠上四分之一的位置上,由重新排序后的Excel表中第8位是261,第15位是272,從而:QL=261+=261.25(萬元)同理,后四分位數(shù)位于第16~第30個數(shù)據(jù)的中間位置(第23位)靠下四分之一的位置上,由重新排序后的Excel表中第23位是291,第16位是273,從而:QU=291-=290.75(萬元)。(2)未分組數(shù)據(jù)的標(biāo)準(zhǔn)差計算公式為:s=利用上公式代入數(shù)據(jù)計算是個較為復(fù)雜的工作。手工計算時,須計算30個數(shù)據(jù)的離差平方,并將其求和,()再代入公式計算其結(jié)果:得s=21.1742。(見Excel練習(xí)題2.9)我們可以利用Excel表直接計算標(biāo)準(zhǔn)差:點選數(shù)據(jù)列(A列)的最末空格,再點擊菜單欄中“∑”符號右邊的小三角“▼”,選擇“其它函數(shù)”→選擇函數(shù)“STDEV”→“確定”,在出現(xiàn)的函數(shù)參數(shù)窗口中的Number1右邊的空欄中輸入:A1:A30,→“確定”,即在A列最末空格中出現(xiàn)數(shù)值:21.17412,即為這30個數(shù)據(jù)的標(biāo)準(zhǔn)差。于是:(萬元)。(見Excel練習(xí)題2.9)●10.甲乙兩個企業(yè)生產(chǎn)三種產(chǎn)品的單位成本和總成本資料如下:產(chǎn)品名稱單位成本(元)總成本(元)甲企業(yè)乙企業(yè)ABC152030210030001500325515001500比較哪個企業(yè)的總平均成本高?并分析其原因。解:設(shè)產(chǎn)品單位成本為x,產(chǎn)量為f,則總成本為xf,由于:平均成本==,而已知數(shù)據(jù)中缺產(chǎn)量f的數(shù)據(jù),又因個別產(chǎn)品產(chǎn)量f==從而=,于是得:甲企業(yè)平均成本===19.41(元),乙企業(yè)平均成本===18.29(元),對比可見,甲企業(yè)的總平均成本較高。原因:盡管兩個企業(yè)的單位成本相同,但單位成本較低的產(chǎn)品在乙企業(yè)的產(chǎn)量中所占比重較大,因此拉低了總平均成本。●11.在某地區(qū)抽取的120家企業(yè)按利潤額進行分組,結(jié)果如下:按利潤額分組(萬元)企業(yè)數(shù)(個)200~30019300~40030400~50042500~60018600以上11合計120計算120家企業(yè)利潤額的均值和標(biāo)準(zhǔn)差。解:設(shè)各組平均利潤為x,企業(yè)數(shù)為f,則組總利潤為xf,由于數(shù)據(jù)按組距式分組,須計算組中值作為各組平均利潤,列表計算得:按利潤額分組(萬元)組中值企業(yè)數(shù)(個)總利潤xfxf200~300250194750300~4003503010500400~5004504218900500~600550189900600以上650117150合計—12051200于是,120家企業(yè)平均利潤為:===426.67(萬元);分組數(shù)據(jù)的標(biāo)準(zhǔn)差計算公式為:s=手動計算須列表計算各組數(shù)據(jù)離差平方和(x-426.67)2f,列表計算如下組中值企業(yè)數(shù)(個)(x-426.67)2xf25019593033.489135030176348.6674504222860.133855018273785.200265011548639.1779合計1201614666.668表格中(x-426.67)2f方法一:將表格復(fù)制到Excel表中,點擊第三列的頂行單元格后,在輸入欄中輸入:=(a3-426.67)*(a3-426.67)*b3,回車,得到該行的計算結(jié)果;點選結(jié)果所在單元格,并將鼠標(biāo)移動到該單元格的右下方,當(dāng)鼠標(biāo)變成黑“+”字時,壓下左鍵并拉動鼠標(biāo)到該列最后一組數(shù)據(jù)對應(yīng)的單元格處放開,則各組數(shù)據(jù)的(x-426.67)2f計算于是得標(biāo)準(zhǔn)差:(見Excel練習(xí)題2.11)s===116.48(萬元)。點擊第三列的合計單元格后,點擊菜單欄中的“∑”號,回車,即獲得第三列數(shù)據(jù)的和。方法二:將各組組中值x復(fù)制到Excel的A列中,并按各組次數(shù)f在同列中復(fù)制,使該列中共有f個x,120個數(shù)據(jù)生成后,點選A列的最末空格,再點擊菜單欄中“∑”符號右邊的小三角“▼”,選擇“其它函數(shù)”→選擇函數(shù)“STDEV”→“確定”,在出現(xiàn)的函數(shù)參數(shù)窗口中的Number1右邊的空欄中輸入:A1:A30,→“確定”,即在A列最末空格中出現(xiàn)數(shù)值:116.4845,即為這120個數(shù)據(jù)的標(biāo)準(zhǔn)差。(見Excel練習(xí)題2.11)于是得標(biāo)準(zhǔn)差:s=116.4845(萬元)?!?2.為研究少年兒童的成長發(fā)育狀況,某研究所的一位調(diào)查人員在某城市抽取100名7~17歲的少年兒童作為樣本,另一位調(diào)查人員則抽取了1000名7~17歲的少年兒童作為樣本。請回答下面的問題,并解釋其原因。(1)哪一位調(diào)查研究人員在其所抽取的樣本中得到的少年兒童的平均身高較大?或者這兩組樣本的平均身高相同?(2)哪一位調(diào)查研究人員在其所抽取的樣本中得到的少年兒童身高的標(biāo)準(zhǔn)差較大?或者這兩組樣本的標(biāo)準(zhǔn)差相同?(3)哪一位調(diào)查研究人員有可能得到這1100名少年兒童的最高者或最低者?或者對兩位調(diào)查研究人員來說,這種機會是相同的?解:(1)(2)兩位調(diào)查人員所得到的平均身高和標(biāo)準(zhǔn)差應(yīng)該差不多相同,因為均值和標(biāo)準(zhǔn)差的大小基本上不受樣本大小的影響。(3)具有較大樣本的調(diào)查人員有更大的機會取到最高或最低者,因為樣本越大,變化的范圍就可能越大?!?3.一項關(guān)于大學(xué)生體重狀況的研究發(fā)現(xiàn),男生的平均體重為60公斤,標(biāo)準(zhǔn)差為5公斤;女生的平均體重為50公斤(1)是男生的體重差異大還是女生的體重差異大?為什么?(2)以磅為單位(1公斤=2.2磅(3)粗略地估計一下,男生中有百分之幾的人體重在55公斤到65公斤之間?(4)粗略地估計一下,女生中有百分之幾的人體重在40公斤到60公斤之間?解:(1)由于兩組的平均體重不相等,應(yīng)通過比較離散系數(shù)確定體重差異較大的組:因為女生的離散系數(shù)為V===0.1男生體重的離散系數(shù)為V===0.08對比可知女生的體重差異較大。(2)男生:==27.27(磅),s==2.27(磅);女生:==22.73(磅),s==2.27(磅);(3)68%;(4)95%。14.對10名成年人和10名幼兒的身高(厘米)進行抽樣調(diào)查,結(jié)果如下:成年組166169172177180170172174168173幼兒組68696870717372737475(1)要比較成年組和幼兒組的身高差異,你會采用什么樣的指標(biāo)測度值?為什么?(2)比較分析哪一組的身高差異大?解:(1)應(yīng)采用離散系數(shù),因為成年人和幼兒的身高處于不同的水平,采用標(biāo)準(zhǔn)差比較不合適。離散系數(shù)消除了不同組數(shù)據(jù)水平高低的影響,采用離散系數(shù)就較為合理。(2)利用Excel進行計算,得成年組身高的平均數(shù)為172.1,標(biāo)準(zhǔn)差為4.202,從而得:成年組身高的離散系數(shù):;又得幼兒組身高的平均數(shù)為71.3,標(biāo)準(zhǔn)差為2.497,從而得:幼兒組身高的離散系數(shù):;由于幼兒組身高的離散系數(shù)大于成年組身高的離散系數(shù),說明幼兒組身高的離散程度相對較大。15.一種產(chǎn)品需要人工組裝,現(xiàn)有三種可供選擇的組裝方法。為檢驗?zāi)姆N方法更好,隨機抽取15個工人,讓他們分別用三種方法組裝。下面是15個工人分別用三種方法在相同的時間內(nèi)組裝的產(chǎn)品數(shù)量(單位:個):方法A方法B方法C164129125167130126168129126165130127170131126165130128164129127168127126164128127162128127163127125166128126167128116166125126165132125你準(zhǔn)備采用什么方法來評價組裝方法的優(yōu)劣?如果讓你選擇一種方法,你會作出怎樣的選擇?試說明理由。解:(1)下表給計算出這三種組裝方法的一些主要描述統(tǒng)計量:方法A方法B方法C平均165.6平均128.73平均125.53中位數(shù)165中位數(shù)129中位數(shù)126眾數(shù)164眾數(shù)128眾數(shù)126標(biāo)準(zhǔn)偏差2.13標(biāo)準(zhǔn)偏差1.75標(biāo)準(zhǔn)偏差2.77極差8極差7極差12最小值162最小值125最小值116最大值170最大值132最大值128評價優(yōu)劣應(yīng)根據(jù)離散系數(shù),據(jù)上得:方法A的離散系數(shù)VA==0.0129,方法B的離散系數(shù)VB==0.0136,方法C的離散系數(shù)VC==0.0221;對比可見,方法A的離散系數(shù)最低,說明方法A最優(yōu)。(2)我會選擇方法A,因為方法A的平均產(chǎn)量最高而離散系數(shù)最低,說明方法A的產(chǎn)量高且穩(wěn)定,有推廣意義。16.在金融證券領(lǐng)域,一項投資的的預(yù)期收益率的變化通常用該項投資的風(fēng)險來衡量。預(yù)期收益率的變化越小,投資風(fēng)險越低,預(yù)期收益率的變化越大,投資風(fēng)險就越高。下面的兩個直方圖,分別反映了200種商業(yè)類股票和200種高科技類股票的收益率分布。在股票市場上,高收益率往往伴隨著高風(fēng)險。但投資于哪類股票,往往與投資者的類型有一定關(guān)系。(1)你認(rèn)為該用什么樣的統(tǒng)計測度值來反映投資的風(fēng)險?(2)如果選擇風(fēng)險小的股票進行投資,應(yīng)該選擇商業(yè)類股票還是高科技類股票?(3)如果你進行股票投資,你會選擇商業(yè)類股票還是高科技類股票?頻數(shù)025頻數(shù)0255002550頻數(shù)-3003060-3003060收益率收益率(a)商業(yè)類股票(b)高科技類股票解:(1)方差或標(biāo)準(zhǔn)差;(2)商業(yè)類股票;(3)(略)。17.下圖給出了2000年美國人口年齡的金字塔,其繪制方法及其數(shù)字說明與【例2.10】相同,試對該圖反映的人口、政治、社會、經(jīng)濟狀況進行分析。第3章概率與概率分布——練習(xí)題(全免)1.某技術(shù)小組有12人,他們的性別和職稱如下,現(xiàn)要產(chǎn)生一名幸運者。試求這位幸運者分別是以下幾種可能的概率:(1)女性;(2)工程師;(3)女工程師,(4)女性或工程師。并說明幾個計算結(jié)果之間有何關(guān)系?序號123456789101112性別男男男女男男女男女女男男職稱工程師技術(shù)員技術(shù)員技術(shù)員技術(shù)員工程師工程師技術(shù)員技術(shù)員工程師技術(shù)員技術(shù)員解:設(shè)A=女性,B=工程師,AB=女工程師,A+B=女性或工程師(1)P(A)=4/12=1/3(2)P(B)=4/12=1/3(3)P(AB)=2/12=1/6(4)P(A+B)=P(A)+P(B)-P(AB)=1/3+1/3-1/6=1/22.某種零件加工必須依次經(jīng)過三道工序,從已往大量的生產(chǎn)記錄得知,第一、二、三道工序的次品率分別為0.2,0.1,0.1,并且每道工序是否產(chǎn)生次品與其它工序無關(guān)。試求這種零件的次品率。解:求這種零件的次品率,等于計算“任取一個零件為次品”(記為A)的概率。考慮逆事件“任取一個零件為正品”,表示通過三道工序都合格。據(jù)題意,有:于是3.已知參加某項考試的全部人員合格的占80%,在合格人員中成績優(yōu)秀只占15%。試求任一參考人員成績優(yōu)秀的概率。解:設(shè)A表示“合格”,B表示“優(yōu)秀”。由于B=AB,于是=0.8×0.15=0.124.某項飛碟射擊比賽規(guī)定一個碟靶有兩次命中機會(即允許在第一次脫靶后進行第二次射擊)。某射擊選手第一發(fā)命中的可能性是80%,第二發(fā)命中的可能性為50%。求該選手兩發(fā)都脫靶的概率。解:設(shè)A=第1發(fā)命中。B=命中碟靶。求命中概率是一個全概率的計算問題。再利用對立事件的概率即可求得脫靶的概率。=0.8×1+0.2×0.5=0.9脫靶的概率=1-0.9=0.1或(解法二):P(脫靶)=P(第1次脫靶)×P(第2次脫靶)=0.2×0.5=0.15.已知某地區(qū)男子壽命超過55歲的概率為84%,超過70歲以上的概率為63%。試求任一剛過55歲生日的男子將會活到70歲以上的概率為多少?解:設(shè)A=活到55歲,B=活到70歲。所求概率為:6.某企業(yè)決策人考慮是否采用一種新的生產(chǎn)管理流程。據(jù)對同行的調(diào)查得知,采用新生產(chǎn)管理流程后產(chǎn)品優(yōu)質(zhì)率達95%的占四成,優(yōu)質(zhì)率維持在原來水平(即80%)的占六成。該企業(yè)利用新的生產(chǎn)管理流程進行一次試驗,所生產(chǎn)5件產(chǎn)品全部達到優(yōu)質(zhì)。問該企業(yè)決策者會傾向于如何決策?解:這是一個計算后驗概率的問題。設(shè)A=優(yōu)質(zhì)率達95%,=優(yōu)質(zhì)率為80%,B=試驗所生產(chǎn)的5件全部優(yōu)質(zhì)。P(A)=0.4,P()=0.6,P(B|A)=0.955,P(B|)=0.85,所求概率為:決策者會傾向于采用新的生產(chǎn)管理流程。7.某公司從甲、乙、丙三個企業(yè)采購了同一種產(chǎn)品,采購數(shù)量分別占總采購量的25%、30%和45%。這三個企業(yè)產(chǎn)品的次品率分別為4%、5%、3%。如果從這些產(chǎn)品中隨機抽出一件,試問:(1)抽出次品的概率是多少?(2)若發(fā)現(xiàn)抽出的產(chǎn)品是次品,問該產(chǎn)品來自丙廠的概率是多少?解:令A(yù)1、A2、A3分別代表從甲、乙、丙企業(yè)采購產(chǎn)品,B表示次品。由題意得:P(A1)=0.25,P(A2)=0.30,P(A3)=0.45;P(B|A1)=0.04,P(B|A2)=0.05,P(B|A3)=0.03;因此,所求概率分別為:(1)=0.25×0.04+0.30×0.05+0.45×0.03=0.0385(2)8.某人在每天上班途中要經(jīng)過3個設(shè)有紅綠燈的十字路口。設(shè)每個路口遇到紅燈的事件是相互獨立的,且紅燈持續(xù)24秒而綠燈持續(xù)36秒。試求他途中遇到紅燈的次數(shù)的概率分布及其期望值和方差、標(biāo)準(zhǔn)差。解:據(jù)題意,在每個路口遇到紅燈的概率是p=24/(24+36)=0.4。設(shè)途中遇到紅燈的次數(shù)=X,因此,X~B(3,0.4)。其概率分布如下表:xi0123P(X=xi)0.2160.4320.2880.064期望值(均值)=1.2(次),方差=0.72,標(biāo)準(zhǔn)差=0.8485(次)9.一家人壽保險公司某險種的投保人數(shù)有20000人,據(jù)測算被保險人一年中的死亡率為萬分之5。保險費每人50元。若一年中死亡,則保險公司賠付保險金額50000元。試求未來一年該保險公司將在該項保險中(這里不考慮保險公司的其它費用):(1)至少獲利50萬元的概率;(2)虧本的概率;(3)支付保險金額的均值和標(biāo)準(zhǔn)差。解:設(shè)被保險人死亡數(shù)=X,X~B(20000,0.0005)。(1)收入=20000×50(元)=100萬元。要獲利至少50萬元,則賠付保險金額應(yīng)該不超過50萬元,等價于被保險人死亡數(shù)不超過10人。所求概率為:P(X≤10)=0.58304。(2)當(dāng)被保險人死亡數(shù)超過20人時,保險公司就要虧本。所求概率為:P(X>20)=1-P(X≤20)=1-0.99842=0.00158(3)支付保險金額的均值=50000×E(X)=50000×20000×0.0005(元)=50(萬元)支付保險金額的標(biāo)準(zhǔn)差=50000×σ(X)=50000×(20000×0.0005×0.9995)1/2=158074(元)10.對上述練習(xí)題3.09的資料,試問:(1)可否利用泊松分布來近似計算?(2)可否利用正態(tài)分布來近似計算?(3)假如投保人只有5000人,可利用哪種分布來近似計算?解:(1)可以。當(dāng)n很大而p很小時,二項分布可以利用泊松分布來近似計算。本例中,λ=np=20000×0.0005=10,即有X~P(10)。計算結(jié)果與二項分布所得結(jié)果幾乎完全一致。(2)也可以。盡管p很小,但由于n非常大,np和np(1-p)都大于5,二項分布也可以利用正態(tài)分布來近似計算。本例中,np=20000×0.0005=10,np(1-p)=20000×0.0005×(1-0.0005)=9.995,即有X~N(10,9.995)。相應(yīng)的概率為:P(X≤10.5)=0.51995,P(X≤20.5)=0.853262??梢娬`差比較大(這是由于P太小,二項分布偏斜太嚴(yán)重)。【注】由于二項分布是離散型分布,而正態(tài)分布是連續(xù)性分布,所以,用正態(tài)分布來近似計算二項分布的概率時,通常在二項分布的變量值基礎(chǔ)上加減0.5作為正態(tài)分布對應(yīng)的區(qū)間點,這就是所謂的“連續(xù)性校正”。(3)由于p=0.0005,假如n=5000,則np=2.5<5,二項分布呈明顯的偏態(tài),用正態(tài)分布來計算就會出現(xiàn)非常大的誤差。此時宜用泊松分布去近似。11.某企業(yè)生產(chǎn)的某種電池壽命近似服從正態(tài)分布,且均值為200小時,標(biāo)準(zhǔn)差為30小時。若規(guī)定壽命低于150小時為不合格品。試求該企業(yè)生產(chǎn)的電池的:(1)合格率是多少?(2)電池壽命在200左右多大的范圍內(nèi)的概率不小于0.9。解:(1)=0.04779合格率為1-0.04779=0.95221或95.221%。(2)設(shè)所求值為K,滿足電池壽命在200±K小時范圍內(nèi)的概率不小于0.9,即有:即:,K/30≥1.64485,故K≥49.3456。12.某商場某銷售區(qū)域有6種商品。假如每1小時內(nèi)每種商品需要12分鐘時間的咨詢服務(wù),而且每種商品是否需要咨詢服務(wù)是相互獨立的。求:(1)在同一時刻需用咨詢的商品種數(shù)的最可能值是多少?(2)若該銷售區(qū)域僅配有2名服務(wù)員,則因服務(wù)員不足而不能提供咨詢服務(wù)的概率是多少?解:設(shè)X=同一時刻需用咨詢服務(wù)的商品種數(shù),由題意有X~B(6,0.2)(1)X的最可能值為:X0=[(n+1)p]=[7×0.2]=1(取整數(shù))(2)=1-0.9011=0.0989第4章抽樣與抽樣分布——練習(xí)題(全免)1.一個具有個觀察值的隨機樣本抽自于均值等于20、標(biāo)準(zhǔn)差等于16的總體。⑴給出的抽樣分布(重復(fù)抽樣)的均值和標(biāo)準(zhǔn)差⑵描述的抽樣分布的形狀。你的回答依賴于樣本容量嗎?⑶計算標(biāo)準(zhǔn)正態(tài)統(tǒng)計量對應(yīng)于的值。⑷計算標(biāo)準(zhǔn)正態(tài)統(tǒng)計量對應(yīng)于的值。解:已知n=64,為大樣本,μ=20,σ=16,⑴在重復(fù)抽樣情況下,的抽樣分布的均值為a.20,2b.近似正態(tài)c.-2.25d.1.502.參考練習(xí)4.1求概率。⑴<16;⑵>23;⑶>25;⑷.落在16和22之間;⑸<14。解:a.0.0228b.0.0668c.0.0062d.0.8185e.0.00133.一個具有個觀察值的隨機樣本選自于、的總體。試求下列概率的近似值:解:a.0.8944b.0.0228c.0.1292d.0.96994.一個具有個觀察值的隨機樣本選自于和的總體。⑴你預(yù)計的最大值和最小值是什么?⑵你認(rèn)為至多偏離多么遠?⑶為了回答b你必須要知道嗎?請解釋。解:a.101,99b.1c.不必5.考慮一個包含的值等于0,1,2,…,97,98,99的總體。假設(shè)的取值的可能性是相同的。則運用計算機對下面的每一個值產(chǎn)生500個隨機樣本,并對于每一個樣本計算。對于每一個樣本容量,構(gòu)造的500個值的相對頻率直方圖。當(dāng)值增加時在直方圖上會發(fā)生什么變化?存在什么相似性?這里和。解:趨向正態(tài)6.美國汽車聯(lián)合會(AAA)是一個擁有90個俱樂部的非營利聯(lián)盟,它對其成員提供旅行、金融、保險以及與汽車相關(guān)的各項服務(wù)。1999年5月,AAA通過對會員調(diào)查得知一個4口之家出游中平均每日餐飲和住宿費用大約是213美元(《旅行新聞》TravelNews,1999年5月11日)。假設(shè)這個花費的標(biāo)準(zhǔn)差是15美元,并且AAA所報道的平均每日消費是總體均值。又假設(shè)選取49個4描述(樣本家庭平均每日餐飲和住宿的消費)的抽樣分布。特別說明服從怎樣的分布以及的均值和方差是什么?證明你的回答;對于樣本家庭來說平均每日消費大于213美元的概率是什么?大于217美元的概率呢?在209美元和217美元之間的概率呢?解:a.正態(tài)分布,213,4.5918b.0.5,0.031,0.9387.技術(shù)人員對奶粉裝袋過程進行了質(zhì)量檢驗。每袋的平均重量標(biāo)準(zhǔn)為克、標(biāo)準(zhǔn)差為克。監(jiān)控這一過程的技術(shù)人者每天隨機地抽取36袋,并對每袋重量進行測量。現(xiàn)考慮這36袋奶粉所組成樣本的平均重量。(1)描述的抽樣分布,并給出和的值,以及概率分布的形狀;假設(shè)某一天技術(shù)人員觀察到,這是否意味著裝袋過程出現(xiàn)問題了呢,為什么?解:a.406,1.68,正態(tài)分布b.0.001c.是,因為小概率出現(xiàn)了8.在本章的統(tǒng)計實踐中,某投資者考慮將1000美元投資于種不同的股票。每一種股票月收益率的均值為,標(biāo)準(zhǔn)差。對于這五種股票的投資組合,投資者每月的收益率是。投資者的每月收益率的方差是,它是投資者所面臨風(fēng)險的一個度量。假如投資者將1000美元僅投資于這5種股票的其中3種,則這個投資者所面對的風(fēng)險將會增加還是減少?請解釋;假設(shè)將1000美元投資在另外10種收益率與上述的完全一樣的股票,試度量其風(fēng)險,并與只投資5種股票的情形進行比較。解:a.增加b.減少9.某制造商為擊劍運動員生產(chǎn)安全夾克,這些夾克是以劍鋒刺入其中時所需的最小力量(以牛頓為單位)來定級的。如果生產(chǎn)工藝操作正確,則他生產(chǎn)的夾克級別應(yīng)平均840牛頓,標(biāo)準(zhǔn)差15牛頓。國際擊劍管理組織(FIE)希望這些夾克的最低級別不小于800牛頓。為了檢查其生產(chǎn)過程是否正常,某檢驗人員從生產(chǎn)過程中抽取了50個夾克作為一個隨機樣本進行定級,并計算,即該樣本中夾克級別的均值。她假設(shè)這個過程的標(biāo)準(zhǔn)差是固定的,但是擔(dān)心級別均值可能已經(jīng)發(fā)生變化。如果該生產(chǎn)過程仍舊正常,則的樣本分布為何?假設(shè)這個檢驗人員所抽取樣本的級別均值為830牛頓,則如果生產(chǎn)過程正常的話,樣本均值≤830牛頓的概率是多少?在檢驗人員假定生產(chǎn)過程的標(biāo)準(zhǔn)差固定不變時,你對b部分有關(guān)當(dāng)前生產(chǎn)過程的現(xiàn)狀有何看法(即夾克級別均值是否仍為840牛頓)?現(xiàn)在假設(shè)該生產(chǎn)過程的均值沒有變化,但是過程的標(biāo)準(zhǔn)差從15牛頓增加到了45牛頓。在這種情況下的抽樣分布是什么?當(dāng)具有這種分布時,則≤830牛頓的概率是多少?解:a.正態(tài)b.約等于0c.不正常d.正態(tài),0.0610.在任何生產(chǎn)過程中,產(chǎn)品質(zhì)量的波動都是不可避免的。產(chǎn)品質(zhì)量的變化可被分成兩類:由于特殊原因所引起的變化(例如,某一特定的機器),以及由于共同的原因所引起的變化(例如,產(chǎn)品的設(shè)計很差)。一個去除了質(zhì)量變化的所有特殊原因的生產(chǎn)過程被稱為是穩(wěn)定的或者是在統(tǒng)計控制中的。剩余的變化只是簡單的隨機變化。假如隨機變化太大,則管理部門不能接受,但只要消除變化的共同原因,便可減少變化(Deming,1982,1986;DeVor,Chang,和Sutherland,1992)。通常的做法是將產(chǎn)品質(zhì)量的特征繪制到控制圖上,然后觀察這些數(shù)值隨時間如何變動。例如,為了控制肥皂中堿的數(shù)量,可以每小時從生產(chǎn)線中隨機地抽選塊試驗肥皂作為樣本,并測量其堿的數(shù)量,不同時間的樣本含堿量的均值描繪在下圖中。假設(shè)這個過程是在統(tǒng)計控制中的,則的分布將具有過程的均值,標(biāo)準(zhǔn)差具有過程的標(biāo)準(zhǔn)差除以樣本容量的平方根,。下面的控制圖中水平線表示過程均值,兩條線稱為控制極限度,位于的上下3的位置。假如落在界限的外面,則有充分的理由說明目前存在變化的特殊原因,這個過程一定是失控的。當(dāng)生產(chǎn)過程是在統(tǒng)計控制中時,肥皂試驗樣本中堿的百分比將服從和的近似的正態(tài)分布。假設(shè)則上下控制極限應(yīng)距離多么遠?假如這個過程是在控制中,則落在控制極限之外的概率是多少?假設(shè)抽取樣本之前,過程均值移動到,則由樣本得出這個過程失控的(正確的)結(jié)論的概率是多少?解:a.0.015b.0.0026c.0.15874.11.參考練習(xí)4.10。肥皂公司決定設(shè)置比練習(xí)4.10中所述的這一限度更為嚴(yán)格的控制極限。特別地,當(dāng)加工過程在控制中時,公司愿意接受落在控制極限外面的概率是0.10。若公司仍想將控制極限度設(shè)在與均值的上下距離相等之處,并且仍計劃在每小時的樣本中使用個觀察值,則控制極限應(yīng)該設(shè)定在哪里?假設(shè)a部分中的控制極限已付諸實施,但是公司不知道,現(xiàn)在是3%(而不是2%)。若,則落在控制極限外面的概率是多少?若呢?解:a.(0.012,0.028)b.0.6553,0.72784.12.參考練習(xí)4.11。為了改進控制圖的敏感性,有時將警戒線與控制極限一起畫在圖上。警戒限一般被設(shè)定為。假如有兩個連續(xù)的數(shù)據(jù)點落在警戒限之外,則這個過程一定是失控的(蒙哥馬利,1991年)。假設(shè)肥皂加工過程是在控制中(即,它遵循和的正態(tài)分布),則的下一個值落在警戒限之外的概率是什么?假設(shè)肥皂加工過程是在控制中,則你預(yù)料到畫在控制圖上的的這40個值中有多少個點落在上控制極限以上?假設(shè)肥皂加工過程是在控制中,則的兩個未來數(shù)值落在下警戒線以下的概率是多少?解:a.0.05b.1c.0.000625參數(shù)估計●1.從一個標(biāo)準(zhǔn)差為5的總體中抽出一個容量為40的樣本,樣本均值為25。樣本均值的抽樣標(biāo)準(zhǔn)差等于多少?在95%的置信水平下,允許誤差是多少?解:已知總體標(biāo)準(zhǔn)差σ=5,樣本容量n=40,為大樣本,樣本均值=25,(1)樣本均值的抽樣標(biāo)準(zhǔn)差===0.7906(2)已知置信水平1-=95%,得=1.96,于是,允許誤差是E==1.96×0.7906=1.5496?!?.某快餐店想要估計每位顧客午餐的平均花費金額,在為期3周的時間里選取49名顧客組成了一個簡單隨機樣本。假定總體標(biāo)準(zhǔn)差為15元,求樣本均值的抽樣標(biāo)準(zhǔn)誤差;在95%的置信水平下,求允許誤差;如果樣本均值為120元,求總體均值95%的置信區(qū)間。解:(1)已假定總體標(biāo)準(zhǔn)差為=15元,則樣本均值的抽樣標(biāo)準(zhǔn)誤差為===2.1429(2)已知置信水平1-=95%,得=1.96,于是,允許誤差是E==1.96×2.1429=4.2000。(3)已知樣本均值為=120元,置信水平1-=95%,得=1.96,這時總體均值的置信區(qū)間為=120±4.2=可知,如果樣本均值為120元,總體均值95%的置信區(qū)間為(115.8,124.2)元?!?.某大學(xué)為了解學(xué)生每天上網(wǎng)的時間,在全校7500名學(xué)生中采取不重復(fù)抽樣方法隨機抽取36人,調(diào)查他們每天上網(wǎng)的時間,得到下面的數(shù)據(jù)(單位:小時):4.42.02.5求該校大學(xué)生平均上網(wǎng)時間的置信區(qū)間,置信水平分別為90%、95%和99%。解:⑴計算樣本均值:將上表數(shù)據(jù)復(fù)制到Excel表中,并整理成一列,點擊最后數(shù)據(jù)下面空格,選擇自動求平均值,回車,得到=3.316667,⑵計算樣本方差s:刪除Excel表中的平均值,點擊自動求值→其它函數(shù)→STDEV→選定計算數(shù)據(jù)列→確定→確定,得到s=1.6093也可以利用Excel進行列表計算:選定整理成一列的第一行數(shù)據(jù)的鄰列的單元格,輸入“=(a7-3.316667)^2”=90.65再對總和除以n-1=35后,求平方根,即為樣本方差的值s===1.6093。⑶計算樣本均值的抽樣標(biāo)準(zhǔn)誤差:已知樣本容量n=36,為大樣本,得樣本均值的抽樣標(biāo)準(zhǔn)誤差為===0.2682⑷分別按三個置信水平計算總體均值的置信區(qū)間:置信水平為90%時:由雙側(cè)正態(tài)分布的置信水平1-=90%,通過2-1=0.9換算為單側(cè)正態(tài)分布的置信水平=0.95,查單側(cè)正態(tài)分布表得=1.64,計算得此時總體均值的置信區(qū)間為=3.3167±1.64×0.2682=可知,當(dāng)置信水平為90%時,該校大學(xué)生平均上網(wǎng)時間的置信區(qū)間為(2.87,3.76)小時;置信水平為95%時:由雙側(cè)正態(tài)分布的置信水平1-=95%,得=1.96,計算得此時總體均值的置信區(qū)間為=3.3167±1.96×0.2682=可知,當(dāng)置信水平為95%時,該校大學(xué)生平均上網(wǎng)時間的置信區(qū)間為(2.79,3.84)小時;置信水平為99%時:若雙側(cè)正態(tài)分布的置信水平1-=99%,通過2-1=0.99換算為單側(cè)正態(tài)分布的置信水平=0.995,查單側(cè)正態(tài)分布表得=2.58,計算得此時總體均值的置信區(qū)間為=3.3167±2.58×0.2682=可知,當(dāng)置信水平為99%時,該校大學(xué)生平均上網(wǎng)時間的置信區(qū)間為(2.62,4.01)小時。4.從一個正態(tài)總體中隨機抽取容量為8的樣本,各樣本值分別為:10,8,12,15,6,13,5,11。求總體均值95%的置信區(qū)間。解:(7.1,12.9)。5.某居民小區(qū)為研究職工上班從家里到單位的距離,抽取了由16個人組成的一個隨機樣本,他們到單位的距離(公里)分別是:103148691211751015916132求職工上班從家里到單位平均距離95%的置信區(qū)間。解:(7.18,11.57)。●6.在一項家電市場調(diào)查中,隨機抽取了200個居民戶,調(diào)查他們是否擁有某一品牌的電視機。其中擁有該品牌電視機的家庭占23%。求總體比率的置信區(qū)間,置信水平分別為90%和95%。解:已知樣本容量n=200,為大樣本,擁有該品牌電視機的家庭比率p=23%,擁有該品牌電視機的家庭比率的抽樣標(biāo)準(zhǔn)誤差為===2.98%⑴雙側(cè)置信水平為90%時,通過2-1=0.90換算為單側(cè)正態(tài)分布的置信水平=0.95,查單側(cè)正態(tài)分布表得=1.64,此時的置信區(qū)間為=23%±1.64×2.98%=可知,當(dāng)置信水平為90%時,擁有該品牌電視機的家庭總體比率的置信區(qū)間為(18.11%,27.89%)。⑵雙側(cè)置信水平為95%時,得=1.96,此時的置信區(qū)間為=23%±1.96×2.98%=可知,當(dāng)置信水平為95%時,擁有該品牌電視機的家庭總體比率的置信區(qū)間為;(17.16%,28.84%)?!?.某居民小區(qū)共有居民500戶,小區(qū)管理者準(zhǔn)備采取一項新的供水設(shè)施,想了解居民是否贊成。采取重復(fù)抽樣方法隨機抽取了50戶,其中有32戶贊成,18戶反對。(1)求總體中贊成該項改革的戶數(shù)比率的置信區(qū)間,置信水平為95%;(2)如果小區(qū)管理者預(yù)計贊成的比率能達到80%,應(yīng)抽取多少戶進行調(diào)查?解:已知總體單位數(shù)N=500,重復(fù)抽樣,樣本容量n=50,為大樣本,樣本中,贊成的人數(shù)為n1=32,得到贊成的比率為p===64%(1)贊成比率的抽樣標(biāo)準(zhǔn)誤差為==6.788%由雙側(cè)正態(tài)分布的置信水平1-=95%,得=1.96,計算得此時總體戶數(shù)中贊成該項改革的戶數(shù)比率的置信區(qū)間為=64%±1.96×6.788%=可知,置信水平為95%時,總體中贊成該項改革的戶數(shù)比率的置信區(qū)間為(50.70%,77.30%)。(2)如預(yù)計贊成的比率能達到80%,即p=80%,由=6.788%,即=6.788%得樣本容量為n==34.72取整為35,即可得,如果小區(qū)管理者預(yù)計贊成的比率能達到80%,應(yīng)抽取35戶進行調(diào)查。8.從兩個正態(tài)總體中分別抽取兩個獨立的隨機樣本,它們的均值和標(biāo)準(zhǔn)差如下表:來自總體1的樣本來自總體2的樣本求90%的置信區(qū)間;求95%的置信區(qū)間。解:(1.86,17.74);(0.19,19.41)。9.從兩個正態(tài)總體中分別抽取兩個獨立的隨機樣本,它們的均值和標(biāo)準(zhǔn)差如下表:來自總體1的樣本來自總體2的樣本(1)設(shè),求95%的置信區(qū)間;(2)設(shè),,求95%的置信區(qū)間;(3)設(shè),,求95%的置信區(qū)間;(4)設(shè),,求95%的置信區(qū)間;(5)設(shè),,求95%的置信區(qū)間。解:(1)2±1.176;(2)2±3.986;(3)2±3.986;(4)2±3.587;(5)2±3.364。10.下表是由4對觀察值組成的隨機樣本:配對號來自總體A的樣本來自總體B的樣本1202573106485(1)計算A與B各對觀察值之差,再利用得出的差值計算和;(2)設(shè)和分別為總體A和總體B的均值,構(gòu)造95%的置信區(qū)間。解:(1),;(2)1.75±4.27。11.從兩個總體中各抽取一個的獨立隨機樣本,來自總體1的樣本比率為,來自總體2的樣本比率為。(1)構(gòu)造90%的置信區(qū)間;(2)構(gòu)造95%的置信區(qū)間。解:(1)10%±6.98%;(2)10%±8.32%。12.生產(chǎn)工序的方差是共需質(zhì)量的一個重要度量。當(dāng)方差較大時,需要對共需進行改進以減小方差。下面是兩部機器生產(chǎn)的袋茶重量(克)的數(shù)據(jù):機器1機器23.453.223.903.223.283.353.202.983.703.383.193.303.223.753.283.303.203.053.503.383.353.303.293.332.953.453.203.343.353.273.163.483.123.203.343.25構(gòu)造兩個總體方差比95%的置信區(qū)間。解:(4.06,14.35)。●13.根據(jù)以往的生產(chǎn)數(shù)據(jù),某種產(chǎn)品的廢品率為2%。如果要求95%的置信區(qū)間,若要求允許誤差不超過4%,應(yīng)抽取多大的樣本?解:已知總體比率=2%=0.02,由置信水平1-α=95%,得置信度=1.96,允許誤差E≤4%即由允許誤差公式E=整理得到樣本容量n的計算公式:n===≥=47.0596由于計算結(jié)果大于47,故為保證使“≥”成立,至少應(yīng)取48個單位的樣本?!?4.某超市想要估計每個顧客平均每次購物花費的金額。根據(jù)過去的經(jīng)驗,標(biāo)準(zhǔn)差大約為120元,現(xiàn)要求以95%的置信水平估計每個購物金額的置信區(qū)間,并要求允許誤差不超過20元,應(yīng)抽取多少個顧客作為樣本?解:已知總體標(biāo)準(zhǔn)差=120,由置信水平1-α=95%,得置信度=1.96,允許誤差E≤20即由允許誤差公式E=整理得到樣本容量n的計算公式:n=≥=138.2976由于計算結(jié)果大于47,故為保證使“≥”成立,至少應(yīng)取139個顧客作為樣本。15.假定兩個總體的標(biāo)準(zhǔn)差分別為:,,若要求誤差范圍不超過5,相應(yīng)的置信水平為95%,假定,估計兩個總體均值之差時所需的樣本容量為多大?解:57。16.假定,允許誤差,相應(yīng)的置信水平為95%,估計兩個總體比率之差時所需的樣本容量為多大?解:769。第6章假設(shè)檢驗——練習(xí)題(全免)研究者想要尋找證據(jù)予以支持的假設(shè)是“新型弦線的平均抗拉強度相對于以前提高了”,所以原假設(shè)與備擇假設(shè)應(yīng)為:,。=“某一品種的小雞因為同類相殘而導(dǎo)致的死亡率”,,。,。(1)第一類錯誤是該供應(yīng)商提供的這批炸土豆片的平均重量的確大于等于60克,但檢驗結(jié)果卻提供證據(jù)支持店方傾向于認(rèn)為其重量少于60克;(2)第二類錯誤是該供應(yīng)商提供的這批炸土豆片的平均重量其實少于60克,但檢驗結(jié)果卻沒有提供足夠的證據(jù)支持店方發(fā)現(xiàn)這一點,從而拒收這批產(chǎn)品;(3)連鎖店的顧客們自然看重第二類錯誤,而供應(yīng)商更看重第一類錯誤。(1)檢驗統(tǒng)計量,在大樣本情形下近似服從標(biāo)準(zhǔn)正態(tài)分布;(2)如果,就拒絕;(3)檢驗統(tǒng)計量=2.94>1.645,所以應(yīng)該拒絕。=3.11,拒絕。=1.93,不拒絕。=7.48,拒絕。=206.22,拒絕。=-5.145,拒絕。=1.36,不拒絕。=-4.05,拒絕。=8.28,拒絕。(1)檢驗結(jié)果如下:t-檢驗:雙樣本等方差假設(shè)變量1變量2平均100.7109.9方差24.1157894733.35789474觀測值2020合并方差28.73684211假設(shè)平均差0df38tStat-5.427106029P(T<=t)單尾1.73712E-06t單尾臨界1.685953066P(T<=t)雙尾3.47424E-06t雙尾臨界2.024394234t-檢驗:雙樣本異方差假設(shè)變量1變量2平均100.7109.9方差24.1157894733.35789474觀測值2020假設(shè)平均差0df37tStat-5.427106029P(T<=t)單尾1.87355E-06t單尾臨界1.687094482P(T<=t)雙尾3.74709E-06t雙尾臨界2.026190487(2)方差檢驗結(jié)果如下:F-檢驗雙樣本方差分析變量1變量2平均100.7109.9方差24.1157894733.35789474觀測值2020df1919F0.722940991P(F<=f)單尾0.243109655F單尾臨界0.395811384第7章方差分析與試驗設(shè)計——練習(xí)題(全免)(或),不能拒絕原假設(shè)。(或),拒絕原假設(shè)。,拒絕原假設(shè);,不能拒絕原假設(shè);,拒絕原假設(shè)。方差分析表中所缺的數(shù)值如下表:差異源SSdfMSFP-valueFcrit組間42022101.4780.2459463.354131組內(nèi)383627142.07———總計425629————(或),不能拒絕原假設(shè)。有5種不同品種的種子和4種不同的施肥方案,在20快同樣面積的土地上,分別采用5種種子和4種施肥方案搭配進行試驗,取得的收獲量數(shù)據(jù)如下表:(或),拒絕原假設(shè)。(或),拒絕原假設(shè)。(或),不能拒絕原假設(shè)。(或),不能拒絕原假設(shè)。(或),拒絕原假設(shè)。(或),不能拒絕原假設(shè)。(或),不能拒絕原假設(shè)。第8章相關(guān)與回歸分析——練習(xí)題●1.表中是道瓊斯工業(yè)指數(shù)(DJIA)和標(biāo)準(zhǔn)普爾500種股票指數(shù)(S&P500)1988年至1997年對應(yīng)股票的收益率資料:年份DJIA收益率(%)S&P500收益率(%)年份DJIA收益率(%)S&P500收益率(%)198816.016.6199316.810.1198931.731.519944.91.31990-0.4-3.2199536.437.6199123.930.0199628.623.019927.47.6199724.933.4計算兩種指數(shù)收益率的相關(guān)系數(shù),分析其相關(guān)程度,以0.05的顯著性水平檢驗相關(guān)系數(shù)的顯著性。解:(1)解法一:利用Excel進行表格計算相關(guān)系數(shù)設(shè)DJIA收益率為x,S&P500收益率為y,將已知表格復(fù)制到Excel中,列出計算x2、xy、y2及其合計數(shù)的欄目并進行計算,得結(jié)果如下:(利用Excel計算進行表格計算的方法類似于標(biāo)準(zhǔn)差的Excel計算)年份DJIA收益率(%)S&P500收益率(%)X2xyy2xy198816.016.6256265.6275.56198931.731.51004.89998.55992.251990-0.4-810.24199123.930.0571.2171790019927.47.654.7656.2457.76199316.810.1282.24169.68102.0119944.91.324.016.371.69199536.437.61324.961368.641413.76199628.623.0817.96657.8529199724.933.4620.01831.661115.56合計190.2187.94956.25072.825397.83代入相關(guān)系數(shù)計算公式得:r===0.948138解法二:利用Excel函數(shù)“CORREL”計算相關(guān)系數(shù)(Correlationcoefficient,相關(guān)系數(shù))=1\*GB3①將已知數(shù)據(jù)表復(fù)制到Excel中,同類數(shù)據(jù)置于同一列;②在表格外選擇某一單元格后,點選菜單欄中“∑”右邊的“▼”后,選擇“其它函數(shù)”,在“插入函數(shù)”窗口中,點擊“或選擇類別(C)”輸入欄右邊的“∨”,選擇“統(tǒng)計”,再在“選擇函數(shù)(N)”中選擇函數(shù)“CORREL”,然后點擊“確定”;③在“函數(shù)參數(shù)”窗口中,點擊“Array1”輸入欄后,在Excel表中刷取“DJIA收益率”數(shù)據(jù),再點擊“Array2”輸入欄后,在Excel表中刷取“S&P500收益率”數(shù)據(jù),然后點擊“確定”。(由于相關(guān)系數(shù)中,兩變量是對等的,故兩列數(shù)據(jù)的選擇順序可以對換,而計算結(jié)果是相同的。)這時即在第②步驟中所選擇的單元格中出現(xiàn)相關(guān)系數(shù)的計算結(jié)果??芍嚓P(guān)系數(shù)為,以上相關(guān)系數(shù)的計算結(jié)果說明,DJIA收益率與S&P500收益率的相關(guān)程度屬于高度正相關(guān)。(2)計算t統(tǒng)計量(免)給定顯著性水平=0.05,查t分布表得自由度n-2=10-2=8的臨界值為2.306,顯然,表明相關(guān)系數(shù)r在統(tǒng)計上是顯著的。2.利用【例8-3】的表8.3中提供的各省市人均GDP和第一產(chǎn)業(yè)中就業(yè)比例的數(shù)據(jù),試分析各省市人均GDP與第一產(chǎn)業(yè)就業(yè)比例的相關(guān)性,并對其顯著性作統(tǒng)計檢驗。解:表8.3中提供的各省市人均GDP和第一產(chǎn)業(yè)中就業(yè)比例的數(shù)據(jù)為:序號地區(qū)GDP就業(yè)比例%序號地區(qū)GDP就業(yè)比例%1北京2845.6511.217湖北4662.2848.42天津1840.1020.018湖南3983.0060.53河北5577.7849.619廣東10647.7040.04山西1779.9746.920廣西2231.1961.85內(nèi)蒙古1545.7953.921海南545.9660.36遼寧5033.0837.222重慶1749.7754.77吉林2032.4850.723四川4421.6758.88黑龍江3561.0049.624貴州1084.9066.49上海4950.8412.525云南2074.7173.610江蘇9511.9141.426西藏138.7371.811浙江6748.1535.727陜西1844.2755.712安徽3290.1358.728甘肅1072.5159.413福建4253.6845.829青海300.9560.014江西2175.6851.630寧夏298.3856.515山東9438.3152.331新疆1485.4856.616河南5640.1163.1利用Excel中的”數(shù)據(jù)分析”計算各省市人均GDP和第一產(chǎn)業(yè)中就業(yè)比例的相關(guān)系數(shù),方法同上第1題,即應(yīng)用統(tǒng)計函數(shù)“CORREL”進行計算,也可以構(gòu)成計算表格進行計算:解法一:構(gòu)成Excel計算表格對相關(guān)系數(shù)計算公式中的計算元素進行列表計算:序號地區(qū)GDP就業(yè)比例%x2xyy2xy1北京2845.6511.28097723.922531871.3125.442天津1840.1020.03385968.010036802.0400.003河北5577.7849.631111629.7284276657.92460.164山西1779.9746.93168293.200983480.62199.615內(nèi)蒙古1545.7953.92389466.724183318.12905.216遼寧5033.0837.225331894.2864187230.61383.847吉林2032.4850.74130974.9504103046.72570.498黑龍江3561.0049.612680721.0000176625.62460.169上海4950.8412.524510816.705661885.5156.2510江蘇9511.9141.490476431.8481393793.11713.9611浙江6748.1535.745537528.4225240909.01274.4912安徽3290.1358.710824955.4169193130.63445.6913福建4253.6845.818093793.5424194818.52097.6414江西2175.6851.64733583.4624112265.12662.5615山東9438.3152.389081695.6561493623.62735.2916河南5640.1163.131810840.8121355890.93981.6117湖北4662.2848.421736854.7984225654.42342.5618湖南3983.0060.515864289.0000240971.53660.2519廣東10647.7040.0113373515.2900425908.01600.0020廣西2231.1961.84978208.8161137887.53819.2421海南545.9660.3298072.321632921.43636.0922重慶1749.7754.73061695.052995712.42992.0923四川4421.6758.819551165.5889259994.23457.4424貴州1084.9066.41177008.010072037.44408.9625云南2074.7173.64304421.5841152698.75416.9626西藏138.7371.819246.01299960.85155.2427陜西1844.2755.73401331.8329102725.83102.4928甘肅1072.5159.41150277.700163707.13528.3629青海300.9560.090570.902518057.03600.0030寧夏298.3856.589030.624416858.53192.2531新疆1485.4856.62206650.830484078.23203.56合計106766.161564.7596668656.05404964521.985687.89將計算結(jié)果代入相關(guān)系數(shù)計算公式中,由上得r=====-0.342391解法二:應(yīng)用Excel中的函數(shù)“CORREL”計算,=1\*GB3①將已知數(shù)據(jù)表復(fù)制到Excel中;②在表格外選擇某一單元格,點選菜單欄中“∑”右邊的“▼”后,選擇“其它函數(shù)”,在“插入函數(shù)”窗口中,點擊“或選擇類別(C)”輸入欄右邊的“∨”,選擇“統(tǒng)計”,再在“選擇函數(shù)(N)”中選擇函數(shù)“CORREL”,然后點擊“確定”;③在“函數(shù)參數(shù)”窗口中,點擊“Array1”輸入欄后,在Excel表中刷取“就業(yè)比例%”數(shù)據(jù),再點擊“Array2”輸入欄后,在Excel表中刷取“GDP”數(shù)據(jù),然后點擊“確定”。這時即在第②步驟中所選擇的單元格中出現(xiàn)相關(guān)系數(shù)的計算結(jié)果。結(jié)果也是r=-0.34239,這說明人均GDP與第一產(chǎn)業(yè)中就業(yè)比例是負(fù)相關(guān),但相關(guān)系數(shù)只有-0.34239,表明二者相關(guān)程度并不大,屬于低度負(fù)相關(guān)關(guān)系。相關(guān)系數(shù)檢驗:(免)在總體相關(guān)系數(shù)的原假設(shè)下,計算t統(tǒng)計量:查t分布表,自由度為31-2=29,當(dāng)顯著性水平取時,=2.045;當(dāng)顯著性水平取時,=1.699。由于計算的t統(tǒng)計量的絕對值1.9624小于=2.045,所以在的顯著性水平下,不能拒絕相關(guān)系數(shù)的原假設(shè)。即是說,在的顯著性水平下不能認(rèn)為人均GDP與第一產(chǎn)業(yè)中就業(yè)比例有顯著的線性相關(guān)性。但是計算的t統(tǒng)計量的絕對值1.9624大于=1.699,所以在的顯著性水平下,可以拒絕相關(guān)系數(shù)的原假設(shè)。即在的顯著性水平下,可以認(rèn)為人均GDP與第一產(chǎn)業(yè)中就業(yè)比例有一定的線性相關(guān)性?!?.表中是16支公益股票某年的每股賬面價值和當(dāng)年紅利:公司序號賬面價值(元)紅利(元)公司序號賬面價值(元)紅利(元)122.442.4912.140.80220.892.981023.311.94322.092.061116.233.00414.481.09120.560.28520.731.96130.840.8467819.2520.3726.431.552.161.6014151618.0512.4511.331.801.211.07根據(jù)上表資料:(1)建立每股賬面價值和當(dāng)年紅利的回歸方程;(2)解釋回歸系數(shù)的經(jīng)濟意義;(3)若序號為6的公司的股票每股賬面價值增加1元,估計當(dāng)年紅利可能為多少?解:(1)設(shè)當(dāng)年紅利為Y,每股帳面價值為X則回歸方程為,下面分別應(yīng)用兩種方法計算回歸參數(shù):方法一:利用Excel進行表格運算計算公式元素:公司序號賬面價值(元)紅利(元)x2xyxy122.442.4503.553653.856220.892.98436.392162.2522322.092.06487.968145.5054414.481.09209.670415.7832520.731.96429.732940.6308619.251.55370.562529.8375720.372.16414.936943.9992826.431.6698.544942.288912.140.8147.37969.7121023.311.94543.356145.22141116.233263.412948.69120.560.280.31360.1568130.840.840.70560.70561418.051.8325.802532.491512.451.21155.002515.06451611.331.07128.368912.1231合計261.5926.745115.703498.3157將計算結(jié)果代入回歸系數(shù)計算公式,得:回歸系數(shù)==0.07287590初始值===0.47977458方法二:應(yīng)用Excel函數(shù)計算直線回歸方程的兩個參數(shù):=1\*GB2⑴應(yīng)用統(tǒng)計函數(shù)“SLOPE”計算直線斜率:(slope,斜率)=1\*GB3①在表格外選定某單元格,作為直線斜率的放置位置,點擊:菜單欄中“∑”右邊的“▼”后,選擇“其它函數(shù)”,在“插入函數(shù)”窗口中,點擊“或選擇類別(C)”輸入欄右邊的“∨”,選擇“統(tǒng)計”,再在“選擇函數(shù)(N)”中選擇函數(shù)“SLOPE”,然后點擊“確定”;=2\*GB3②在“函數(shù)參數(shù)”窗口中,點擊“Known_y’s”輸入欄后,在Excel表中刷取y列數(shù)據(jù),再點擊“Known_x’s”輸入欄后,在Excel表中刷取x列數(shù)據(jù),然后點擊“確定”。這時即在選定的單元格中出現(xiàn)直線斜率的計算結(jié)果0.072876=2\*GB2⑵應(yīng)用統(tǒng)計函數(shù)“INTERCEPT”計算直線與y軸的截距——直線起點值:(截距intercept
)=1\*GB3①在表格外選定某單元格,作為直線斜
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣東水利電力職業(yè)技術(shù)學(xué)院《分子生物學(xué)(英文)》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東石油化工學(xué)院《建筑工程概預(yù)算課程A》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025新北師大版英語七年級下單詞默寫表(英譯漢)
- 【名師伴你行】2020高考歷史-二輪強化提能專訓(xùn):綜合檢測卷(含2013年模擬、調(diào)研試題-含解析)
- 《紅對勾》2022屆高考英語人教版新課標(biāo)一輪總復(fù)習(xí)-滾動測試28
- 【9語一?!?024年合肥市蜀山區(qū)中考一模語文試題
- 【高考總動員】2022屆高考語文一輪總復(fù)習(xí)-考點綜合練4
- 2025年七年級統(tǒng)編版語文寒假復(fù)習(xí) 專題07 寫作(考點剖析+對點訓(xùn)練)
- 天津市紅橋區(qū)2024-2025學(xué)年高三上學(xué)期期末英語試題詞匯清單(含答案)
- 吉林省長春八中2024-2025學(xué)年高一(上)期末物理試卷(含答案)
- 八年級上綜合性學(xué)習(xí) 我們的互聯(lián)網(wǎng)時代 練習(xí)卷(含答案)
- 2022-2023學(xué)年四川省成都市高新區(qū)八年級(下)期末語文試卷(含解析)
- 中西文化概論(第三版)PPT完整全套教學(xué)課件
- 食品批發(fā)銷售記錄制度
- 2024學(xué)年上海市浦東新區(qū)物理高二上期末聯(lián)考試題含解析
- 粉塵應(yīng)急演練記錄
- 持續(xù)交付2 0:業(yè)務(wù)引領(lǐng)的DevOps精要(增訂本)
- 管理學(xué)基礎(chǔ)知識點總結(jié)(精華)
- (2022年整理)人民幣含硬幣教具正反面完美打印版
- 醫(yī)院心電監(jiān)護術(shù)考核表
- 谷文昌精神報告會稿件課件
評論
0/150
提交評論