(完整)回歸分析及獨(dú)立性檢驗(yàn)的基本知識(shí)點(diǎn)及習(xí)題集錦,推薦文檔_第1頁(yè)
(完整)回歸分析及獨(dú)立性檢驗(yàn)的基本知識(shí)點(diǎn)及習(xí)題集錦,推薦文檔_第2頁(yè)
(完整)回歸分析及獨(dú)立性檢驗(yàn)的基本知識(shí)點(diǎn)及習(xí)題集錦,推薦文檔_第3頁(yè)
(完整)回歸分析及獨(dú)立性檢驗(yàn)的基本知識(shí)點(diǎn)及習(xí)題集錦,推薦文檔_第4頁(yè)
(完整)回歸分析及獨(dú)立性檢驗(yàn)的基本知識(shí)點(diǎn)及習(xí)題集錦,推薦文檔_第5頁(yè)
已閱讀5頁(yè),還剩9頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、回歸分析的基本知識(shí)點(diǎn)及習(xí)題本周題目:回歸分析的基本思想及其初步應(yīng)用本周重點(diǎn):(1)通過對(duì)實(shí)際問題的分析,了解回歸分析的必要性與回歸分析的一般步驟;了解線性回歸模型與函數(shù)模型的區(qū)別;(2)嘗試做散點(diǎn)圖,求回歸直線方程;(3)能用所學(xué)的知識(shí)對(duì)實(shí)際問題進(jìn)行回歸分析,體會(huì)回歸分析的實(shí)際價(jià)值與基本思想;了解判斷刻畫回歸模型擬合好壞的方法一一相關(guān)指數(shù)和殘差分析。本周難點(diǎn):(1)求回歸直線方程,會(huì)用所學(xué)的知識(shí)對(duì)實(shí)際問題進(jìn)行回歸分析(2)掌握回歸分析的實(shí)際價(jià)值與基本思想(3)能運(yùn)用自己所學(xué)的知識(shí)對(duì)具體案例進(jìn)行檢驗(yàn)與說明(4)殘差變量的解釋;(5)偏差平方和分解的思想;本周內(nèi)容:一、基礎(chǔ)知識(shí)梳理1 .回歸直線:

2、如果散點(diǎn)圖中點(diǎn)的分布從整體上看大致在一條直線附近,我們就稱這兩個(gè)變量之間具有線性相關(guān)關(guān)系,這條直線叫作回歸直線。求回歸直線方程的一般步驟:作出散點(diǎn)圖(由樣本點(diǎn)是否呈條狀分布來判斷兩個(gè)量是否具有線性相關(guān)關(guān)系),若存在線性相關(guān)關(guān)系-求回歸系數(shù)-寫出回歸直線方程,并利用回歸直線方程進(jìn)行預(yù)測(cè)說明.2 .回歸分析:對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的一種常用方法。建立回歸模型的基本步驟是:確定研究對(duì)象,明確哪個(gè)變量是解釋變量,哪個(gè)變量是預(yù)報(bào)變量;畫好確定好的解釋變量和預(yù)報(bào)變量的散點(diǎn)圖,觀察它們之間的關(guān)系(線性關(guān)系)由經(jīng)驗(yàn)確定回歸方程的類型.按一定規(guī)則估計(jì)回歸方程中的參數(shù)(最小二乘法);得出結(jié)論后在分析

3、殘差圖是否異常,若存在異常,則檢驗(yàn)數(shù)據(jù)是否有誤,后模型是否合適等3 .利用統(tǒng)計(jì)方法解決實(shí)際問題的基本步驟:(1)提出問題;(2)收集數(shù)據(jù);(3)分析整理數(shù)據(jù);(4)進(jìn)行預(yù)測(cè)或決策。4 .殘差變量書的主要來源:(1)用線性回歸模型近似真實(shí)模型(真實(shí)模型是客觀存在的,通常我們并不知道真實(shí)模型到底是什么)所引起的誤差。可能存在非線性的函數(shù)能夠更好地描述川與或之間的關(guān)系,但是現(xiàn)在卻用線性函數(shù)來表述這種關(guān)系,結(jié)果就會(huì)產(chǎn)生誤差。這種由于模型近似所引起的誤差包含在白中。(2)忽略了某些因素的影響。影響變量)的因素不只變量X一個(gè),可能還包含其他許多因素(例如在描述身高和體重關(guān)系的模型中,體重不僅受身高的影響,

4、還會(huì)受遺傳基因、飲食習(xí)慣、生長(zhǎng)環(huán)境等其他因素的影響),但通常它們每一個(gè)因素的影響可能都是比較小的,它們的影響都體現(xiàn)在白中。(3)觀測(cè)誤差。由于測(cè)量工具等原因,得到的尸的觀測(cè)值一般是有誤差的(比如一個(gè)人的體重是確定的數(shù),不同的秤可能會(huì)得到不同的觀測(cè)值,它們與真實(shí)值之間存在誤差),這樣的誤差也包含在書中。上面三項(xiàng)誤差越小,說明我們的回歸模型的擬合效果越好。二、例題選講例1:研究某灌溉渠道水的流速>與水深或之間的關(guān)系,測(cè)得一組數(shù)據(jù)如下:水深工/附1.401.501.601.701.801.902.002.10流速f3日1.701.791.881.952.032.102.162.21(1)求對(duì)H

5、的回歸直線方程;(2)預(yù)測(cè)水深為1.95端時(shí)水的流速是多少?分析:本題考查如何求回歸直線的方程,可先把有關(guān)數(shù)據(jù)用散點(diǎn)圖表示出來,若這些點(diǎn)大致分布在通過散點(diǎn)圖中心的一條直線附近,說明這兩個(gè)變量線性相關(guān),從而可利用我們學(xué)過的最小二乘估計(jì)思想及計(jì)算公式求得線性回歸直線方程。解:1)由于問題中要求根據(jù)水深預(yù)報(bào)水的流速,因此選取水深為解釋變量,流速為預(yù)報(bào)變量,作散點(diǎn)圖:yArn-sAT+*-11911.7一*15-LLI,IIj可©14161B2J0淅由圖容易看出,正與了之間有近似的線性關(guān)系,或者說,可以用一個(gè)回歸直線方程二雙十門來反映這種關(guān)系。八1*b=鈾0.733«0,694由計(jì)

6、算器求得廠O廠對(duì)或的回歸直線方程為'二0-733工+0一694。(2)由(1)中求出的回歸直線方程,把“195代入,易得9:073以1.95+0.694用2121濯/0O計(jì)算結(jié)果表示,當(dāng)水深為L(zhǎng)95陽時(shí)可以預(yù)測(cè)渠水的流速為212碗s。評(píng)注:建立回歸模型的一般步驟:(1)確定研究對(duì)象,明確兩個(gè)變量即解釋變量和預(yù)報(bào)變量;(2)畫出散點(diǎn)圖,觀察它們之間的關(guān)系;(3)由經(jīng)驗(yàn)確定回歸方程類型(若呈線性關(guān)系,選用線性回歸方程);(4)按一定規(guī)則估計(jì)回歸方程中的參數(shù)(如最小二乘法);(5)得出結(jié)果后分析殘差圖是否有異常(個(gè)別數(shù)據(jù)對(duì)應(yīng)殘差過大,或殘差出現(xiàn)不隨機(jī)的規(guī)律性,等等),若存在異常,則檢查數(shù)據(jù)是

7、否有誤,或模型是否合適等。例2:1993年到2002年中國(guó)的國(guó)內(nèi)生產(chǎn)總值(GDP)的數(shù)據(jù)如下:年份GDP199334634.4199446759.4199558478.1199667884.6199774462.6199878345.2199982067.5200089468.1200197314.82002104790.6(1)作GDP和年份的散點(diǎn)圖,根據(jù)該圖猜想它們之間的關(guān)系應(yīng)是什么。建立年份為解釋變量,GDP為預(yù)報(bào)變量的回歸模型,并計(jì)算殘差。根據(jù)你得到的1K型,預(yù)報(bào)2003年的GDP,并查閱資料,看看你的預(yù)報(bào)與實(shí)際GDP的誤差是多少隼舟從散點(diǎn)圖中可以看出GDP值與年份近線呈線性關(guān)系;用y

8、t表示GDP值,t表示年份,根據(jù)截距和斜率的最小二乘計(jì)算公式,彳日a«-L4292537.729,b«7191969從而得線性回歸方程:'-'殘差計(jì)算結(jié)果見下表:GDP值與年份線性擬合殘差表年份19931994199519961997殘差-6422.269-1489.2383037.4935252.0244638.055年份19981999200020012002殘差1328.685-2140.984-1932.353-1277.622-993.791(3)2003年的GDP預(yù)報(bào)值為112976.360,根據(jù)國(guó)家統(tǒng)計(jì)局2004年統(tǒng)11,2003年實(shí)際GDP值

9、為117251.9,所以預(yù)報(bào)與實(shí)際相-4275.540;(4)上面建立的回歸方程的R2=0.974,說明年份能夠解釋約97%的GDP值變化,因此所建立的模型能夠很好地刻畫GDP和年份的關(guān)系。說明:關(guān)于2003年的GDP的值來源,不同的渠道可能會(huì)有所不同。震級(jí)33.23.43.63.844.24.44.64.85.0地震數(shù)28381203801479510695764155023842269819191356973震級(jí)5.25.45.65.866.26.46.66.87地震數(shù)74660443527420614898574125例3:如下表所示,某地區(qū)一段時(shí)間內(nèi)觀察到的大于或等于某震級(jí)x的地震個(gè)數(shù)

10、為N,試建立回歸方程表述二者之間的關(guān)系解:由表中數(shù)據(jù)得散點(diǎn)圖如下:靠第從散點(diǎn)圖中可以看出,震級(jí)x與大于該震級(jí)的地震次數(shù)N之間不呈線性相關(guān)關(guān)系,隨著x的減少,所考察的地震數(shù)N近似地以指數(shù)形式增長(zhǎng).做變換y=lgN,得到的數(shù)據(jù)如下表所示:x33.23.43.63.844.24.44.64.85y4.4534.3094.1704.0293.8833.7413.5853.4313.2833.1322.988x5.25.45.65.866.26.46.66.87y2.8732.7812.6382.4382.3142.1701.9911.7561.6131.398x和y的散點(diǎn)圖如下:從這個(gè)散點(diǎn)圖中可以看出

11、x和y之間有很強(qiáng)的線性相差性,因此可以用線性回歸模型擬合它們之間的關(guān)系。根據(jù)截距和斜率的最小二乘計(jì)算公式,得:1'"''1''1"G=-074lx+6704故線性回歸方程為:產(chǎn)相關(guān)指數(shù)R2弋0.997說明x可以解釋y的99.7%的變化。因此,可以用回歸方程描述x和y之間的關(guān)系例4:電容器充電后,電壓達(dá)到ioor,然后開始放電,由經(jīng)驗(yàn)知道,此后電壓v隨時(shí)間£變化的規(guī)律公式“=相色(0)表示,觀測(cè)得時(shí)間,時(shí)的電壓儀修如下表所示:£012345678910U100755540302015101055試求電壓廳對(duì)時(shí)間2的回

12、歸方程。分析:由于兩個(gè)變量不呈線性相關(guān)關(guān)系,所以不能直接利用線性回歸方程來建立兩個(gè)變量之間的關(guān)系,我們可通過對(duì)數(shù)變換把指數(shù)關(guān)系變?yōu)榫€性關(guān)系,通過線性回歸模型來建立U與片之間的非線性回歸方程。解:對(duì)U=備"兩邊取自然對(duì)數(shù)得111P=11+從,令k1口6口=1口區(qū),即“尻+厘。由所給數(shù)據(jù)可得£01234567891013)4.64.34.03.93.42.92.72.32.31.61.6其散點(diǎn)圖為:由散點(diǎn)圖可知尸與£具有線性相關(guān)關(guān)系,可用,二“十二來表示。經(jīng)計(jì)算得:上=5/=33M=46(最小二乘法),"空+46,即岳口二一03+4石。所以,一川,評(píng)注:一般

13、地,有些非線性回歸模型通過變換可以轉(zhuǎn)化為線性回歸模型,即借助于線性回歸模型研究呈非線性回歸關(guān)系的兩個(gè)變量之間的關(guān)系:(1)如果散點(diǎn)圖中的點(diǎn)分布在一個(gè)直線狀帶形區(qū)域,可以選用線性回歸模型來建模;(2)如果散點(diǎn)圖中的點(diǎn)的分布在一個(gè)曲線狀帶形區(qū)域,要先對(duì)變量作適當(dāng)?shù)淖儞Q,再利用線性回歸模型來建模。本周練習(xí):1 .對(duì)具有相關(guān)關(guān)系的兩個(gè)變量統(tǒng)計(jì)分析的一種常用的方法是()A.回歸分析B.相關(guān)系數(shù)分析C.殘差分析D.相關(guān)指數(shù)分析2 .在畫兩個(gè)變量的散點(diǎn)圖時(shí),下面敘述正確的是()A.預(yù)報(bào)變量在或軸上,解釋變量在下軸上b.解釋變量在或軸上,預(yù)報(bào)變量在y軸上C.可以選擇兩個(gè)變量中任意一個(gè)變量在X軸上D.可以選擇兩

14、個(gè)變量中任意一個(gè)變量在尸軸上3 .兩個(gè)變量相關(guān)性越強(qiáng),相關(guān)系數(shù)F()A.越接近于0B.越接近于1C.越接近于1D.絕對(duì)值越接近14 .若散點(diǎn)圖中所有樣本點(diǎn)都在一條直線上,解釋變量與預(yù)報(bào)變量的相關(guān)系數(shù)為()A.0B.1C.-1D.1或15 .一位母親記錄了她兒子3到9歲的身高,數(shù)據(jù)如下表:年齡(歲)3456789身高(,臉94.8104.2108.7117.8124.3130.8139.0由此她建立了身高與年齡的回歸模型¥=7'9*+719天,她用這個(gè)模型預(yù)測(cè)兒子10歲時(shí)的身高,則下面的敘述正確的是()A.她兒子10歲時(shí)的身高一定是145.83二演B.她兒子10歲時(shí)的身高在14

15、5.83二梅以上C.她兒子10歲時(shí)的身高在145.83cm左右D.她兒子10歲時(shí)的身高在145.83二隕以下6 .兩個(gè)變量有線性相關(guān)關(guān)系且正相關(guān),則回歸直線方程中,y=5工十&的系數(shù)占()A.B.-C.二二-D.二二-7 .兩個(gè)變量有線性相關(guān)關(guān)系且殘差的平方和等于0,則()A.樣本點(diǎn)都在回歸直線上B.樣本點(diǎn)都集中在回歸直線附近C.樣本點(diǎn)比較分散D.不存在規(guī)律8 .在建立兩個(gè)變量尸與工的回歸模型中,分別選擇了4個(gè)不同的模型,它們的相關(guān)指數(shù)正。如下,其中擬合最好的模型是()A.模型1的相關(guān)指數(shù)屈為0.98B.模型2的相關(guān)指數(shù)E?為0.80C.模型3的相關(guān)指數(shù)為0.50D.模型4的相關(guān)指數(shù)為

16、0.259 .相關(guān)指數(shù)&二=。10 .某農(nóng)場(chǎng)對(duì)單位面積化肥用量工儂)和水稻相應(yīng)產(chǎn)量晚)的關(guān)系作了統(tǒng)計(jì),得到數(shù)據(jù)如下:X1520253035404573303453654054454504553次時(shí)水稻的產(chǎn)量大約是多如果K與F之間具有線性相關(guān)關(guān)系,求出回歸直線方程,并預(yù)測(cè)當(dāng)單位面積化肥用量為少?(精確到依)11 .假設(shè)美國(guó)10家最大的工業(yè)公司提供了以下數(shù)據(jù):公司銷售息額盤X1/白力美兀利潤(rùn)X2/白力美兀通用汽車1269744224福特969333835??松?66563510IBM634383758通用電氣552643939美孚509761809菲利普莫利斯390692946克萊斯勒36

17、156359杜邦352092480德士古324162413(1)作銷售總額和利潤(rùn)的散點(diǎn)圖,根據(jù)該圖猜想它們之間的關(guān)系應(yīng)是什么形式;建立銷售總額為解釋變量,利潤(rùn)為預(yù)報(bào)變量的回歸模型,并計(jì)算殘差;你認(rèn)為這個(gè)模型能較好地刻畫銷售總額和利潤(rùn)之間的關(guān)系嗎?請(qǐng)說明理由。參考答案:ABDBCAAAa3=i-9 ,.一相應(yīng)水稻的產(chǎn)10 .由于問題中要求根據(jù)單位面積化肥用量預(yù)報(bào)水稻相應(yīng)的產(chǎn)量,因此選取單位面積的化肥用量為解釋變量,量為預(yù)報(bào)變量,作散點(diǎn)圖:由圖容易看出,汽與y之間有近似的線性關(guān)系,或者說,可以用一個(gè)回歸直線方程1y二反十”來反映這種關(guān)系。由計(jì)算器求得-。y對(duì)H的回歸直線方程為y=47區(qū)+256.7

18、9(*)。由(*)中求出的回歸直線方程,把苫上32代入,易得92+25679=40*79。計(jì)算結(jié)果表示,當(dāng)單位面積化肥用量為§遍時(shí)水稻的產(chǎn)量大約是國(guó)11.將銷售總額作為橫軸,利潤(rùn)作為縱軸,根據(jù)表中數(shù)據(jù)繪制散點(diǎn)圖如下:由于散點(diǎn)圖中的樣本點(diǎn)基本上在一個(gè)帶形區(qū)域分布,猜想銷售總額與利潤(rùn)之間呈現(xiàn)線性相關(guān)關(guān)系;由最小二乘法的計(jì)算公式,得:叱im弘.5,6科0Q26則線性回歸方程為:-1二其殘差值計(jì)算結(jié)果見下表:銷售總額12697496933866566343855264利潤(rùn)42243835351037583939殘差-361.03419,015-42.894799,4871189.742銷售總

19、額5097639069361563520932416利潤(rùn)1809294635924802413殘差-830.486611,334-1901.09244,150248,650(3)對(duì)于中所建立的線性回歸方程,相關(guān)指數(shù)為R2弋0,457說明在線性回歸模型中銷售總額只能解釋利潤(rùn)變化的46%,所以線性回歸模型不能很好地刻畫銷售總額和利潤(rùn)之間的關(guān)系。說明:此題也可以建立對(duì)數(shù)模型或二次回歸模型等,只要計(jì)算和分析合理,就算正確。獨(dú)立性檢驗(yàn)的基本知識(shí)點(diǎn)及習(xí)題本周題目:獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用本周重點(diǎn):(1)通過對(duì)實(shí)際問題的分析探究,了解獨(dú)立性檢驗(yàn)(只要求2X2列聯(lián)表)的基本思想、方法及初步應(yīng)用.;了解

20、獨(dú)立性檢驗(yàn)的常用方法:三維柱形圖和二維條形圖,及其K2(或R2)的大小關(guān)系.(1) 通過典型案例的探究,了解實(shí)際推斷原理和假設(shè)檢驗(yàn)的基本思想、方法及初步應(yīng)用(2) 理解獨(dú)立性檢驗(yàn)的基本思想及實(shí)施步驟,能運(yùn)用自己所學(xué)的知識(shí)對(duì)具體案例進(jìn)行檢驗(yàn)本周難點(diǎn):(3) 了解獨(dú)立性檢驗(yàn)的基本思想;(4) 了解隨機(jī)變量1的含義,太大認(rèn)為兩個(gè)分類變量是有關(guān)系的;(5) 能運(yùn)用自己所學(xué)的知識(shí)對(duì)具體案例進(jìn)行檢驗(yàn)與說明本周內(nèi)容:一、基礎(chǔ)知識(shí)梳理1 .獨(dú)立性檢驗(yàn)利用隨機(jī)變量上二來確定在多大程度上可以認(rèn)為兩個(gè)分類變量有關(guān)系”的方法稱為兩個(gè)分類變量的獨(dú)立性檢驗(yàn)。2 .判斷結(jié)論成立的可能性的步驟:(1)通過三維柱形圖和二維條形

21、圖,可以粗略地判斷兩個(gè)分類變量是否有關(guān)系,但是這種判斷無法精確地給出所得結(jié)論的可靠程度。(2)可以利用獨(dú)立性檢驗(yàn)來考察兩個(gè)分類變量是否有關(guān)系,并且能較精確地給出這種判斷的可靠程度。二、例題選講例1.為了探究患慢性氣管炎是否與吸煙有關(guān),調(diào)查了339名50歲以上的人,調(diào)查結(jié)果如下表所示:患病不患病合計(jì)吸煙43162205不吸煙13121134合計(jì)56283339試問:50歲以上的人患慢性氣管炎與吸煙習(xí)慣有關(guān)嗎?分析:最理想的解決辦法是向所有50歲以上的人作調(diào)查,然后對(duì)所得到的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)處理,但這花費(fèi)的代價(jià)太大,實(shí)際上是行不通的,339人相對(duì)于全體50歲以上的人,只是一個(gè)小部分,已學(xué)過總體和樣本的

22、關(guān)系,當(dāng)用樣本平均數(shù),樣本方差去估計(jì)總體相應(yīng)的數(shù)字特征時(shí),由于抽樣的隨機(jī)性,結(jié)果并不唯一?,F(xiàn)在情況類似,我們用部分對(duì)全體作推斷,推斷可能正確,也可能錯(cuò)誤。如果抽取的339個(gè)調(diào)查對(duì)象中很多人是吸煙但沒患慢性氣管炎,而雖不吸煙因身體體質(zhì)差而患慢性氣管炎,能夠得出什么結(jié)論呢?我們有95%(或99%)的把握說事件工與事件有關(guān),是指推斷犯錯(cuò)誤的可能性為5%(或1%),這也常常說成是以95%(或99%)的概率”是一樣的。解:根據(jù)列聯(lián)表中的數(shù)據(jù),得20fM3476x283因?yàn)?.469>6.635,所以我們有99%的把握說:50歲以上的人患慢性氣管炎與吸煙習(xí)慣有關(guān)。評(píng)注:對(duì)兩個(gè)分類變量進(jìn)行獨(dú)立性檢驗(yàn),

23、要對(duì)樣本的選取背景、時(shí)間等因素進(jìn)行分析。例2.甲乙兩個(gè)班級(jí)進(jìn)行一門考試,按照學(xué)生考試成績(jī)優(yōu)秀和不優(yōu)秀統(tǒng)計(jì)成績(jī)后,得到如下的列聯(lián)表:班級(jí)與成績(jī)列聯(lián)表優(yōu)秀不優(yōu)秀總計(jì)甲班103545乙班73845總計(jì)177390成績(jī)與班級(jí)有關(guān)系”犯畫出列聯(lián)表的條形圖,并通過圖形判斷成績(jī)與班級(jí)是否有關(guān);利用列聯(lián)表的獨(dú)立性檢驗(yàn)估計(jì),認(rèn)為錯(cuò)誤的概率是多少。解:列聯(lián)表的條形圖如圖所示:由圖及表直觀判斷,好像成績(jī)優(yōu)秀與班級(jí)有關(guān)系”;由表中數(shù)據(jù)計(jì)算得K2的觀察值為k-0.653>0.455o由下表中數(shù)據(jù)P(K2"0.500.400.250.150.100.050.0250.0100.0050.001k0.455

24、0.7081.3232.0722.7063.8415.0246.6357.87910.828得:P(K2>0.455)y0.50從而有50%的把握認(rèn)為成績(jī)與班級(jí)有關(guān)系”,即斷言成績(jī)優(yōu)秀與班級(jí)有關(guān)系”犯錯(cuò)誤的概率為0.5。評(píng)注:(1)畫出條形圖后,從圖形上判斷兩個(gè)分類變量之間是否有關(guān)系。這里通過圖形的直觀感覺的結(jié)果可能會(huì)出錯(cuò)。(2)計(jì)算得到K2的觀測(cè)值比較小,所以沒有理由說明成績(jī)優(yōu)秀與班級(jí)有關(guān)系這與反證法也有類似的地方,在使用反證法證明結(jié)論時(shí),假設(shè)結(jié)論不成立的條件下如果沒有推出矛盾,并不能說明結(jié)論成立也不能說明結(jié)論不成立。在獨(dú)立性檢驗(yàn)中,在假設(shè)成績(jī)優(yōu)秀與班級(jí)沒有關(guān)系”的情況下,計(jì)算得到的K

25、2的值比較小,且P(K2>0.653)y0.42明事件(K2>0.653不是一個(gè)小概率事件,這個(gè)事件的發(fā)生不足以說明戰(zhàn)績(jī)優(yōu)秀與班級(jí)沒有關(guān)系”,即沒有理由說明成績(jī)優(yōu)秀與班級(jí)有關(guān)系這里沒有推出小概率事件發(fā)生類似于反證法中沒有推出矛盾。例3.為考察某種藥物預(yù)防疾病的效果,進(jìn)行動(dòng)物試驗(yàn),得到如下的列聯(lián)列表:藥物效果與動(dòng)物試驗(yàn)列聯(lián)表患病未患病總計(jì)服用藥104555沒服用藥203050總計(jì)3075105請(qǐng)問能有多大把握認(rèn)為藥物有效?解:假設(shè)服藥情況與是否患病之間沒有關(guān)系”,則K2的值應(yīng)比較?。蝗绻鸎2的值很大,則說明很可能服藥情況與是否患病之間有關(guān)系由題目中所給數(shù)據(jù)計(jì)算,得K2的觀測(cè)值為k6.

26、110,而P(K2>5.024)y0.025以有97.5%的把握認(rèn)為服藥例4.在一次惡劣氣候的飛行航程中調(diào)查男女乘客在機(jī)上暈機(jī)的情況如下表所示,根據(jù)此資料你是否認(rèn)為在惡劣氣候中男人比女人更容易暈機(jī)?暈機(jī)不暈機(jī)合計(jì)男人243155女人82634合計(jì)325789分析:這是一個(gè)2x2列聯(lián)表的獨(dú)立性檢驗(yàn)問題,根據(jù)列聯(lián)表的數(shù)據(jù)求解一的(2骸一四解:由條件中數(shù)據(jù),計(jì)算得:55x34汶32M57,因?yàn)楣?S9一841,所以我們沒有理由說暈機(jī)是否跟男女性別有關(guān),盡管這次航班中男人暈機(jī)的比例135)比女人暈機(jī)的比例134,高,但我們不能認(rèn)為在惡劣的氣候飛行中男人比女人更容易暈機(jī)。評(píng)注:在使用統(tǒng)計(jì)量作2x2

27、列聯(lián)表的獨(dú)立性檢驗(yàn)時(shí),要求表中的4個(gè)數(shù)據(jù)大于等于5,為此,在選取樣本的容量時(shí)一定要注意這一點(diǎn),本例中的4個(gè)數(shù)據(jù)都大于5,且滿足這一要求的。本周練習(xí):1 .在一次獨(dú)立性檢驗(yàn)中,其把握性超過了99%,則隨機(jī)變量無3的可能值為()A.6.635B,5.024C,7.897D,3.8412 .把兩個(gè)分類變量的頻數(shù)列出,稱為()A.三維柱形圖B.二維條形圖C.歹U聯(lián)表D.獨(dú)立性檢驗(yàn)3 .由列聯(lián)表尸1%合計(jì)巧4316220513121134合計(jì)56283339則隨機(jī)變量上口的值為。4 .某大學(xué)希望研究性別與職稱之間是否有關(guān)系,你認(rèn)為應(yīng)該收集哪些數(shù)據(jù)?5 .某高校統(tǒng)計(jì)初步”課程的教師隨機(jī)調(diào)查了該選修課的一些

28、學(xué)生情況,具體數(shù)據(jù)如下表:非統(tǒng)計(jì)專業(yè)統(tǒng)計(jì)專業(yè)男1310女720為了檢驗(yàn)主修專業(yè)是否與性別有關(guān)系,根據(jù)表中的數(shù)據(jù),得到23x27x20K30因?yàn)镵2>3.841,所以斷定主修統(tǒng)計(jì)專業(yè)與性別有關(guān)系。這種判斷出錯(cuò)的可能性為6 .在對(duì)人們休閑的一次調(diào)查中,共調(diào)查了124人,其中女性70人,男性54人。女性中有43人主要的休閑方式是看電視,另外27人主要的休閑方式是運(yùn)動(dòng);男性中有21人主要的休閑方式是看電視,另外33人主要的休閑方式是運(yùn)動(dòng)。(1)根據(jù)以上數(shù)據(jù)建立一個(gè)2x2的列聯(lián)表;(2)檢驗(yàn)性別與休閑方式是否有關(guān)系。7 .調(diào)查某醫(yī)院某段時(shí)間內(nèi)嬰兒出生的時(shí)間與性別的關(guān)系,得到下面的數(shù)據(jù)表。試問能以多大把握認(rèn)為嬰兒的性別與出生的時(shí)間有關(guān)系。出生時(shí)間性別晚上白天合計(jì)男嬰243155女嬰82634合計(jì)325789參考答案:1.C2.C3.7.4698 .女教授人數(shù),男教授人數(shù),女副教授人數(shù),男副教授人數(shù)(或高級(jí)職稱中女性的人數(shù),高級(jí)職稱中男性的人數(shù),中級(jí)職稱中女性的人數(shù),中級(jí)職稱中男性的人數(shù)。)9 .5%(或0.05)10 答案:(1)2x2的列聯(lián)表:(2)假設(shè)休閑方式與性別無關(guān),計(jì)算看電視運(yùn)動(dòng)合計(jì)女432770男213354合計(jì)6460124竺便至三工&刈7口,54*64發(fā)6097.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論