第三章 統(tǒng)計案例學案(學生版)_第1頁
第三章 統(tǒng)計案例學案(學生版)_第2頁
第三章 統(tǒng)計案例學案(學生版)_第3頁
第三章 統(tǒng)計案例學案(學生版)_第4頁
第三章 統(tǒng)計案例學案(學生版)_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

本文格式為Word版,下載可任意編輯——第三章統(tǒng)計案例學案(學生版)

選修2-1第一章統(tǒng)計案例學案(學生版)

1.1回歸分析的基本思想及其初步應用(1)

學習目標:

(1)通過典型案例的探究,進一步了解回歸分析的基本思想、方法及初步應用.

(2)了解線性回歸模型與函數(shù)模型的差異,了解判斷刻畫模型擬合效果的方法:相關指數(shù)和殘差分析.

(3)了解評價回歸效果的兩個統(tǒng)計量:總偏差平方和、殘差平方和.

學習重點:了解線性回歸模型與函數(shù)模型的差異,了解判斷刻畫模型擬合效果的方法:相關指數(shù)和殘差分析.

i的含義.學習難點:解釋隨機誤差e和殘差e

學習過程:一、課前準備

(一)、復習必修3的“變量間的相關關系〞內(nèi)容,注意以下內(nèi)容:

1.相關關系:自變量取值一定時,因變量的取值帶有一定的兩個變量之間的關系叫做相關關系;

2.函數(shù)關系中兩個變量的關系是,相關關系中的兩個變量的關系是.

3.兩個變量的線性相關:

(1)散點圖:將樣本中n個數(shù)據(jù)點(xi,yi)(i1,2,3,n)描在坐標系中得到的圖形.

(2)正相關與負相關:①正相關:散點圖中的點散布在從到的區(qū)域;②負相關:散點圖中的點散布在從到的區(qū)域.

4.回歸直線的方程:

(1)假使散點圖中的分布從整體上看大致在附近,就稱這兩個變量之間具有關系,這條直線叫做回歸直線.

(2)回歸方程:對應的方程叫做回歸直線的方程.(3)回歸方程的推導過程:

①假設已經(jīng)得到兩個具有線性相關關系的變量的一組數(shù)據(jù),,,.

②設所求回歸方程為,其中a、b是待定參數(shù).

③由最小二乘法得b

(xx)(yy)

i

i

i1

n

(xx)

i

i1

n,aybx.

2

其中b回歸方程的,a是.(二)研究相關關系和回歸分析的意義:1.提問:“名師出高徒〞這句彥語的意思是什么?有名氣的老師就一定能教出厲害的學生嗎?這兩者之間是否有關?

2.函數(shù)關系是一種確定性關系,而相關關系是一種非確定性關系.回歸分析是對具有相關關系的兩個變量進行統(tǒng)計分析的一種常用方法,其步驟:收集數(shù)據(jù)作散點圖求回歸直線方程利用方程進行預報.二、新課導學:

1.幾個需要了解的概念:

(1)總偏差平方和、殘差平方和、回歸平方和:

①總偏差平方和:所有單個樣本值與樣本均值差的平方和,即②殘差平方和:回歸值與樣本值差的平方和,即

n

(yi)2;i1

n

(yiyi)2;i1

(yi)2.i1

n

③回歸平方和:相應回歸值與樣本均值差的平方和,即(2)要注意的問題:①注意yi、yi、y的區(qū)別;

②預報變量的變化程度可以分解為由解釋變量引起的變化程度與殘差變量的變化程度之

yi)2(yi)2;和,即(yi)(yi

2

i1

i1

i1

nnn

③當總偏差平方和相對固定時,殘差平方和越小,則回歸平方和越大,此時模型的擬合效

果越好;

④對于多個不同的模型,我們還可以引入相關指數(shù)R21

(yiyi)2i1

(yi)2i1

n

來刻畫回歸的效

果,它表示解釋變量對預報變量變化的貢獻率.R2的值越大,說明殘差平方和越小,也

就是說模型擬合的效果越好.2.典型例題:

①求回歸方程并預報體重:

②提問:身高為172cm的女大學生的體重一定是60.316kg嗎?答:

③解釋線性回歸模型與一次函數(shù)的不同.答:

因此,一次函數(shù)模型是線性回歸模型的特別形式,線性回歸模型是一次函數(shù)模型的一般形式.

關于x與y有如下數(shù)據(jù):

為了對x、y兩個變量進行統(tǒng)計分析,現(xiàn)有以下兩種線性模型:y6.5x17.5,

y7x17,試比較哪一個模型擬合的效果更好.

既可分別求出兩種模型下的總偏差平方和、殘差平方和、回歸平方和,也可分別

求出兩種模型下的相關指數(shù),然后再進行比較,從而得出結(jié)論.

三、總結(jié)提升:

(1)求線性回歸方程的步驟、線性回歸模型與一次函數(shù)的不同.

(2)分清總偏差平方和、殘差平方和、回歸平方和,初步了解如何評價兩個不同模型擬合效果的好壞.四、反饋練習

1.在畫兩個變量的散點圖時,下面哪個表達是正確的()

A.預報變量在x軸上,解釋變量在y軸上B.解釋變量在x軸上,預報變量在y軸上C.可選擇兩個變量中任一個變量在x軸上D.可選擇兩個變量中任一個變量在y軸上2.一位母親記錄了兒子3~9歲的身高,由此建立的身高與年齡的回歸模型為

y7.19x73.93用這個模型預計這個孩子10歲時的身高,則正確的表達是()

A.身高一定是145.83cmB.身高在145.83cm以上C.身高在145.83cm以下D.身高在145.83cm左右

3.兩個變量y與x的回歸模型中,分別選擇了4個不同模型,它們的相關指數(shù)R如下,其中擬合效果最好的模型是()

A.模型1的相關指數(shù)R為0.98B.模型2的相關指數(shù)R為0.80C.模型3的相關指數(shù)R為0.50D.模型4的相關指數(shù)R為0.25

4.在回歸分析中,代表了數(shù)據(jù)點和它在回歸直線上相應位置的差異的是()A.總偏差平方和B.殘差平方和C.回歸平方和D.相關指數(shù)R

2

2

2

2

2

2

6090x,以下判5.工人月工資(元)依勞動生產(chǎn)率(千元)變化的回歸直線方程為y

斷正確的是()A.生產(chǎn)率為1000元時,工資為50元B.生產(chǎn)率提高1000元時,工資提高150元C.生產(chǎn)率提高1000元時,工資提高90元D.生產(chǎn)率為1000元時,工資為90元6

(1)線性回歸方程;(2)估計使用年限為10年時,維修費用是多少?

五、學后反思:

1.1回歸分析的基本思想及其初步應用(2)

學習目標:通過典型案例的探究,進一步了解回歸分析的基本思想、方法及初步應用.學習重點:通過探究使學生體會有些非線性模型通過變換可以轉(zhuǎn)化為線性回歸模型,了解在解決實際問題的過程中尋覓更好的模型的方法.

學習難點:了解常用函數(shù)的圖象特點,選擇不同的模型建模,并通過比較相關指數(shù)對不同的模型進行比較.教學過程:

一、復習準備:

1.給出問題:一只紅鈴蟲的產(chǎn)卵數(shù)y和溫度x有關,現(xiàn)收集了7組觀測數(shù)據(jù)列于下表中,試建立y與x之間的回歸方程.

2.探討:觀測上面的散點圖,發(fā)現(xiàn)樣本點并沒有分布在某個帶狀區(qū)域內(nèi),即兩個變量不呈線性相關關系,所以不能直接用線性回歸方程來建立兩個變量之間的關系.二、新課導學:

1.探究非線性回歸方程的確定:方法一:

①假使散點圖中的點分布在一個直線狀帶形區(qū)域,可以選線性回歸模型來建模;假使散點圖中的點分布在一個曲線狀帶形區(qū)域,就需選擇非線性回歸模型來建模.

②根據(jù)已有的函數(shù)知識,可以發(fā)現(xiàn)樣本點分布在某一條指數(shù)函數(shù)曲線y=yC1e

C2x的周邊(其中c1,c2是待定的參數(shù)),故可用指數(shù)函數(shù)模型來擬合這兩個變量.③在上式兩邊取對數(shù),得

lnyc2xlnc1,再令而z與x間的關系如下:

zlny,則zc2xlnc1,

歸方程來擬合.

④利用計算器算得a3.843,b0.272,z與x間的線性回歸方程為z0.272x3.843,因此紅鈴蟲的產(chǎn)卵數(shù)對溫度的非線性回歸方程為ye0.272x3.843.⑤利用回歸方程探究非線性回歸問題,可按“作散點圖建模確定方程〞這三個步驟進行.

其關鍵在于如何通過適當?shù)淖儞Q,將非線性回歸問題轉(zhuǎn)化成線性回歸問題.

方法二:上面我們選擇用指數(shù)函數(shù)模型來擬合紅鈴蟲的產(chǎn)卵數(shù)y和溫度x間的關系,還可用其它函數(shù)模型來擬合嗎?

用二次函數(shù)模型yc3x2c4來擬合上述兩個變量間的關系嗎(令tx2,則

yc3tc4,此時y與t間的關系如下:

觀測y與t的散點圖,可以發(fā)現(xiàn)樣本點并不分布在一條直線的周邊,因此不宜用線性回歸

方程來擬合它,即不宜用二次曲線yc3x2c4來擬合y與x之間的關系.)2.上例中的殘差分析:

一般狀況下,比較兩個模型的殘差比較困難(某些樣本點上一個模型的殘差的絕對值比另一個模型的小,而另一些樣本點的狀況則相反),故通過比較兩個模型的殘差的平方和的大小來判斷模型的擬合效果.殘差平方和越小的模型,擬合的效果越好.

也就是說,我們可以通過觀測變換后的散點圖來判斷能否用此種模型來擬合.事實上,除了觀測散點圖以外,我們也可先求出函數(shù)模型,然后利用殘差分析的方法來比較模型的好壞.

四、反饋練習:

1.煉鋼時鋼水的含碳量與冶煉時間有()

A.確定性關系B.相關關系C.函數(shù)關系D.無任何關系2.以下說法正確的有()

①回歸方程適用于一切樣本和總體;②回歸方程一般都有適用范圍;

③樣本取值的范圍會影響回歸方程的適用范圍;④回歸方程得到的預報值是預報變量的確切值.

A.①②B.②③C.③④D.①③3.以下結(jié)論正確的是()

①函數(shù)關系是一種確定性關系;②相關關系是一種非確定性關系③回歸分析是對具有函數(shù)關系的兩個變量進行統(tǒng)計分析的一種方法

④回歸分析是對具有相關關系的兩個變量進行統(tǒng)計分析的一種常用方法。A.①②B.①②③C.①②④D.①②③④4.設有一個回歸方程為y=2-2.5x,則變量x增加一個單位時()A.y平均增加2.5個單位B.y平均增加2個單位C.y平均減少2.5個單位D.y平均減少2個單位

5.已知回歸直線的斜率的估計值是1.23,樣本點的中心為(4,5),則回歸直線的是()A.y1.23x+4B.y1.23x5C.y1.23x0.08D.y0.08x1.236.已知x與y之間的一組數(shù)據(jù):

則y與x的線性回歸方程為y必過()

A.(2,2)點B.(1.5,0)點C.(1,2)點D.(1.5,4)點

五、學后反思:

1.2獨立性檢驗的基本思想及其初步應用

學習目標:通過探究“吸煙是否與患肺癌有關系〞引出獨立性檢驗的問題,并借助樣本數(shù)據(jù)的列聯(lián)表展示,讓學生親身體驗獨立性檢驗的實施步驟與必要性.學習重點:理解獨立性檢驗的基本思想及實施步驟.

學習難點:了解獨立性檢驗的基本思想、了解隨機變量K的含義.學習過程:

一、課前準備:

某醫(yī)療機構(gòu)為了解吸煙與患肺癌是否有關,進行了一次抽樣調(diào)查,共調(diào)查了515個成年人,其中吸煙者220人,不吸煙者295人.調(diào)查結(jié)果是:吸煙的220人中有37人患肺癌,183人未患肺癌;不吸煙的295人中有21人患肺癌,274人未患肺癌.

問題1:吸煙與不吸煙,患肺癌的可能性的大小是否有差異?為了研究這個問題,我們將上述數(shù)據(jù)用下表表示:

問題2:差異大到什么程度才能作出“吸煙與患肺癌有關〞的判斷?問題3:能否用數(shù)量刻畫出“有關〞的程度?

二、新課導學:(一)獨立性檢驗:

1.獨立性檢驗的含義:用K統(tǒng)計量研究吸煙與患肺癌是否有關、用藥效果與用藥方式是否有關、性別與數(shù)學成績是否有關等這類問題的方法稱為獨立性檢驗.2.卡方統(tǒng)計量

2

2

n(adbc)2

卡方統(tǒng)計量:K

(ab)(cd)(ac)(bd)

2

其中nabcd為樣本量.假使兩個變量x1與x2無關系,則K的值應當很小.3.用獨立性檢驗來考察“x1與x2是否有關系〞的步驟:(1)提出假設H0:x1與x2沒有關系;

2

(2)根據(jù)22列聯(lián)表與公式計算K的值;(3)查對臨界值表作出判斷.

2

4.臨界值表:

2

例如:(1)K10.828,則有______的把握認為“x1與x2〞有關系;

(2)K6.635,則有______的把握認為“x1與x2〞有關系;(3)K2.706,則有______的把握認為“x1與x2〞有關系;

(4)K2.706,則認為沒有充分的證據(jù)顯示“x1與x2〞有關系,但也不能作出結(jié)論“H0成立〞,即不能認為“x1與x2〞沒有關系.

(二)典型例題

在對人們飲食習慣的一次調(diào)查中,共調(diào)查了124人,其中六十歲以上的70人,六十歲以下的54人,六十歲以上的人中有43人的飲食以蔬菜為主,另外27人則以肉類為主;六十歲以下的人中有21人飲食以蔬菜為主,另外33人則以肉類為主.(1)根據(jù)以上數(shù)

2的列聯(lián)表;據(jù)建立一個2(2)判斷人的飲食習慣是否與年齡有關.

動動手:在一次惡劣氣候的飛機航程中,調(diào)查了男女乘客在飛機上暈機的狀況:男乘客暈機

的有24人,不暈機的有31人;女乘客暈機的有8人,不暈機的有26人.請你根據(jù)所給數(shù)據(jù)判斷是否在惡劣氣候飛行中,男人比女人更簡單暈機.

三、總結(jié)提升:獨立性檢驗的方法、原理、步驟.

222

四、反饋練習:

1.獨立性檢驗中的統(tǒng)計假設就是假設相關事件A、B()

A.互斥B.不互斥C.相互獨立D.不獨立2.以下說法中正確的是()

①獨立性檢驗的基本思想是帶有概率性質(zhì)的反證法;②獨立性檢驗就是選取一個假設H0條件下的小概率事件,若在一次試驗中該事件發(fā)生了,這是與實際推斷相抵觸的“不合理〞現(xiàn)象,則作出拒絕H0的推斷;③獨立性檢驗一定能給出明確的結(jié)論.

A.①②B.①③C.②③D.①②③

3.給出假設H0,以下結(jié)論中不能對H0成立與否作出明確判斷的是()

2222

A.K=2.535B.K=7.723C.K=10.321D.K=20.1254.某班主任對全班50名學生進行了作業(yè)量的

調(diào)查,數(shù)據(jù)如下表:

則學生的性別與作業(yè)量的大小有關系的把握

大約為()

A.99%B.95%C.)90%D.無充分根據(jù)

5.

A.種子經(jīng)過處理跟是否生病有關B.種子經(jīng)過處理跟是否生病無關C.種子是否經(jīng)過處理決定是否生病D.以上都是錯誤的

6.某高校“統(tǒng)計初步〞課程的教師隨機調(diào)查了選該課的一些學生狀況,具體數(shù)據(jù)如下表:

50(1320107)2

K4.844,由于K23.841,所以判定主修統(tǒng)計專業(yè)與性別

23272030

2

有關系,那么這種判斷出錯的可能性為____.

7.在性別與吃零食這兩個分類變量的計算中,以下說法正確的是

①若的觀測值為K2=6.635,我們有99%的把握認為吃零食與性別有關系,那么在100個吃零食的人中必有99人是女性;

②從獨立性檢驗可知有99%的把握認為吃零食與性別有關系時,我們說某人吃零食,那么

此人是女性的可能性為99%;

③若從統(tǒng)計量中求出有99%的把握認為吃零食與性別有關系,是指有1%的可能性使得出的判斷出現(xiàn)錯誤.

8.以下關于K2的說法中,正確的是.

①K在任何相互獨立問題中都可以用于檢驗是否相關;②K越大,兩個事件的相關性越大;③K是用來判斷兩個相互獨立事件相關與否的一個統(tǒng)計量,它可以用來判斷兩個事件是否相關這一類問題.

9.在對人們的休閑方式的一次調(diào)查中,共調(diào)查了124人,其中女性70人,男性54人.女性中有43人主要的休閑方式是看電視,另外27人主要的休閑方式是運動;男性中有21人主要的休閑方式是看電視,另外33人主要的休閑方式是運動.

(1)根據(jù)以上數(shù)據(jù)建立一個22的列聯(lián)表;(2)判斷性別與休閑方式是否有關系.

五、學后反思

2

2

2

統(tǒng)計案例習題課

學習目標:1.通過典型案例的探究,進一步了解回歸分析的基本思想、方法及初步應用;2.通過練習和樣本數(shù)據(jù)的列聯(lián)表展示,讓學生進一步體驗獨立性檢驗的實施步驟與必要性.

學習重點:解決線性回歸問題的方法與步驟;理解獨立性檢驗的基本思想及實施步驟.學習難點:解決線性回歸問題的方法與步驟;了解獨立性檢驗的基本思想、了解隨機變量

K2的含義.

教學過程:一、課前準備:

閱讀教材第一章的內(nèi)容,并做如下練習:

1.長方形的面積一定時,長和寬具有()

A.不確定性關系B.相關關系C.函數(shù)關系D.無任何關系2.三點(3,10)、(7,20)、(11,24)的線性回歸方程是()

A.y517xB.y5.751.75xC.y175xD.y5.751.75x3.在吸煙與患肺病這兩個分類變量的計算中,以下說法中正確的是()

A.若統(tǒng)計量K6.635,我們有99%的把握說吸煙與患肺病有關,則某人吸煙,那么他有99%的可能患有肺病

B.若從統(tǒng)計中求出,有99%的把握說吸煙與患肺病有關,則在100個吸煙者中必有99人患有肺病

C.若從統(tǒng)計量中求出有95%把握說吸煙與患肺病有關,是指有5%的可能性使得推斷錯誤D.以上說法均錯誤

4.若由一個22列聯(lián)表中的數(shù)據(jù)計算得K4.013,那么有變量有關系.二、典型例題:

一個車間為了規(guī)定工時定額,必需確定加工零件所花費的時間,為此進行了10次試驗,測得的數(shù)據(jù)如下:

2

2

回歸直線方程.(1)y與x具有線形相關關系,求

(2)并據(jù)此估計加工200個零件所用的時間為多少?(1)x

102030405060708090100

55,

10

y

626875818995102108115122

91.7,

10

2i

x

i1

10

38500,y87777,xiyi55950.

2

ii1

i1

1010

設所求的回歸直線方程為ybxa,同時,利用上表可得

b

xy10xy55950105591.70.668,

385001055x10xii2

i

2

2

aybx91.70.6685554.96.

即所求的回歸直線方程為y0.668x54.96.

(2)當x200時,y的估計值y0.66820054.96188.56189.故加工200個零件時所用的工時約為189個.

為考察高中生的性別與是否喜歡數(shù)學課程之間的關系,在某城市的某校高中生中隨機抽取300名學生,得到如以下聯(lián)表:

提出假設H0:性別與是否喜歡數(shù)學課程之間沒有關系根據(jù)列聯(lián)表中的數(shù)據(jù),可以求得

2

300(371438535)K4.514,722281221782

由于當H0成立時,K3.841的概率約為0.05,所以有95%的把握認為:性別與是否喜歡數(shù)學課程之間有關系.

對196個接受心臟搭橋手術的病人和196個接受血管清障手術的病人進行了3年的跟蹤研究,調(diào)查他們是否又發(fā)作過心臟病,調(diào)查結(jié)果如下表所示:

2

試根據(jù)上述數(shù)據(jù)比較這兩種手術對病人又發(fā)作心臟病的影響有沒有區(qū)別.

提出假設:

H0:兩種手術對病人又發(fā)作心臟病的影響沒有區(qū)別.根據(jù)列聯(lián)表中的數(shù)據(jù),可以求得

2

392(3916729)151.778K.

68324196196

2

當H0成立時K1.78,而K2.072的概率為0.85.所以,不能否定假設H0,也就是不能作出這兩種手術對病人又發(fā)作心臟病的影響有區(qū)別的結(jié)論.

三、總結(jié)提升

1.把握建立回歸模型的步驟:

(1)確定研究對象,明確解釋變量和預報變量;

(2)畫出散點圖,觀測它們之間的關系(如是否存在線性關系等);(3)由經(jīng)驗確定回歸方程的類型;

(4)按一定規(guī)則(如最小二乘法)估計回歸方程中的參數(shù);

(5)得出結(jié)果后殘差圖是否有異常,入歐存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否適合等.

2.用獨立性檢驗來考察“x1與x2是否有關系〞的步驟:(1)提出假設H0:x1與x2沒有關系;(2)根據(jù)22列聯(lián)表與公式計算K的值;(3)查對臨界值表作出判斷.

2

22

n(adbc)22

3.利用K,求出K的值,再利用臨界值的大小關系來判

2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論