【數(shù)學(xué)】成對數(shù)據(jù)的統(tǒng)計相關(guān)性 課件-2023-2024學(xué)年高二下人教A版(2019)選擇性必修第三冊_第1頁
【數(shù)學(xué)】成對數(shù)據(jù)的統(tǒng)計相關(guān)性 課件-2023-2024學(xué)年高二下人教A版(2019)選擇性必修第三冊_第2頁
【數(shù)學(xué)】成對數(shù)據(jù)的統(tǒng)計相關(guān)性 課件-2023-2024學(xué)年高二下人教A版(2019)選擇性必修第三冊_第3頁
【數(shù)學(xué)】成對數(shù)據(jù)的統(tǒng)計相關(guān)性 課件-2023-2024學(xué)年高二下人教A版(2019)選擇性必修第三冊_第4頁
【數(shù)學(xué)】成對數(shù)據(jù)的統(tǒng)計相關(guān)性 課件-2023-2024學(xué)年高二下人教A版(2019)選擇性必修第三冊_第5頁
已閱讀5頁,還剩34頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第八章成對數(shù)據(jù)的統(tǒng)計分析8.1成對數(shù)據(jù)的統(tǒng)計相關(guān)性8.1.1變量的相關(guān)關(guān)系8.1.2樣本相關(guān)系數(shù)復(fù)習(xí)引入(1)正方體的體積與棱長函數(shù)關(guān)系:(2)汽車勻速行駛時的路程與時間函數(shù)關(guān)系:復(fù)習(xí)引入

(3)俗話說“莊稼一枝花,全靠肥當(dāng)家”,這說明施肥的多少對糧食的產(chǎn)量影響很大,施肥量和糧食的產(chǎn)量是確定的函數(shù)關(guān)系嗎?

那么糧食的產(chǎn)量還受其他因素的影響嗎?兩個變量間的關(guān)系除了可能是函數(shù)關(guān)系外,還可能是其他關(guān)系嗎?為了搞清這些問題,我們需要學(xué)習(xí)本節(jié)內(nèi)容。復(fù)習(xí)引入

我們知道,一個人的體重與他的身高有關(guān)系.一般而言,個子高的人往往體重值較大,個子矮的人往往體重值較小.但身高并不是決定體重的唯一因素,例如生活中的飲食習(xí)慣、體育鍛煉、睡眠時間以及遺傳因素等也是影響體重的重要因素.像這樣,兩個變量有關(guān)系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關(guān)系稱為相關(guān)關(guān)系.問題1:上述情境中施肥量與糧食產(chǎn)量之間到底具有怎樣的關(guān)系?提示:上述兩變量間確實存在關(guān)系,但又不具備確定性,即當(dāng)一個變量取值一定時,另一個變量取值帶有隨機性.概念形成1、變量的相關(guān)關(guān)系:

兩個變量有關(guān)系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關(guān)系稱為相關(guān)關(guān)系.注:①相關(guān)關(guān)系是一種不確定性關(guān)系;②相關(guān)關(guān)系是相對于函數(shù)關(guān)系而言的.

新知探索

兩個變量具有相關(guān)關(guān)系的事例在現(xiàn)實中大量存在.例如:

新知探索

新知探索

數(shù)據(jù)判斷:兩個變量之間的相關(guān)關(guān)系的確定:樣本數(shù)據(jù)分析

建立模型

估計或推斷.①

經(jīng)驗判斷;新知探索問題2:在對人體的脂肪含量和年齡之間關(guān)系的研究中,科研人員獲得了一些年齡和脂肪含量的簡單隨機樣本數(shù)據(jù),如表所示.表中每個編號下的年齡和脂肪含量數(shù)據(jù)都是對同一個體的觀測結(jié)果,它們構(gòu)成了成對數(shù)據(jù).

根據(jù)以上數(shù)據(jù),你能推斷人體的脂肪含量與年齡之間存在怎樣的關(guān)系嗎?新知探索

為了更加直觀地描述上述成對數(shù)據(jù)中脂肪含量與年齡之間的關(guān)系,類似于用直方圖描述單個變量樣本數(shù)據(jù)的分布特征,我們用圖形展示成對樣本數(shù)據(jù)的變化特征.用橫軸表示年齡,縱軸表示脂肪含量,則表中每個編號下的成對樣本數(shù)據(jù)都可用直角坐標(biāo)系中的點表示出來,由這些點組成了如圖所示的統(tǒng)計圖.我們把這樣的統(tǒng)計圖叫做散點圖.概念形成2.散點圖把成對樣本數(shù)據(jù)用直角坐標(biāo)系中的點表示出來,由這些點組成的統(tǒng)計圖叫做散點圖.觀察圖,可以發(fā)現(xiàn),這些散點大致落在一條從左下角到右上角的直線附近,表明隨年齡值得增加,相應(yīng)的脂肪含量值呈現(xiàn)增加的趨勢.這樣,由成對樣本數(shù)據(jù)的分布規(guī)律,我們可以推斷脂肪含量和年齡變量之間存在著相關(guān)關(guān)系.新知探索

如果從整體上看,當(dāng)一個變量的值增加時,另一個變量的相應(yīng)值也呈現(xiàn)增加的趨勢,我們就稱之兩個變量正相關(guān);如果當(dāng)一個變量的值增加時,另一個變量的相應(yīng)值呈現(xiàn)減小的趨勢,則稱這兩個變量負(fù)相關(guān).

由上圖,能夠推斷脂肪含量與年齡這兩個變量正相關(guān).3.變量相關(guān)關(guān)系的分類(1)正相關(guān)和負(fù)相關(guān)

正相關(guān):指的是兩個變量有相同的變化趨勢,即從整體上來看一個變量會隨著另一個變量變大而變大,點的位置散布在從左下角到右上角的區(qū)域。負(fù)相關(guān):指的是兩個變量有相反的變化趨勢,即從整體上來看一個變量會隨著另一個變量變大而變小,點的位置散布在從左上角到右下角的區(qū)域內(nèi)(2)兩個變量正相關(guān)和負(fù)相關(guān)散點圖的特點概念形成概念形成(3)線性相關(guān)和非線性相關(guān)①線性相關(guān)散點圖是描述成對數(shù)據(jù)之間關(guān)系的一種直觀方法.一般地,如果兩個變量的取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),而且散點落在一一條直線附近,我們就稱這兩個變量線性相關(guān)oxy●●●●●●●●●●②非線性相關(guān)

一般地,如果兩個變量具有相關(guān)性,但不是線性相關(guān),那么我們就稱這兩個變量非線性相關(guān)或曲線相關(guān).oxy●●●●●●●●●●概念形成散點雜亂無章,無規(guī)律可言,看不出兩個變量有什么相關(guān)性有相關(guān)性觀察散點圖中成對樣本數(shù)據(jù)的分布規(guī)律,可大致推斷兩個變量是否存在相關(guān)關(guān)系、是正相關(guān)還是負(fù)相關(guān)、是線性相關(guān)還是非線性相關(guān)等.散點圖雖然直觀,但無法確切(量化)地反映成對樣本數(shù)據(jù)的相關(guān)類型和相關(guān)程度的大小.例析例1.在下列各個量與量的關(guān)系中:①正方體的表面積與棱長之間的關(guān)系;②一塊農(nóng)田的水稻產(chǎn)量與施肥量之間的關(guān)系;③家庭的收入與支出之間的關(guān)系;④某戶家庭用電量與水費之間的關(guān)系.其中是相關(guān)關(guān)系的為().A.①②

B.③④

C.②④

D.②③答案:D.解析:①正方體的表面積與棱長之間的關(guān)系是確定的函數(shù)關(guān)系;④某戶家庭用電量與水費之間無任何關(guān)系.②③中,都是非確定的關(guān)系,但自變量取值一定時,因變量的取值帶有一定的隨機性.例析方法技巧:

利用變量間相關(guān)關(guān)系的概念判斷量與量之間的關(guān)系時,一般是看當(dāng)一個變量的值一定時,另一個變量是否帶有確定性,兩個變量之間的關(guān)系具有確定關(guān)系——函數(shù)關(guān)系;兩個變量之間的關(guān)系具有隨機性、不確定性——相關(guān)關(guān)系.例析例2.某種產(chǎn)品的廣告支出費x與銷售金額y之間有如表對應(yīng)數(shù)據(jù)(單位:百萬元):x24568y3040605070①畫出散點圖;②從散點圖中判斷銷售金額與廣告支出費有什么樣的關(guān)系.解:①以x對應(yīng)的數(shù)據(jù)為橫坐標(biāo),y對應(yīng)的數(shù)據(jù)為縱坐標(biāo),所作的散點圖如圖所示.解:②從圖中可以發(fā)現(xiàn)廣告支出費與銷售金額之間具有相關(guān)關(guān)系,并且當(dāng)廣告支出費由小變大時,銷售金額也大多由小變大,圖中的數(shù)據(jù)大致分布在某條直線的附近,即x與y呈正相關(guān)關(guān)系.例析

2.判斷兩個變量具有相關(guān)關(guān)系的方法(1)根據(jù)直觀感覺判斷,這時要用到已有的知識或?qū)W習(xí)、生活中的經(jīng)驗等.(2)根據(jù)散點圖判斷,這時要由兩個變量相應(yīng)值的對應(yīng)關(guān)系作出散點圖,通過觀察散點圖中變量的對應(yīng)點是否分布在某條曲線的周圍判定這兩個變量是否具有相關(guān)關(guān)系.形數(shù)思考1:能否引入一個適當(dāng)?shù)摹皵?shù)字特征”,來度量樣本數(shù)據(jù)是正相關(guān)還是負(fù)相關(guān)呢?新知探索新知探究

新知探究平移形數(shù)新知探究思考2:Lxy的大小一定能度量出成對樣本數(shù)據(jù)的相關(guān)程度大小嗎?

是不是Lxy越大,兩個變量的相關(guān)程度越強?Lxy>0表明成對樣本數(shù)據(jù)正相關(guān);Lxy<0表明成對樣本數(shù)據(jù)負(fù)相關(guān).Lxy的大小與數(shù)據(jù)的度量得有關(guān),如:在研究體重與身高之間的相關(guān)程度時,如果體重的單位不變,把身高的單位由米改為厘米,則相應(yīng)的Lxy將變?yōu)樵瓉淼?00倍,即(Lxy)2>(Lxy)1,但單位的改變并不會導(dǎo)致體重與身高之間相關(guān)程度的改變.不宜直接用Lxy度量成對樣本數(shù)據(jù)相關(guān)程度的大小.為了消除度量單位的影響,需要對數(shù)據(jù)作進一步的“標(biāo)準(zhǔn)化”處理.新知探究形數(shù)Bug:Lxy的大小受數(shù)據(jù)的度量單位的影響,但單位的改變并不會導(dǎo)致兩個變量之間相關(guān)程度的改變.新知探究為了消除度量單位的影響,需要對數(shù)據(jù)作進一步的“標(biāo)準(zhǔn)化”處理.稱r為變量x和變量y的樣本(線性)相關(guān)系數(shù).新知探究①r的正負(fù):反映成對樣本數(shù)據(jù)的變化趨勢變量x和變量y的樣本(線性)相關(guān)系數(shù):思考3:r的大小能否刻畫成對樣本數(shù)據(jù)的相關(guān)程度的強弱?r的取值范圍是什么?強強弱弱新知探究觀察r的結(jié)構(gòu),聯(lián)想到二維(平面)向量、三維(空間)向量數(shù)量積的坐標(biāo)表示,

新知探究①r的正負(fù):反映成對樣本數(shù)據(jù)的變化趨勢變量x和變量y的樣本(線性)相關(guān)系數(shù):②r的范圍:?1≤r≤1新知探究思考4:當(dāng)|r|=1時,成對樣本數(shù)據(jù)之間具有怎樣的關(guān)系呢?即此時兩個變量之間滿足一種線性(函數(shù))關(guān)系,即滿足完全線性相關(guān).故|r|越接近1時,線性相關(guān)程度越強;|r|越接近0時,線性相關(guān)程度越弱;若所有樣本點(xi,yi)(i=1,2,…,n)都在直線y=-2x+1上,則這組樣本數(shù)據(jù)的樣本相關(guān)系數(shù)為()新知探究①r的正負(fù):反映成對樣本數(shù)據(jù)的變化趨勢4、變量x和變量y的樣本(線性)相關(guān)系數(shù):②r的范圍:?1≤r≤1③|r|的大?。悍从吵蓪颖緮?shù)據(jù)線性相關(guān)的程度(即散點集中于某條直線的程度):|r|越接近1:線性相關(guān)程度越強;|r|越接近0:線性相關(guān)程度越弱.r=0時,只表明成對樣本數(shù)據(jù)間無線性相關(guān)關(guān)系,但不排除它們有其他相關(guān)關(guān)系.④樣本容量越大,用樣本相關(guān)系數(shù)估計兩個變量的相關(guān)系數(shù)的效果越好.新知探究r=0.97r=-0.85r=0.24r=-0.05正線性相關(guān)程度很強負(fù)線性相關(guān)程度較強正線性相關(guān)程度很弱負(fù)線性相關(guān)程度極弱①r的正負(fù):反映成對樣本數(shù)據(jù)的變化特征②r的范圍:?1≤r≤1③|r|的大小:反映成對樣本數(shù)據(jù)間線性相關(guān)的程度(即散點集中于一條直線的程度):當(dāng)|r|越接近1時,線性相關(guān)程度越強;當(dāng)|r|越接近0時,線性相關(guān)程度越弱.新知探究如:要確切了解脂肪含量y與年齡x的線性相關(guān)程度,需要調(diào)查所有人的年齡及其脂肪含量,再將得到的成對數(shù)據(jù)代入r的公式,計算出相關(guān)系數(shù)r.在實際中,獲得總體中所有的成對數(shù)據(jù)往往是不容易的.在有限的總體中,可以利用這兩個變量取值的所有成對數(shù)據(jù),通過上述公式就可計算出兩個變量的相關(guān)系數(shù),這個相關(guān)系數(shù)就能確切地反映變量之間相關(guān)關(guān)系的正負(fù)性及線性相關(guān)程度的強弱.通過抽樣獲取兩個變量的一些成對樣本數(shù)據(jù),再計算出樣本相關(guān)系數(shù),通過樣本相關(guān)系數(shù)去估計總體相關(guān)系數(shù),從而了解兩個變量之間的相關(guān)程度.思想:用樣本估計總體樣本容量越大,用樣本相關(guān)系數(shù)估計兩個變量的相關(guān)系數(shù)的效果越好.新知探索

答案:較高.新知探索

答案:0.3.例析例3、對四組數(shù)據(jù)進行統(tǒng)計,獲得如圖所示的散點圖,關(guān)于其相關(guān)系數(shù)的比較,正確的是(

)A.r1<r4<0<r3<r2B.r4<r1<0<r3<r2C.r4<r2<0<r3<r1D.r2<r4<0<r1<r3√例析例4、某廠的生產(chǎn)原料耗費x(單位:百萬元)與銷售額y(單位:百萬元)之間有如表所示的對應(yīng)關(guān)系:x2468y30405070(1)畫出(x,y)的散點圖;(2)計算x與y之間的樣本相關(guān)系數(shù),并刻畫它們的相關(guān)程度.例析解:(1)畫出(x,y)的散點圖如圖所示.由樣本相關(guān)系數(shù)r≈0.9827,可以推斷生產(chǎn)原料耗費與銷售額這兩個變量正線性相關(guān),且相關(guān)程度很強.課堂小結(jié)1.相關(guān)關(guān)系:兩個變量有關(guān)系,但又沒有確切到

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論