版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第八章成對數(shù)據(jù)的統(tǒng)計(jì)分析知識(shí)點(diǎn)一、變量間的相關(guān)關(guān)系1.變量與變量間的兩種關(guān)系:(1)函數(shù)關(guān)系:這是一種確定性的關(guān)系,即一個(gè)變量能被另一個(gè)變量按照某種對應(yīng)法則唯一確定.例如圓的面積.S與半徑r之間的關(guān)系S=πr2為函數(shù)關(guān)系.(2)相關(guān)關(guān)系:這是一種非確定性關(guān)系.當(dāng)一個(gè)變量取值一定時(shí),另一個(gè)變量的取值帶有一定的隨機(jī)性,這兩個(gè)變量之間的關(guān)系叫做相關(guān)關(guān)系。例如人的身高不能確定體重,但一般來說“身高者,體重也重”,我們說身高與體重這兩個(gè)變量具有相關(guān)關(guān)系.2.相關(guān)關(guān)系的分類:(1)在兩個(gè)變量中,一個(gè)變量是可控制變量,另一個(gè)變量是隨機(jī)變量,如施肥量與水稻產(chǎn)量;(2)兩個(gè)變量均為隨機(jī)變量,如某學(xué)生的語文成績與化學(xué)成績.3.散點(diǎn)圖:將兩個(gè)變量的各對數(shù)據(jù)在直角坐標(biāo)系中描點(diǎn)而得到的圖形叫做散點(diǎn)圖.它直觀地描述了兩個(gè)變量之間有沒有相關(guān)關(guān)系.這是我們判斷的一種依據(jù).4.回歸分析:與函數(shù)關(guān)系不同,相關(guān)關(guān)系是一種非確定性關(guān)系,對具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的方法叫做回歸分析。知識(shí)點(diǎn)二、線性回歸方程:1.回歸直線如果散點(diǎn)圖中點(diǎn)的分布從整體上看大致在一條直線附近,我們就稱這兩個(gè)變量之間具有線性相關(guān)關(guān)系,這條直線叫作回歸直線。2.回歸直線方程對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù),,……,,其回歸直線的截距和斜率的最小二乘法估計(jì)公式分別為:,其中表示數(shù)據(jù)xi(i=1,2,…,n)的均值,表示數(shù)據(jù)yi(i=1,2,…,n)的均值,表示數(shù)據(jù)xiyi(i=1,2,…,n)的均值.、的意義是:以為基數(shù),x每增加一個(gè)單位,y相應(yīng)地平均變化個(gè)單位.3.求回歸直線方程的一般步驟:①作出散點(diǎn)圖由樣本點(diǎn)是否呈條狀分布來判斷兩個(gè)量是否具有線性相關(guān)關(guān)系,若存在線性相關(guān)關(guān)系,進(jìn)行第二步。②求回歸系數(shù)、計(jì)算,,,,利用公式求出,再由求出的值;③寫出回歸直線方程;④利用回歸直線方程預(yù)報(bào)在x取某一個(gè)值時(shí)y的估計(jì)值。知識(shí)點(diǎn)三、相關(guān)性檢驗(yàn)(1)相關(guān)系數(shù)r的定義對于變量x與y隨機(jī)抽取到的n對數(shù)據(jù),,……,,稱為x與y的樣本相關(guān)系數(shù)。(2)相關(guān)系數(shù)r的作用樣本相關(guān)系數(shù)r用于衡量兩個(gè)變量之間是否具有線性相關(guān)關(guān)系,描述線性相關(guān)關(guān)系的強(qiáng)弱:①越接近1,表明兩個(gè)變量之間的線性相關(guān)程度越強(qiáng);越接近0,表明兩個(gè)變量之間的線性相關(guān)程度越弱。②當(dāng)r>0時(shí),表明兩個(gè)變量正相關(guān),即x增加,y隨之相應(yīng)地增加,若x減少,y隨之相應(yīng)地減少.當(dāng)r<0時(shí),表明兩個(gè)變量負(fù)相關(guān),即x增加,y隨之相應(yīng)地減少;若x減少,y隨之相應(yīng)地增加.若r=0,則稱x與y不相關(guān)。③當(dāng),認(rèn)為x與y之間具有很強(qiáng)的線性相關(guān)關(guān)系。④當(dāng)大于時(shí),表明有95%的把握認(rèn)為x與y之間具有線性相關(guān)關(guān)系,這時(shí)求回歸直線方程有必要也有意義,當(dāng)時(shí),尋找回歸直線方程就沒有意義。(3)利用相關(guān)系數(shù)r檢驗(yàn)的一般步驟:法一:①作統(tǒng)計(jì)假設(shè):x與y不具有線性相關(guān)關(guān)系。②根據(jù)樣本相關(guān)系數(shù)計(jì)算公式算出r的值。③比較與0.75的大小關(guān)系,得出統(tǒng)計(jì)結(jié)論。如果,認(rèn)為x與y之間具有很強(qiáng)的線性相關(guān)關(guān)系。法二:①作統(tǒng)計(jì)假設(shè):x與y不具有線性相關(guān)關(guān)系。②根據(jù)樣本相關(guān)系數(shù)計(jì)算公式算出r的值。③根據(jù)小概率0.05與n2在相關(guān)性檢驗(yàn)的臨界值表中查出r的一個(gè)臨界值(n未數(shù)據(jù)的對數(shù))。④比較與,作統(tǒng)計(jì)推斷,如果,表明有95%的把握認(rèn)為x與y之間具有線性相關(guān)關(guān)系。如果,我們沒有理由拒絕原來的假設(shè),即不認(rèn)為x與y之間具有線性相關(guān)關(guān)系。這時(shí)尋找回歸直線方程是毫無意義的。知識(shí)點(diǎn)四、線性回歸分析與非線性回歸分析1.線性回歸分析對于回歸分析問題,在解題時(shí)應(yīng)首先利用散點(diǎn)圖或相關(guān)性檢驗(yàn)判斷x與y是否具有線性相關(guān)關(guān)系,如果線性相關(guān),才能求解后面的問題.否則求線性回歸方程沒有實(shí)際意義,它不能反映變量x與y,之間的變化規(guī)律.只有在x與y之間具有相關(guān)關(guān)系時(shí),求線性回歸方程才有實(shí)際意義.相關(guān)性檢驗(yàn)的依據(jù):主要利用檢驗(yàn)統(tǒng)計(jì)量(其中化簡式容易記也好用)求出檢驗(yàn)統(tǒng)計(jì)量的樣本相關(guān)系數(shù),再利用r的性質(zhì)確定x和y是否具有線性相關(guān)關(guān)系,r具有的性質(zhì)為:|r|≤1且|r|越接近于1,線性相關(guān)程度越強(qiáng);|r|越接近于0,線性相關(guān)程度越弱.2.線性回歸分析的一般步驟(1)確定研究對象,明確哪個(gè)變量是解釋變量,哪個(gè)變量是預(yù)報(bào)變量;(2)判斷兩變量是否具有線性相關(guān)關(guān)系①作散點(diǎn)圖由樣本點(diǎn)是否呈條狀分布來判斷兩個(gè)量是否具有線性相關(guān)關(guān)系。②求相關(guān)系數(shù)r當(dāng),認(rèn)為x與y之間具有很強(qiáng)的線性相關(guān)關(guān)系。(3)若兩變量存在線性相關(guān)關(guān)系,設(shè)所求的線性回歸方程為,求回歸系數(shù)、。(4)寫出回歸直線方程;(5)利用回歸直線方程預(yù)報(bào)在x取某一個(gè)值時(shí)y的估計(jì)值。3.非線性回歸分析(1)對于非線性回歸分析問題,如果給出了經(jīng)驗(yàn)公式可直接利用換元,使新元與y具有線性相關(guān)關(guān)系,進(jìn)一步求出,,對新元的線性回歸方程,換回x即可得y對x的回歸曲線方程.(2)非線性回歸問題有時(shí)并不給出經(jīng)驗(yàn)公式,這時(shí)按以下步驟求回歸方程:①畫出已知數(shù)據(jù)的散點(diǎn)圖,看是否是線性回歸分析問題,如果不是,把它與必修數(shù)學(xué)中學(xué)過的函數(shù)(冪函數(shù)、指數(shù)函數(shù)、對數(shù)函數(shù)等)圖像作比較,挑選一種跟這些散點(diǎn)擬合得最好的函數(shù),采用適當(dāng)?shù)淖兞恐脫Q,把非線性回歸分析問題化為線性回歸分析問題.②作相關(guān)性檢驗(yàn),即判斷尋找線性回歸方程是否有意義.③當(dāng)尋找線性回歸方程有意義時(shí),計(jì)算系數(shù),,得到線性回歸方程.④代回x得y對x的回歸曲線方程.知識(shí)點(diǎn)五列聯(lián)表1.列聯(lián)表用表格列出的分類變量的頻數(shù)表,叫做列聯(lián)表。2.2×2列聯(lián)表對于兩個(gè)事件A,B,列出兩個(gè)事件在兩種狀態(tài)下的數(shù)據(jù),如下表所示:事件B事件合計(jì)事件Aaba+b事件cdc+d合計(jì)a+cb+da+b+c+d這樣的表格稱為2×2列聯(lián)表。知識(shí)點(diǎn)六卡方統(tǒng)計(jì)量公式為了研究分類變量X與Y的關(guān)系,經(jīng)調(diào)查得到一張2×2列聯(lián)表,如下表所示Y1Y2合計(jì)X1aba+bX2cdc+d合計(jì)a+cb+dn=a+b+c+d統(tǒng)計(jì)中有一個(gè)有用的(讀做“卡方”)統(tǒng)計(jì)量,它的表達(dá)式是:(為樣本容量)。知識(shí)點(diǎn)七獨(dú)立性檢驗(yàn)1.獨(dú)立性檢驗(yàn)通過2×2列聯(lián)表,再通過卡方統(tǒng)計(jì)量公式計(jì)算的值,利用隨機(jī)變量來確定在多大程度上可以認(rèn)為“兩個(gè)分類變量有關(guān)系”的方法稱為兩個(gè)分類變量的獨(dú)立性檢驗(yàn)。2.變量獨(dú)立性的判斷通過對統(tǒng)計(jì)量分布的研究,已經(jīng)得到兩個(gè)臨界值:3.841和6.635。當(dāng)數(shù)據(jù)量較大時(shí),在統(tǒng)計(jì)中,用以下結(jié)果對變量的獨(dú)立性進(jìn)行判斷:①如果≤3.841時(shí),認(rèn)為事件A與B是無關(guān)的。②如果>3.841時(shí),有95%的把握說事件A與事件B有關(guān);③如果>6.635時(shí),有99%的把握說事件A與事件B有關(guān);3.獨(dú)立性檢驗(yàn)的基本步驟及簡單應(yīng)用獨(dú)立性檢驗(yàn)的步驟:要推斷“A與B是否有關(guān)”,可按下面步驟進(jìn)行:(1)提出統(tǒng)計(jì)假設(shè)H0:事件A與B無關(guān)(相互獨(dú)立);(2)抽取樣本(樣本容量不要太小,每個(gè)數(shù)據(jù)都要大于5);(3)列出2×2列聯(lián)表;(4)根據(jù)2×2列聯(lián)表,利用公式:,計(jì)算出的值;(5)統(tǒng)計(jì)推斷:當(dāng)>3.841時(shí),有95%的把握說事件A與B有關(guān);當(dāng)>6.635時(shí),有99%的把握說事件A與B有關(guān);當(dāng)>10.828時(shí),有99.9%的把握說事件A與B有關(guān);當(dāng)≤3.841時(shí),認(rèn)為事件A與B是無關(guān)的.類型一回歸分析及相關(guān)檢驗(yàn)例1根據(jù)如下樣本數(shù)據(jù)3456784.02.50.5得到的回歸方程為,則()A. B. C. D.解析:樣本點(diǎn)的散點(diǎn)圖如圖31.由散點(diǎn)圖可知,.答案:B規(guī)律總結(jié):由散點(diǎn)圖不僅可以直觀地看出兩個(gè)變量是否相關(guān),而且可以判斷兩個(gè)線性相關(guān)的變量是正相關(guān)還是負(fù)相關(guān).當(dāng)兩個(gè)變量正相關(guān)時(shí),;當(dāng)兩個(gè)變量負(fù)相關(guān)時(shí),.例2假設(shè)某農(nóng)作物基本苗數(shù)與有效穗數(shù)之間存在相關(guān)關(guān)系,今測得5組數(shù)據(jù)如下:15.025.830.036.644.439.442.942.943.149.2(1)以為解釋變量,為預(yù)報(bào)變童,畫出散點(diǎn)圖;(2)求與之間的回歸方程,對于基本苗數(shù)56.7預(yù)報(bào)有效穗數(shù);(3)計(jì)算各組殘差;(4)求,并說明隨機(jī)誤差對有效穗數(shù)的影響占百分之幾?解:(1)散點(diǎn)圖如圖32所示.(2)由圖看出,樣本點(diǎn)呈條狀分布,有比較好的線性相關(guān)關(guān)系因此可以用線性回歸方程來建立兩個(gè)變量之間的關(guān)系.設(shè)線性回歸方程為,由表中數(shù)據(jù)可得,,.故與之間的回歸方程為.當(dāng)時(shí),.估計(jì)有效穗數(shù)為.(3)各組數(shù)據(jù)的殘差分別為e:二0.39,(4)故解釋變量(農(nóng)作物基本苗數(shù))對有效穗數(shù)的影響約占了83.2%所以隨機(jī)誤差對有效穗數(shù)的影響約占.規(guī)律總結(jié):進(jìn)行線性回歸分析的關(guān)鍵是先畫出樣本點(diǎn)的散點(diǎn)圖,確定出變量具有線性相關(guān)關(guān)系,再求出線性回歸方程.如果,的線性相關(guān)關(guān)系具有統(tǒng)計(jì)意義,就可以用線性回歸方程作出預(yù)測和控制.預(yù)測是指對于的取值范圍內(nèi)的任一個(gè),取相應(yīng)值的估計(jì);控制是指通過控制的值把的值控制在指定范圍內(nèi).類型二獨(dú)立性檢驗(yàn)例3某工廠有25周歲以上(含25周歲)工人300名,25周歲以下工人200名.為研究工人的日平均生產(chǎn)量是否與年齡有關(guān),現(xiàn)采用分層抽樣的方法,從中抽取了100名工人,先統(tǒng)計(jì)了他們某月的日平均生產(chǎn)件數(shù),然后按工人年齡在“25周歲以上(含25周歲)”和“25周歲以下”分為兩組,再將兩組工人的日平均生產(chǎn)件數(shù)分成5組:[50,60),[60,70),[70,80),[80,90),[90,100]分別加以統(tǒng)計(jì),得到如圖所示的頻率分布直方圖.(1)從樣本中日平均生產(chǎn)件數(shù)不足60件的工人中隨機(jī)抽取2人,求至少抽到一名“25周歲以下組”工人的概率;(2)規(guī)定日平均生產(chǎn)件數(shù)不少于80件者為“生產(chǎn)能手”,請你根據(jù)已知條件完成列聯(lián)表,并判斷能否在犯錯(cuò)誤的概率不超過0.1的前提下認(rèn)為“生產(chǎn)能手與工人所在的年齡組有關(guān)”分析:(1)利用列舉法列出基本事件,結(jié)合古典概型求解;(2)利用獨(dú)立性檢驗(yàn)公式計(jì)算求解.解:(1)由已知可得,樣本中有25周歲以上組工人60名,25周歲以下組工人40名,所以樣本中日平均生產(chǎn)件數(shù)不足60件的工人中,25周歲以上組工人有(人),記為;25周歲以下組工人有(人),記為.從中隨機(jī)抽取2名工人,所有的可能結(jié)果共有10種,分別是其中,至少有一名“25周歲以下組”工人的可能結(jié)果共有7種,分別是故所求的概率.(2)由頻率分布直方圖可知,在抽取的100名工人中,“25周歲以上組”中的生產(chǎn)能手有(人),“25周歲以下組”中的生產(chǎn)能手有(人),據(jù)此可得列聯(lián)表如下:生產(chǎn)能手非生產(chǎn)能手總計(jì)25周歲以上組15456025周歲以下組152540總計(jì)3070100所以代入公式,得的觀測值為因?yàn)?,所以不能在犯錯(cuò)誤的概率不超過0.1的前提下認(rèn)為“生產(chǎn)能手與工人所在的年齡組有關(guān)”解后反思:解決獨(dú)立性檢驗(yàn)問題的基本步驟:(1)找出相關(guān)數(shù)據(jù),作列聯(lián)表;(2)求隨機(jī)變量的觀測值;(3)判斷可能性,注意與臨界值進(jìn)行比較,得出事件有關(guān)的可信度.例4為了比較注射A,B兩種藥物后產(chǎn)生的皮膚皰疹的面積,選200只家兔做試驗(yàn).將這200只家兔隨機(jī)地分成兩組,每組100只,其中一組注射藥物A,另一組注射藥物B.(1)甲、乙是200只家兔中的2只,求甲、乙分在不同組的概率;(2)下表1和表2分別表示注射藥物A和B后的試驗(yàn)結(jié)果(皰疹面積單位:).表1:注射藥物A后皮膚皰疹面積的頻數(shù)分布表皰疹面積[60,65)[65,70)[70,75)[75,80)頻數(shù)30402010表2:注射藥物B后皮膚皰疹面積的頻數(shù)分布表皰疹面積[60,65)[65,70)[70,75)[75,80)[80,85)頻數(shù)1025203015①完成下面頻率分布直方圖(圖34和圖35),并比較注射兩種藥物后皰疹面積的中位數(shù)大小;注射藥物A后皮膚皰疹面積的頻率分布直方圖注射藥物B后皮膚皰疹面積的頻率分布直方圖②完成下面列聯(lián)表,并回答能否在犯錯(cuò)誤的概率不超過的前提下認(rèn)為“注射藥物A后的皰疹面積與注射藥物B后的皰疹面積有差異”.表3:皰疹面積小于皰疹面積不小于總計(jì)注射藥物A注射藥物B總計(jì)分析:(1)利用排列組合知識(shí)及古典概型求解;(2)先根據(jù)頻數(shù)分布表完成頻率分布直方圖和列聯(lián)表,再計(jì)算的觀測值,并與臨界值比較后進(jìn)行判斷.解析:(1)甲、乙兩只家兔分在不同組的概率為.(2)①頻率分布直方圖如圖所示.注射藥物A后皮膚皰疹面積的頻率分布直方圖注射藥物B后皮膚皰疹面積的頻率分布直方圖可以看出注射藥物A后的皰疹面枳的中位數(shù)在6
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 長沙二手房交易退訂保障合同
- 2025權(quán)威軟件購銷合同范本
- 飛機(jī)制造合同
- 2025標(biāo)準(zhǔn)小產(chǎn)權(quán)房購房合同模板
- 電子產(chǎn)品回收合同
- 泉州海洋職業(yè)學(xué)院《原理與觸摸屏應(yīng)用》2023-2024學(xué)年第一學(xué)期期末試卷
- 泉州工程職業(yè)技術(shù)學(xué)院《數(shù)字地形測量學(xué)(1)》2023-2024學(xué)年第一學(xué)期期末試卷
- mcn 簽約藝人合同范例
- 2023年注冊安全工程師安全生產(chǎn)法強(qiáng)化練習(xí)
- 泉州紡織服裝職業(yè)學(xué)院《金融營銷學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 光伏并網(wǎng)系統(tǒng)調(diào)試驗(yàn)收報(bào)告2016.04
- 設(shè)計(jì)技術(shù)標(biāo)后期服務(wù)參考范例
- 產(chǎn)品品質(zhì)檢驗(yàn)流程標(biāo)準(zhǔn)規(guī)范模板()
- 人教版三-四年級(jí)體育與健康 4.1.3.2接力跑 4×100米接力跑 教案
- 小學(xué)綜合實(shí)踐六年級(jí)上冊第4單元《主題活動(dòng)三:校園文化活動(dòng)我參與》教案
- 剛曉觀所緣緣論略講
- 安全生產(chǎn)目標(biāo)實(shí)施計(jì)劃表
- DB31∕T 1038-2017 生態(tài)公益林主要造林樹種苗木質(zhì)量分級(jí)
- 主動(dòng)脈夾層概述ppt課件(PPT 57頁)
- 《西游記》“一站到底”(51-100回)
- 《現(xiàn)代大學(xué)英語精讀1》第二課
評(píng)論
0/150
提交評(píng)論