




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第03講成對數(shù)據(jù)的統(tǒng)計分析(精講)目錄第一部分:知識點精準記憶第二部分:課前自我評估測試第三部分:典型例題剖析題型一:成對數(shù)據(jù)的相關性題型二:回歸分析角度1:經(jīng)驗回歸方程及應用角度2:非線性經(jīng)驗回歸方程及應用角度3:相關系數(shù)SKIPIF1<0角度4:殘差分析題型三:列聯(lián)表與獨立性檢驗第四部分:高考真題感悟第一部分:知識點精準記憶第一部分:知識點精準記憶知識點一:變量的相關關系(1)兩個變量有關系,但又沒有確切到可由其中一個去精確地決定另一個的程度,這種關系稱為相關關系.(2)正相關、負相關從整體上看,當一個變量的值增加時,另一個變量的相應值也呈現(xiàn)增加的趨勢,我們就稱這兩個變量正相關;如果當一個變量的值增加時,另一個變量的相應值呈現(xiàn)減小的趨勢,則稱這兩個變量負相關.
(3)線性相關、非線性相關一般地,如果兩個變量的取值呈現(xiàn)正相關或負相關,而且散點落在一條直線附近,我們就稱這兩個變量線性相關.
一般地,如果兩個變量具有相關性,但不是線性相關,那么我們就稱這兩個變量非線性相關或曲線相關.知識點二:樣本相關系數(shù)(1)相關系數(shù)SKIPIF1<0的計算變量SKIPIF1<0與變量SKIPIF1<0的樣本相關系數(shù)SKIPIF1<0的計算公式如下:SKIPIF1<0(2)相關系數(shù)SKIPIF1<0的性質①當SKIPIF1<0時,稱成對樣本數(shù)據(jù)正相關;當SKIPIF1<0時,稱成對樣本數(shù)據(jù)負相關.當SKIPIF1<0時,成對樣本數(shù)據(jù)間沒有線性相關關系.②樣本相關系數(shù)SKIPIF1<0的取值范圍為SKIPIF1<0,當SKIPIF1<0越接近1時,成對樣本數(shù)據(jù)的線性相關程度越強;當SKIPIF1<0越接近0時,成對樣本數(shù)據(jù)的線性相關程度越弱.知識點三:一元線性回歸模型(1)數(shù)學表述式:如果兩個變量之間的關系可以表示為SKIPIF1<0我們稱該式為SKIPIF1<0關于SKIPIF1<0的一元線性回歸模型.其中,SKIPIF1<0稱為因變量或響應變量,SKIPIF1<0稱為自變量或解釋變量;SKIPIF1<0和SKIPIF1<0為模型的未知參數(shù),SKIPIF1<0稱為截距參數(shù),SKIPIF1<0稱為斜率參數(shù);SKIPIF1<0是SKIPIF1<0與SKIPIF1<0之間的隨機誤差.(2)經(jīng)驗回歸方程我們將SKIPIF1<0稱為SKIPIF1<0關于SKIPIF1<0的經(jīng)驗回歸方程,也稱經(jīng)驗回歸函數(shù)或經(jīng)驗回歸公式,其圖形稱為經(jīng)驗回歸直線,其中SKIPIF1<0(3)利用SKIPIF1<0刻畫回歸效果SKIPIF1<0的計算公式為SKIPIF1<0,其意義是SKIPIF1<0越大,殘差平方和SKIPIF1<0越小,即模型的擬合效果越好;SKIPIF1<0越小,殘差平方和越大,即模型的擬合效果越差.知識點四:列聯(lián)表與獨立性檢驗(1)2×2列聯(lián)表如圖,給出成對分類變量數(shù)據(jù)的交叉分類頻數(shù)的數(shù)據(jù)統(tǒng)計表稱為2×2列聯(lián)表.SKIPIF1<0SKIPIF1<0合計SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0合計SKIPIF1<0SKIPIF1<0SKIPIF1<0(2)獨立性檢驗依據(jù)上述SKIPIF1<0列聯(lián)表構造統(tǒng)計量SKIPIF1<0利用SKIPIF1<0的取值推斷分類變量SKIPIF1<0和SKIPIF1<0是否獨立的方法稱為SKIPIF1<0獨立性檢驗,讀作“卡方獨立性檢驗”,簡稱獨立性檢驗.常用的小概率值和臨界值表SKIPIF1<00.10.050.010.0050.001SKIPIF1<02.7063.8416.6357.87910.828第二部分:課前自我評估測試第二部分:課前自我評估測試1.(2022·重慶·高二階段練習)甲?乙?丙?丁四位同學各自對SKIPIF1<0兩變量的線性相關性做試驗,分別求得樣本相關系數(shù)SKIPIF1<0,如下表:甲乙丙丁SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0則試驗結果中SKIPIF1<0兩變量有更強線性相關性的是(
)A.甲 B.乙 C.丙 D.丁2.(2022·全國·長垣市第一中學高三開學考試(文))在研究線性回歸模型時,樣本數(shù)據(jù)SKIPIF1<0所對應的點均在直線SKIPIF1<0上,用SKIPIF1<0表示解釋變量對于預報變量變化的貢獻率,則SKIPIF1<0(
)A.SKIPIF1<0 B.SKIPIF1<0 C.1 D.23.(2022·河南南陽·高二期末(文))對兩個變量SKIPIF1<0與SKIPIF1<0進行回歸分析,有SKIPIF1<0個不同模型可供選擇,其中擬合效果最好的是(
)A.模型SKIPIF1<0的相關系數(shù)SKIPIF1<0為SKIPIF1<0 B.模型SKIPIF1<0的相關系數(shù)SKIPIF1<0為SKIPIF1<0C.模型SKIPIF1<0的相關系數(shù)SKIPIF1<0為SKIPIF1<0 D.模型SKIPIF1<0的相關系數(shù)SKIPIF1<0為SKIPIF1<04.(多選)(2022·全國·高二課時練習)下列散點圖中,變量X,Y可用直線擬合的是(
)A. B.C. D.5.(2022·山東濟寧·高二期末)下列命題中正確的是(
)A.在回歸分析中,成對樣本數(shù)據(jù)的樣本相關系數(shù)r的絕對值越大,成對樣本數(shù)據(jù)的線性相關程度越強B.在回歸分析中,可用決定系數(shù)SKIPIF1<0的值判斷模型的擬合效果,SKIPIF1<0越大,模型的擬合效果越好C.比較兩個模型的擬合效果,可以比較殘差平方和的大小,殘差平方和越小的模型擬合效果越差D.對分類變量X與Y,統(tǒng)計量SKIPIF1<0的值越大,則判斷“X與Y有關系”的把握程度越大6.(2022·全國·高二課時練習)中國射擊隊在東京奧運會上共獲得4金1銀6銅,共11枚獎牌的成績,創(chuàng)下了中國射擊隊奧運參賽史上獎牌數(shù)最多的新紀錄.現(xiàn)從某射擊訓練基地隨機抽取了20名學員(男、女各10人),統(tǒng)計他們的射擊環(huán)數(shù),數(shù)據(jù)如下表所示:男生897976101086女生10986879788若射擊環(huán)數(shù)大于或等于9環(huán),則認為成績優(yōu)異;否則,認為成績不優(yōu)異.根據(jù)所給數(shù)據(jù),建立SKIPIF1<0列聯(lián)表,并判斷是否有90%的把握認為成績優(yōu)異與性別有關.參考公式和數(shù)據(jù):SKIPIF1<0,SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0第三部分:典型例題剖析第三部分:典型例題剖析題型一:成對數(shù)據(jù)的相關性典型例題例題1.(2022·北京通州·高二期末)對三組數(shù)據(jù)進行統(tǒng)計,獲得以下散點圖,關于其相關系數(shù)依次是SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,則它們的大小關系是(
)A.SKIPIF1<0 B.SKIPIF1<0 C.SKIPIF1<0 D.SKIPIF1<0例題2.(2022·江蘇淮安·高二期末)對四組數(shù)據(jù)進行統(tǒng)計后,獲得了如下圖所示的散點圖,對于其相關系數(shù)的比較,下列說法正確的是(
)A.SKIPIF1<0 B.SKIPIF1<0C.SKIPIF1<0 D.SKIPIF1<0例題3.(2022·河南信陽·高二期末(文))若一組觀測值SKIPIF1<0,SKIPIF1<0,…,SKIPIF1<0(SKIPIF1<0)對應的點位于同一直線上,則x,y的相關系數(shù)為______.同類題型歸類練1.(2022·河南駐馬店·高二期末(理))相關變量x,y的散點圖如圖所示,現(xiàn)對這兩個變量進行線性相關分析.方案一:根據(jù)圖中所有數(shù)據(jù),得到回歸直線方程SKIPIF1<0,相關系數(shù)為SKIPIF1<0;方案二:剔除點SKIPIF1<0,根據(jù)剩下的數(shù)據(jù)得到回歸直線方程SKIPIF1<0,相關系數(shù)為SKIPIF1<0.則(
)A.SKIPIF1<0 B.SKIPIF1<0C.SKIPIF1<0 D.SKIPIF1<02.(2022·陜西西安·高二期末(理))小華為了研究數(shù)學名次和物理名次的相關關系,記錄了本班五名同學的數(shù)學和物理的名次,如圖.后來發(fā)現(xiàn)第四名同學數(shù)據(jù)記錄有誤,那么去掉數(shù)據(jù)SKIPIF1<0后,下列說法錯誤的是(
)A.樣本線性相關系數(shù)SKIPIF1<0變大 B.殘差平方和變大C.變量SKIPIF1<0、SKIPIF1<0的相關程度變強 D.線性相關系數(shù)SKIPIF1<0越趨近于SKIPIF1<03.(多選)(2022·廣東潮州·高二期末)對四組數(shù)據(jù)進行統(tǒng)計,獲得如圖所示的散點圖,關于其相關系數(shù)的關系,正確的有(
)A.SKIPIF1<0 B.SKIPIF1<0 C.SKIPIF1<0 D.SKIPIF1<04.(2022·福建廈門·高二期末)廈門中學生助手的甲、乙研究某人1-18周歲的身高y(單位:厘米)與年齡x(單位:周歲)的關系.甲用SKIPIF1<0擬合得圖1,記x與y的樣本相關系數(shù)為SKIPIF1<0,決定系數(shù)為SKIPIF1<0;乙用SKIPIF1<0擬合得圖2,記x與y的樣本相關系數(shù)為SKIPIF1<0,得y與x的關系SKIPIF1<0,決定系數(shù)為SKIPIF1<0,則(
)A.SKIPIF1<0 B.SKIPIF1<0 C.SKIPIF1<0 D.SKIPIF1<0題型二:回歸分析角度1:經(jīng)驗回歸方程及應用典型例題例題1.(2022·陜西西安·高一期末)打好脫貧攻堅戰(zhàn),穩(wěn)步實施鄉(xiāng)村振興,離不開農村基層黨組織的堅強戰(zhàn)斗堡壘作用的發(fā)揮.某村村黨支部書記為改良鹽堿地土壤,從省城請來專家進行技術指導,并從某農業(yè)大學引進富硒草莓.功夫不負有心人,富硒草莓種植成功,村里建起了草苺采摘園,到了年底,種植草莓的收入連同合作社的其他經(jīng)營項目一起,成了貧困戶的主要經(jīng)濟來源.該村對近幾年草莓的采摘價格和采摘人數(shù)情況進行了統(tǒng)計,發(fā)現(xiàn)草莓的采摘價格SKIPIF1<0(元/斤)和采摘人數(shù)SKIPIF1<0(千人)的關系如下表:草莓采摘價格SKIPIF1<0(元/斤)2025303540采摘人數(shù)SKIPIF1<0(千人)5852453228(1)已知SKIPIF1<0與SKIPIF1<0之間有較強的線性相關性,試用最小二乘法求出SKIPIF1<0關于SKIPIF1<0的回歸直線方程SKIPIF1<0;(2)該村根據(jù)2022年草莓的產量,估計約34千人采摘,那么2022年草莓的采摘價格應定為多少元/斤?(結果保留整數(shù))參考公式:線性回歸方程SKIPIF1<0的斜率和截距的棷小二乘估計分別為SKIPIF1<0.參考數(shù)據(jù):SKIPIF1<0.例題2.(2022·全國·高二課時練習)隨著我國中醫(yī)學的發(fā)展,藥用昆蟲的使用愈來愈多,每年春暖以后至寒冬前,昆蟲大量活動與繁殖,易于采集各種藥用昆蟲.已知一只藥用昆蟲的產卵數(shù)SKIPIF1<0(單位:個)與溫度SKIPIF1<0(單位:℃)有關,于是科研人員在3月份中隨機挑選了5天進行研究,現(xiàn)收集了該種藥用昆蟲的5組觀測數(shù)據(jù),如表所示.日期2日7日15日22日30日溫度SKIPIF1<0/℃101113126產卵數(shù)SKIPIF1<0/個2125302613科研人員確定的研究方案是:先從這5組數(shù)據(jù)中任選2組,用剩下的3組數(shù)據(jù)建立SKIPIF1<0關于SKIPIF1<0的線性回歸方程,再用選取的2組數(shù)據(jù)進行檢驗.(1)若選取的是2日與30日這2組數(shù)據(jù),請根據(jù)7日、15日和22日這3組數(shù)據(jù),求出SKIPIF1<0關于SKIPIF1<0的線性回歸方程.(2)若由線性回歸方程得到的估計數(shù)據(jù)與所選出的檢驗數(shù)據(jù)的誤差均不超過2個,則認為得到的線性回歸方程是可靠的.試問(1)中所得的線性回歸方程是否可靠?附:回歸直線方程的斜率和截距的最小二乘估計公式分別為SKIPIF1<0,SKIPIF1<0.例題3.(2022·重慶巴蜀中學高三階段練習)炎炎夏日,酷暑難耐!一種新型的清涼飲料十分暢銷,如圖是某商店SKIPIF1<0月SKIPIF1<0日至SKIPIF1<0日售賣該種飲料的累計銷售量(單位:十瓶)的散點圖:(參考數(shù)據(jù):SKIPIF1<0,SKIPIF1<0,SKIPIF1<0)(1)由散點圖可知,SKIPIF1<0日的數(shù)據(jù)偏差較大,請用前SKIPIF1<0組數(shù)據(jù)求出累計銷售量SKIPIF1<0(單位:十瓶)關于日期SKIPIF1<0(單位:日)的經(jīng)驗回歸方程;(2)請用(1)中求出的經(jīng)驗回歸方程預測該商店SKIPIF1<0月份(共SKIPIF1<0天)售賣這種飲料的累計銷售量.附:經(jīng)驗回歸方程SKIPIF1<0中斜率和截距的最小二乘估計公式分別為:SKIPIF1<0,SKIPIF1<0.同類題型歸類練1.(2022·內蒙古·滿洲里市第一中學高二期末(文))某大型企業(yè)響應政府“節(jié)能環(huán)保,還人民一個蔚藍的天空”的號召,對生產過程進行了節(jié)能降耗的環(huán)保技術改造.下表提供了技術改造后生產甲產品過程中記錄的產量SKIPIF1<0與相應的生產能耗SKIPIF1<0標準煤的幾組對照數(shù)據(jù):SKIPIF1<012345SKIPIF1<03681013(1)請根據(jù)上表提供的數(shù)據(jù),用最小二乘法求出SKIPIF1<0關于SKIPIF1<0的線性回歸方程SKIPIF1<0;(參考公式:SKIPIF1<0,SKIPIF1<0)(2)已知該企業(yè)技術改造前生產SKIPIF1<0甲產品耗能為SKIPIF1<0標準煤,試根據(jù)(1)求出的線性回歸方程,預測生產SKIPIF1<0甲產品的耗能比技術改造前降低多少SKIPIF1<0標準煤?2.(2022·新疆·新和縣實驗中學高二期末(文))某研究機構對高三學生的記憶力x和判斷力y進行統(tǒng)計分析,得下表數(shù)據(jù):x681012y2356相關公式:SKIPIF1<0,SKIPIF1<0(1)請根據(jù)上表提供的數(shù)據(jù),用最小二乘法求出y關于x的線性回歸方程:SKIPIF1<0(2)試根據(jù)(1)求出的線性回歸方程,預測記憶力為9的同學的判斷力.3.(2022·陜西漢中·高一期末)2021年5月習近平總書記到某地的醫(yī)圣祠考察,總書記說,過去中華民族幾千年都是靠中醫(yī)藥治病救人,特別是經(jīng)過抗擊新冠肺炎疫情、非典等重大傳染病之后,我們對中醫(yī)藥的作用有了更深的認識,我們要發(fā)展中醫(yī)藥,注重用現(xiàn)代科學解讀中醫(yī)藥學原理,走中西醫(yī)結合的道路.某農科所經(jīng)過實地考察和研究,發(fā)現(xiàn)某地適合種植甲、乙兩種藥材,通過大量考察研究,得到如下統(tǒng)計數(shù)據(jù);藥材甲的畝產量約為300公斤,其收購價格處于上漲趨勢,最近五年的價格如表:年份20172018201920202021年份編號12345單價/元/公斤)1719232630藥材乙的收購價格始終為21元/公斤,其畝產量的頻率分布直方圖如圖:(1)若藥材甲的單價y(單位;元/公斤)與年份編號x具有線性相關關系,請求出y關于x的線性回歸方程;(2)用上述頻率分布直方圖估計藥材乙的平均畝產量,若不考慮其他因素,試判斷2022年該地區(qū)種植哪種藥材收益更高?并說明理由.參考公式:線性回歸方程SKIPIF1<0的斜率和截距的最小二乘估計分別為SKIPIF1<0,SKIPIF1<0.角度2:非線性經(jīng)驗回歸方程及應用典型例題例題1.(2022·陜西·千陽縣中學一模(理))某公司為確定下一年度投入某種產品的宣傳費,需了解年宣傳費SKIPIF1<0(單位:千元)對年銷售量SKIPIF1<0(單位:t)和年利潤SKIPIF1<0(單位:千元)的影響,對近8年的年宣傳費SKIPIF1<0和年銷售量SKIPIF1<0(SKIPIF1<0=1,2,···,8)數(shù)據(jù)作了初步處理,得到下面的散點圖及一些統(tǒng)計量的值.SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<046.65636.8289.81.61469108.8表中SKIPIF1<0,SKIPIF1<0.(1)根據(jù)散點圖判斷,SKIPIF1<0與SKIPIF1<0哪一個適宜作為年銷售量SKIPIF1<0關于年宣傳費SKIPIF1<0的回歸方程類型?(給出判斷即可,不必說明理由)(2)根據(jù)(1)的判斷結果及表中數(shù)據(jù),建立SKIPIF1<0關于SKIPIF1<0的回歸方程;附:對于一組數(shù)據(jù)SKIPIF1<0,SKIPIF1<0,……,SKIPIF1<0,其回歸線SKIPIF1<0的斜率和截距的最小二乘估計分別為:SKIPIF1<0例題2.(2022·河南南陽·高二期末(文))在中國文娛消費中,視聽付費市場規(guī)模不斷增長,從2013年到2021年,在線音樂市場規(guī)模變化情況如下表所示:年份201320142015201620172018201920202021市場規(guī)模(億元)0.50.91.62.84.710.518.829.943.7將2013年作為第1年,設第SKIPIF1<0年的市場規(guī)模為SKIPIF1<0(SKIPIF1<0,2,3,…,9)億元.(1)SKIPIF1<0與SKIPIF1<0哪一個更適宜作為市場規(guī)模SKIPIF1<0關于SKIPIF1<0的回歸方程?(給出判斷即可,不必說明理由)(2)根據(jù)(1)中的判斷及表中的數(shù)據(jù),求市場規(guī)模SKIPIF1<0關于SKIPIF1<0的回歸方程.(系數(shù)精確到0.0001)參考數(shù)據(jù):令SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0.附:對于一組數(shù)據(jù)SKIPIF1<0,SKIPIF1<0,…,SKIPIF1<0,其回歸直線方程SKIPIF1<0中,SKIPIF1<0,SKIPIF1<0.例題3.(2022·四川·成都七中模擬預測(理))新冠肺炎疫情發(fā)生以來,我國某科研機構開展應急科研攻關,研制了一種新型冠狀病毒疫苗,并已進入二期臨床試驗.根據(jù)普遍規(guī)律.志愿者接種疫苗后體內會產生抗體,人體中檢測到抗體,說明有抵御病毒的能力.通過檢測,用SKIPIF1<0表示注射疫苗后的天數(shù).SKIPIF1<0表示人體中抗體含量水平(單位:SKIPIF1<0,即:百萬國際單位毫升),現(xiàn)測得某志愿者的相關數(shù)據(jù)如下表所示:天數(shù)SKIPIF1<0123456抗體含量水平SKIPIF1<0510265096195根據(jù)以上數(shù)據(jù),繪制了散點圖.(1)根據(jù)散點圖判斷,SKIPIF1<0與SKIPIF1<0(SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0均為大于零的常數(shù))哪一個更適宜作為描述SKIPIF1<0與SKIPIF1<0關系的回歸方程類型?(給出判斷即可,不必說明理由)(2)根據(jù)(1)的判斷結果求出SKIPIF1<0關于SKIPIF1<0的回歸方程,并預測該志愿者在注射疫苗后的第10天的抗體含量水平值;(3)從這位志愿者的前6天的檢測數(shù)據(jù)中隨機抽取4天的數(shù)據(jù)作進一步的分析,記其中的SKIPIF1<0值大于50的天數(shù)為SKIPIF1<0,求SKIPIF1<0的分布列與數(shù)學期望.參考數(shù)據(jù):SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<03.5063.673.4917.509.4912.95519.014023.87其中SKIPIF1<0.參考公式:用最小二乘法求經(jīng)過點SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,…,SKIPIF1<0的線性回歸方程SKIPIF1<0的系數(shù)公式,SKIPIF1<0,SKIPIF1<0.同類題型歸類練1.(2022·江蘇泰州·高二期末)2022年初某公司研發(fā)一種新產品并投入市場,開始銷量較少,經(jīng)推廣,銷量逐月增加,下表為2022年1月份到7月份,銷量y(單位:百件)與月份x之間的關系.月份x1234567銷量y611213466101196(1)根據(jù)散點圖判斷SKIPIF1<0與SKIPIF1<0(c,d均為大于零的常數(shù))哪一個適合作為銷量y與月份x的回歸方程類型(給出判斷即可,不必說明理由)?(2)根據(jù)(1)的判斷結果及表中的數(shù)據(jù),求y關于x的回歸方程,并預測2022年8月份的銷量;(3)考慮銷量?產品更新及價格逐漸下降等因素,預測從2022年1月份到12月份(x的取值依次記作1到12),每百件該產品的利潤為SKIPIF1<0元,求2022年幾月份該產品的利潤Q最大.參考數(shù)據(jù):SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<062.141.54253550.123.47其中SKIPIF1<0,SKIPIF1<0.參考公式:對于一組數(shù)據(jù)SKIPIF1<0,其回歸直線SKIPIF1<0的斜率和截距的最小二乘估計公式分別為:SKIPIF1<0,SKIPIF1<0.2.(2022·河南·新蔡縣第一高級中學高二階段練習(文))為了幫助移民人口盡快脫貧,黨中央作出對口扶貧的戰(zhàn)略部署,在對口扶貧政策的幫扶下,某移民村莊100位移民近5年以來的人均年收入統(tǒng)計如下表:年份20162017201820192020年份代碼SKIPIF1<012345人均年收入SKIPIF1<0(千元)1.32.85.78.913.8現(xiàn)要建立SKIPIF1<0關于SKIPIF1<0的回歸方程,有兩個不同回歸模型可以選擇,模型一:SKIPIF1<0,模型二:SKIPIF1<0.現(xiàn)用最小二乘法原理,已經(jīng)求得模型一的方程為SKIPIF1<0.(1)用最小二乘法原理,結合下面的參考數(shù)據(jù)及參考公式求出模型二的方程(結果最后保留到小數(shù)點后一位);(2)若畫出SKIPIF1<0關于SKIPIF1<0的散點圖,無法確定上述哪個模型擬合效果更好,現(xiàn)計算出模型一的殘差平方和為SKIPIF1<0,請計算模型二的殘差平方和,并用它來判斷哪個模型擬合效果更好.附:參考數(shù)據(jù):SKIPIF1<0,其中SKIPIF1<0,SKIPIF1<0.參考公式:對于一組數(shù)據(jù)SKIPIF1<0,其回歸直線SKIPIF1<0的斜率和截距的最小二乘法估計公式分別為SKIPIF1<0,SKIPIF1<0.角度3:相關系數(shù)SKIPIF1<0典型例題例題1.(2022·福建省福安市第一中學高三階段練習)根據(jù)統(tǒng)計,某蔬菜畝產量的增加量SKIPIF1<0(百千克)與某種液體肥料每畝使用量SKIPIF1<0(千克)之間對應數(shù)據(jù)的散點圖如圖所示.(1)請從相關系數(shù)SKIPIF1<0(精確到SKIPIF1<0);(2)建立SKIPIF1<0關于SKIPIF1<0的線性回歸方程,并用其估計當該種液體肥料每畝使用量為SKIPIF1<0千克時,該蔬菜畝產量的增加量約為多少百千克?參考公式:對于一組數(shù)據(jù)SKIPIF1<0,相關系數(shù)SKIPIF1<0,其回歸直線SKIPIF1<0中,SKIPIF1<0,SKIPIF1<0,參考數(shù)據(jù):SKIPIF1<0,SKIPIF1<0.例題2.(2022·陜西渭南·高二期末(文))近年來,隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)約車服務在我國各城市迅猛發(fā)展,為人們出行提供了便利,但也給城市交通管理帶來了一些困難.為了解網(wǎng)約車在某省的發(fā)展情況,調查機構從該省抽取了5個城市,分別收集和分析了網(wǎng)約車的SKIPIF1<0兩項指標數(shù)SKIPIF1<0,數(shù)據(jù)如下表所示:城市1城市2城市3城市4城市5SKIPIF1<0指標數(shù)SKIPIF1<035679SKIPIF1<0指標數(shù)SKIPIF1<056789(1)由表中數(shù)據(jù)可知,SKIPIF1<0與SKIPIF1<0具有較強的線性相關關系,請利用相關系數(shù)SKIPIF1<0加以說明;(精確到0.01)(2)建立SKIPIF1<0關于SKIPIF1<0的線性回歸方程,并預測當SKIPIF1<0指標數(shù)為8時,SKIPIF1<0指標數(shù)的估計值.相關系數(shù)SKIPIF1<0參考值:當SKIPIF1<0時,線性相關程度一般;當SKIPIF1<0時,線性相關程度較高.參考公式:SKIPIF1<0,線性回歸方程SKIPIF1<0的斜率和截距的最小二乘法估計分別為SKIPIF1<0,SKIPIF1<0.參考數(shù)據(jù):SKIPIF1<0,SKIPIF1<0.例題3.(2022·江西·高三階段練習(文))北京時間2022年4月5日,CBA官方公布了2021—2022賽季CBA季后賽1/4決賽賽程表.賽程表顯示,1/4決賽將在4月7日(周四)15:00打響,首場比賽是上半?yún)^(qū)的遼寧本鋼迎戰(zhàn)山西汾酒股份.其中遼寧隊當家球星郭艾倫信心滿滿,球迷們終于可以一飽眼福.為了更好地預測球員郭艾倫在首戰(zhàn)中的發(fā)揮情況,球迷們收集了郭艾倫賽前的一場比賽的數(shù)據(jù)如表所示.上場時間SKIPIF1<0(分鐘)61118243235累計得分SKIPIF1<0分)51216223140由上表數(shù)據(jù)可知,可用線性回歸模型擬合SKIPIF1<0與SKIPIF1<0的關系.(1)請用相關系數(shù)說明SKIPIF1<0與SKIPIF1<0具有很強的線性相關關系;(精確到0.01)(2)求出SKIPIF1<0關于SKIPIF1<0的線性回歸方程,并預測球員郭艾倫在首戰(zhàn)中出場時間40分鐘的累計得分.(回歸方程的斜率與縱截距精確到0.1,累計得分保留整數(shù))附:相關系數(shù)SKIPIF1<0線性回歸方程SKIPIF1<0的斜率與截距的最小二乘法公式分別為SKIPIF1<0,SKIPIF1<0.參考數(shù)據(jù):SKIPIF1<0,SKIPIF1<0.同類題型歸類練1.(2022·陜西西安·高二期末(文))近年來,隨著物質生活水平的提高以及中國社會人口老齡化加速,家政服務市場規(guī)模逐年增長,2017~2021年中國家政市場規(guī)模數(shù)據(jù)(單位:百億元)如下表:年份20172018201920202021年份代碼x12345市場規(guī)模y(百億元)3544587088(1)計算變量x,y的相關系數(shù)r;(結果精確到0.01)(2)求變量x,y之間的線性回歸方程,并據(jù)此預測2025年中國家政市場規(guī)模有多少億元?參考數(shù)據(jù):SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0.參考公式:相關系數(shù)SKIPIF1<0,線性回歸方程的斜率SKIPIF1<0,截距SKIPIF1<0.2.(2022·福建省福州第一中學高二期末)在對10個同類工場的研究后,某工場獲得投入與純利潤的簡單隨機樣本數(shù)據(jù)SKIPIF1<0(SKIPIF1<0,2,…,10),x,y,分別表示第i個工場的投入(單位:萬元)和純利潤(單位:萬元).第i個工場12345678910投入SKIPIF1<0/萬元32313336373839434546純利潤SKIPIF1<0/萬元25303437394142444850參考數(shù)據(jù):SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0.(1)請用相關系數(shù)說明該組數(shù)據(jù)中y與x之間的線性相關程度;(2)求y關于x的經(jīng)驗回歸方程(精確到0.01);(3)現(xiàn)有甲、乙兩種大型機器供工場選擇,甲型機器價位是60萬元,乙型機器價位是50萬元,下表是甲、乙兩種大型機器各30臺的使用年限(整年)統(tǒng)計表:1年2年3年4年合計甲型/臺3129630乙型/臺6129330據(jù)以往經(jīng)驗可知,每年使用任一型號都可獲利潤30萬元,若僅考慮購置成本和每臺機器的使用年限(使用年限均為整年),以頻率估計概率,該工場選擇買哪一款型號機器更劃算?參考公式:相關系數(shù)SKIPIF1<0,對于一組具有線性相關關系的數(shù)據(jù)SKIPIF1<0(SKIPIF1<0,2,…,n),其回歸直線SKIPIF1<0的斜率和截距的最小二乘估計公式分別為SKIPIF1<0,SKIPIF1<0.3.(2022·山東棗莊·高二期末)某公司對其產品研發(fā)的年投資額x(單位:百萬元)與其年銷售量y(單位:千件)的數(shù)據(jù)進行統(tǒng)計,整理后得到如下統(tǒng)計表:x12345y1.523.5815(1)求變量x和y的樣本相關系數(shù)r(精確到0.01),并推斷變量x和y的線性相關程度(參考:若SKIPIF1<0,則線性相關程度很強;若SKIPIF1<0,則線性相關程度一般;如果SKIPIF1<0,則線性相關程度較弱);(2)求年銷售量y關于年投資額x的線性回歸方程;(3)當公司對其產品研發(fā)的年投資額為600萬元時,估計產品的年銷售量.參考公式:對于變量x和變量y,設經(jīng)過隨機抽樣獲得的成對樣本數(shù)據(jù)為SKIPIF1<0,SKIPIF1<0,…,SKIPIF1<0,其中SKIPIF1<0,SKIPIF1<0,…,SKIPIF1<0和SKIPIF1<0,SKIPIF1<0,…,SKIPIF1<0的均值分別為SKIPIF1<0和SKIPIF1<0;稱SKIPIF1<0為變量x和y的樣本相關系數(shù);線性回歸方程SKIPIF1<0中,SKIPIF1<0,SKIPIF1<0;參考數(shù)據(jù):SKIPIF1<0.角度4:殘差分析典型例題例題1.(2022·四川眉山·高二期末(文))某種農作物可以生長在灘涂和鹽堿地,它的灌溉方式是將海水稀釋后進行灌溉.某實驗基地為了研究海水濃度SKIPIF1<0(%)對畝產量SKIPIF1<0(t)的影響,通過在試驗田的種植實驗,測得了該農作物的畝產量與海水濃度的數(shù)據(jù)如下表海水濃度SKIPIF1<0(%)34567畝產量SKIPIF1<0(t)0.560.520.460.350.31殘差SKIPIF1<0SKIPIF1<00.01SKIPIF1<0SKIPIF1<00.01繪制散點圖發(fā)現(xiàn),可以用線性回歸模型擬合畝產量SKIPIF1<0(t)與海水濃度SKIPIF1<0(%)之間的相關關系,用最小二乘法計算得SKIPIF1<0與SKIPIF1<0之間的線性回歸方程為SKIPIF1<0(1)求SKIPIF1<0,SKIPIF1<0,SKIPIF1<0的值;(2)統(tǒng)計學中常用相關指數(shù)SKIPIF1<0來刻畫回歸效果,SKIPIF1<0越大,回歸效果越好,如假設SKIPIF1<0,就說明預報變量SKIPIF1<0的差異有85%是解釋變量SKIPIF1<0引起的.請計算相關指數(shù)SKIPIF1<0(精確到0.01),并指出畝產量的變化多大程度上是由澆灌海水濃度引起的?附:殘差SKIPIF1<0,相關指數(shù)SKIPIF1<0,其中SKIPIF1<0例題2.(2022·黑龍江·哈九中模擬預測(文))醫(yī)學中判斷男生的體重是否超標有一種簡易方法,就是用一個人身高的厘米數(shù)減去105所得差值即為該人的標準體重.比如身高175cm的人,其標準體重為SKIPIF1<0公斤,一個人實際體重超過了標準體重,我們就說該人體重超標了.已知某班共有30名男生,從這30名男生中隨機選取6名,其身高和體重的數(shù)據(jù)如表所示:編號123456身高(cm)SKIPIF1<0165171160173178167體重(kg)SKIPIF1<0606362707158(1)從編號為1,2,3,4,5的這5人中任選2人,求恰有1人體重超標的概率;(2)依據(jù)上述表格信息,用最小二乘法求出了體重y對身高x的線性回歸方程SKIPIF1<0,但在用回歸方程預報其他同學的體重時,預報值與實際值吻合不好,需要對上述數(shù)據(jù)進行殘差分析.按經(jīng)驗,對殘差在區(qū)間SKIPIF1<0之外的同學要重新采集數(shù)據(jù).問上述隨機抽取的編號為3,4,5,6的四人中,有哪幾位同學要重新采集數(shù)據(jù)?同類題型歸類練1.(2021·全國·高二課時練習)為研究質量x(單位:g)對彈簧長度y(單位:cm)的影響,對不同質量的6個物體進行測量,數(shù)據(jù)如下表:x51015202530y7.258.128.959.9010.911.8(1)作出散點圖并求回歸直線方程;(2)求出R2并說明回歸模型擬合的程度;(3)進行殘差分析.2.(2022·福建省泉州市培元中學高二期中)為了提高智慧城市水平,某市公交公司推出支付寶和微信掃碼支付乘車活動,活動設置了一段時間的推廣期,由于推廣期內優(yōu)惠力度較大,吸引越來越多的人開始使用掃碼支付.某線路公交車隊統(tǒng)計了活動剛推出一周內每一天使用掃碼支付的人次,x表示活動推出的天數(shù),y表示每天使用掃碼支付的人次(單位:十人次),統(tǒng)計數(shù)據(jù)如表下所示:x1234567y611213466101196同學甲選擇指數(shù)型函數(shù)模型SKIPIF1<0(c,d均為大于零的常數(shù))來建立經(jīng)驗回歸方程,據(jù)此,他對數(shù)據(jù)進行了一些初步處理,如下表:其中SKIPIF1<0,SKIPIF1<0,SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<062.141.54140253550.12276943.47(1)根據(jù)表中相關數(shù)據(jù),利用同學甲的模型建立y關于x的經(jīng)驗回歸方程;(2)若同學甲求得其非線性經(jīng)驗回歸方程的殘差平方和為SKIPIF1<0;同學乙選擇線性回歸模型SKIPIF1<0,并計算得經(jīng)驗回歸方程為SKIPIF1<0,以及該回歸模型的決定系數(shù)SKIPIF1<0;①用決定系數(shù)SKIPIF1<0比較甲乙兩人所建立的模型,誰的擬合效果更好?②用你認為擬合效果較好的模型預測活動推出第8天使用掃碼支付的人次;參考公式:對于一組數(shù)據(jù)SKIPIF1<0,SKIPIF1<0,…,SKIPIF1<0,其回歸直線SKIPIF1<0的斜率和截距的最小二乘估計公式分別為:SKIPIF1<0,SKIPIF1<0.決定系數(shù):SKIPIF1<0題型三:列聯(lián)表與獨立性檢驗典型例題例題1.(2021·山東·臨沂市蘭山區(qū)教學研究室高三開學考試)某公司推出了一款針對中學生的智能學習軟件,為了解學生對該學習軟件的滿意程度,隨機抽取了正在使用軟件的200名學生(男生與女生的人數(shù)均為100)對學習軟件進行評價打分,若評分不低于80分視為滿意.其得分情況的頻率分布直方圖如圖所示,若根據(jù)頻率分布直方圖得到的評分低于70分的頻率為0.15.(1)求a,b的值,并估計這200名學生對該學習軟件評分的平均值與中位數(shù);(2)結合頻率分布直方圖,完成以下列聯(lián)表,并根據(jù)小概率值SKIPIF1<0的獨立性檢驗,判斷“對該學習軟件滿意是否與性別有關”.態(tài)度
性別滿意不滿意合計男生40女生合計附:隨機變量SKIPIF1<0.SKIPIF1<00.250.150.100.050.0250.010.0050.001SKIPIF1<01.3232.0722.7063.8415.0246.6357.87910.828例題2.(2022·重慶·高二階段練習)第24屆冬季奧林匹克運動會(SKIPIF1<0),即2022年北京冬季奧運會,是由中國舉辦的國際性奧林匹克賽事,于2022年2月4日開幕,2月20日閉幕.2022年北京冬季奧運會共設7個大項,15個分項,109個小項.北京賽區(qū)承辦所有的冰上項目,延慶賽區(qū)承辦雪車?雪橇及高山滑雪項目,張家口賽區(qū)承辦除雪車?雪橇?高山滑雪之外的所有雪上項目.為調查學生對冬季奧運會項目的了解情況,某中學進行了一次抽樣調查,統(tǒng)計得到以下SKIPIF1<0列聯(lián)表.了解SKIPIF1<0不了解SKIPIF1<0合計男生SKIPIF1<060200女生SKIPIF1<0110200合計(1)先完成SKIPIF1<0列聯(lián)表,并依據(jù)SKIPIF1<0的獨立性檢驗,分析該校學生對冬季奧運會項目了解情況與性別是否有關;(2)①為弄清學生不了解冬季奧運會項目的原因,按照性別采用分層抽樣的方法,從樣本中不了解冬季奧運會項目的學生中隨機抽取5人,再從這5人中抽取3人進行面對面交流,求“男?女生至少各抽到一名”的概率;②用樣本估計總體,若再從該校全體學生中隨機抽取40人,記其中對冬季奧運會項目了解的人數(shù)為SKIPIF1<0,求SKIPIF1<0的數(shù)學期望.SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0附表:附:SKIPIF1<0例題3.(2022·全國·高二單元測試)盲盒里面通常裝的是動漫、影視作品的周邊,或者設計師單獨設計出來的玩偶.由于盒子上沒有標注,購買者只有打開后才會知道自己買到了什么,因此這種驚喜吸引了眾多年輕人,形成了“盲盒經(jīng)濟”.某款盲盒內可能裝有某一套玩偶的SKIPIF1<0,SKIPIF1<0,SKIPIF1<0三種樣式,且每個盲盒只裝一個.(1)某銷售網(wǎng)點為調查該款盲盒的受歡迎程度,隨機發(fā)放了200份問卷,并全部收回.經(jīng)統(tǒng)計,有30%的人購買了該款盲盒,在這些購買者當中,女生占SKIPIF1<0;而在未購買者當中,男生、女生各占50%.請根據(jù)以上信息填寫下表,并分析是否有95%的把握認為購買該款盲盒與性別有關.女生男生總計購買未購買總計參考公式:SKIPIF1<0,其中SKIPIF1<0.參考數(shù)據(jù):SKIPIF1<00.100.050.0250.0100.0050.001SKIPIF1<02.7063.8415.0246.6357.87910.828(2)該銷售網(wǎng)點已經(jīng)售賣該款盲盒6周,并記錄了銷售情況,如下表:周數(shù)x123456盒數(shù)y16______23252630由于電腦故障,第二周數(shù)據(jù)現(xiàn)已丟失,該銷售網(wǎng)點負責人決定用第4,5,6周的數(shù)據(jù)求線性回歸方程,再用第1,3周數(shù)據(jù)進行檢驗.①若由線性回歸方程得到的估計數(shù)據(jù)與所選出的檢驗數(shù)據(jù)的誤差均不超過2盒,則認為得到的線性回歸方程是可靠的.請用4,5,6周的數(shù)據(jù)求出y關于x的線性回歸方程SKIPIF1<0,并說明所得的線性回歸方程是否可靠.(參考公式:SKIPIF1<0,SKIPIF1<0)②如果通過①的檢驗得到的線性回歸方程可靠,我們可以認為第2周賣出的盒數(shù)誤差也不超過2盒,請你求出第2周賣出的盒數(shù)的可能取值;如果不可靠,請你設計一個估計第2周賣出的盒數(shù)的方案.同類題型歸類練1.(2022·貴州·貴陽市白云區(qū)第二高級中學高二期末(理))某校設置了籃球挑戰(zhàn)項目,現(xiàn)在從本校學生中隨機抽取了60名男生和40名女生共100人進行調查,統(tǒng)計出愿意接受挑戰(zhàn)和不愿意接受挑戰(zhàn)的男女生比例情況,具體數(shù)據(jù)如圖表:(1)根據(jù)條件完成下列SKIPIF1<0列聯(lián)表:愿意不愿意總計男生女生總計(2)判斷是否在犯錯誤的概率不超過1%的情況下愿意接受挑戰(zhàn)與性別有關;(3)挑戰(zhàn)項目共有兩關,規(guī)定:挑戰(zhàn)過程依次進行,每一關都有兩次機會挑戰(zhàn),通過第一關后才有資格參與第二關的挑戰(zhàn),若甲參加每一關的每一次挑戰(zhàn)通過的概率均為0.5,記甲通過的關數(shù)為
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 玻璃回收利用考核試卷
- 管道工程質量管理標準制定考核試卷
- 機器人視覺引導的精密裝配技術考核試卷
- 纖維原料的制備和性能調控植物纖維材料考核試卷
- 機器人智能算法研究考核試卷
- 竹漿在紙品透氣性與防水性平衡技術研究考核試卷
- 機動車燃油價格波動與預測考核試卷
- 畜牧業(yè)與糧食生產的發(fā)展策略考核試卷
- 核電站運行中的核燃料管理安全考核試卷
- 社區(qū)居民自治組織建設考核試卷
- (全)美容師(技師)作業(yè)模擬考試題庫附答案(內部題庫2024版)
- 讓時間陪你慢慢變富
- 變電站(發(fā)電廠)第一、二種工作票格式樣本
- 生物化學第三版課后習題答案
- 新工科背景下無機化學教學法改革研究獲獎科研報告
- 中國戲劇史導論
- 8.6《林黛玉進賈府》課本劇劇本
- LY/T 2005-2012國家級森林公園總體規(guī)劃規(guī)范
- GB/T 5413.27-1997嬰幼兒配方食品和乳粉DHA、EPA的測定
- 泌尿系統(tǒng)中藥方
- GB/T 13290-2014工業(yè)用丙烯和丁二烯液態(tài)采樣法
評論
0/150
提交評論