第八章成對數(shù)據(jù)的統(tǒng)計(jì)分析學(xué)案-高二下學(xué)期數(shù)學(xué)人教A版選擇性_第1頁
第八章成對數(shù)據(jù)的統(tǒng)計(jì)分析學(xué)案-高二下學(xué)期數(shù)學(xué)人教A版選擇性_第2頁
第八章成對數(shù)據(jù)的統(tǒng)計(jì)分析學(xué)案-高二下學(xué)期數(shù)學(xué)人教A版選擇性_第3頁
第八章成對數(shù)據(jù)的統(tǒng)計(jì)分析學(xué)案-高二下學(xué)期數(shù)學(xué)人教A版選擇性_第4頁
第八章成對數(shù)據(jù)的統(tǒng)計(jì)分析學(xué)案-高二下學(xué)期數(shù)學(xué)人教A版選擇性_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

成對數(shù)據(jù)的統(tǒng)計(jì)分析一、知識點(diǎn)正相關(guān)、負(fù)相關(guān):當(dāng)一個變量增加時,另一個變量.線性相關(guān):兩變量取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),且散點(diǎn)落在附近,稱兩變量為線性相關(guān);非線性相關(guān):兩變量具有相關(guān)性,但不是線性相關(guān),稱兩變量為非線性相關(guān)或曲線相關(guān);樣本相關(guān)系數(shù)=..當(dāng)r>0,稱成對樣本數(shù)據(jù)相關(guān);當(dāng)r<0,稱成對樣本數(shù)據(jù)相關(guān);當(dāng)|r|越接近1,表明對樣本數(shù)據(jù)的相關(guān)程度越;當(dāng)|r|越接近0,表明對樣本數(shù)據(jù)的相關(guān)程度越;當(dāng)|r|=1,表明對樣本數(shù)據(jù);當(dāng)|r|=0,表明對樣本數(shù)據(jù)間沒有相關(guān)關(guān)系,但它們之間可能有其他相關(guān)關(guān)系.一元線性回歸模型:,其中Y稱為或,x稱為或;a,b為模型未知參數(shù),a稱為,b稱為;經(jīng)驗(yàn)回歸方程,其中,,方法稱為最小二乘法,叫a,b的最小二乘估計(jì).性質(zhì):(1)經(jīng)驗(yàn)回歸方程一定過樣本中心點(diǎn).y與x正相關(guān)0;y與x負(fù)相關(guān)0;的實(shí)際意義:當(dāng)x增大一個單位時,.判斷模型擬合效果:殘差平方和(殘差=減去,殘差是隨機(jī)誤差的估計(jì)結(jié)果);決定系數(shù)越大,表示殘差平方和越,模型的擬合效果越;越小,表示殘差平方和越,模型的擬合效果越;(3)殘差圖:軸表示殘差,殘差點(diǎn)比較均勻地分布在軸的兩側(cè),且殘差點(diǎn)均勻分布的帶狀區(qū)域的寬度越窄,說明模型擬合精度越.分類變量:用來區(qū)分不同的現(xiàn)象或性質(zhì)的一類特殊的隨機(jī)變量.例如:性別,國籍,吸煙情況(注意“吸煙”不是分類變量)兩分類變量的關(guān)聯(lián)性判斷:(1)2×2列聯(lián)表:兩變量無關(guān)聯(lián)P(Y=1|X=0)=P(Y=1|X=1);等高堆積條形圖:比2×2列聯(lián)表更直觀,直接觀察P(Y=1|X=0)與P(Y=1|X=1)相差很大,則可粗略判斷出兩分類變量之間有關(guān);獨(dú)立性檢驗(yàn):依賴于小概率原理,通過計(jì)算的取值判斷X和Y是否獨(dú)立.(不同于反證法)計(jì)算公式:小概率值的檢驗(yàn)規(guī)則:(越大,關(guān)聯(lián)性越,越不獨(dú)立)當(dāng),推斷,即認(rèn)為X和Y,該推斷犯錯誤概率不超過;當(dāng),沒有充分證據(jù)推斷,即認(rèn)為X和Y.應(yīng)用獨(dú)立性檢驗(yàn)解決實(shí)際問題包括的主要環(huán)節(jié):①提出零假設(shè):X和Y相互獨(dú)立,并給出在問題中的解釋;②根據(jù)抽樣數(shù)據(jù)整理出2x2列聯(lián)表,計(jì)算的值,并與臨界值比較.③根據(jù)檢驗(yàn)規(guī)則得出推斷結(jié)論.④在X和Y不獨(dú)立的情況下,根據(jù)需要,通過比較相應(yīng)的頻率,分析X和Y間的影響規(guī)律.練習(xí)題1.已知成對的樣本數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn)(n≥2)中,x1,x2,…,xn不全相等,且所有樣本點(diǎn)(xi,yi)(i=1,2,…,n)都在直線y=?2x+1上,則這組成對樣本數(shù)據(jù)的樣本相關(guān)系數(shù)r=.2.對四組數(shù)據(jù)進(jìn)行統(tǒng)計(jì),獲得如圖所示的散點(diǎn)圖,從左至右相關(guān)系數(shù)分別為r1,r2,r3,r4,下列對于它們的比較,正確的是()A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r33.以下四個命題,其中正確的個數(shù)有()①由獨(dú)立性檢驗(yàn)可知,有99%的把握認(rèn)為物理成績與數(shù)學(xué)成績有關(guān),某人數(shù)學(xué)成績優(yōu)秀,則他有99%的可能物理優(yōu)秀;②兩個隨機(jī)變量線性相關(guān)性越強(qiáng),則相關(guān)系數(shù)的絕對值越接近于1;③在經(jīng)驗(yàn)回歸方程y=0.2x+12中,當(dāng)解釋變量x每增加一個單位時,預(yù)報(bào)變量平均增加0.2個單位;④對分類變量X與Y,它們的隨機(jī)變量的觀測值k來說,k越小,"X與Y有關(guān)系"的把握程度越大.A.1B.2C.3D.4某企業(yè)為了研究某種產(chǎn)品的銷售價格(元)與銷售量(千件)之間的關(guān)系,通過大量市場調(diào)研收集得到以下數(shù)據(jù):其中某一項(xiàng)數(shù)據(jù)丟失,只記得這組數(shù)據(jù)擬合出的線性回歸方程為:,則缺失的數(shù)據(jù)a是()A.B.C.D.已知變量x與y,且觀測數(shù)據(jù)如下表,(其中6.5>a>4>b>1,a+b=6),則由觀測數(shù)據(jù)算得的經(jīng)驗(yàn)回歸方程可能是()x12345y6.5a4b1A.B.C.D.6."微信"和"QQ"是兩款社交產(chǎn)品,小明為了解不同群體對這兩款產(chǎn)品的首選情況,統(tǒng)計(jì)了周圍老師和同學(xué)關(guān)于首選"微信"或"QQ"的比例,得到如圖所示的等高堆積條形圖,根據(jù)等高堆積條形圖中的信息,可判斷下列說法正確的是()A.對老師而言,更傾向于首選"微信"B.對學(xué)生而言,更傾向于首選"QQ"C.首選"微信"的老師比首選"微信"的學(xué)生多D.如果首選"微信"的老師比首選"微信"的學(xué)生多,那么小明統(tǒng)計(jì)的老師人數(shù)一定比學(xué)生多7.黨的十九大報(bào)告中指出:從2020年到2035年,在全面建成小康社會的基礎(chǔ)上,再奮斗15年,基本實(shí)現(xiàn)社會主義現(xiàn)代化.若到2035年年底我國人口數(shù)量增長至14.4億,由2013年到2019年的統(tǒng)計(jì)數(shù)據(jù)可得國內(nèi)生產(chǎn)總值(GDP)y(單位:萬億元)關(guān)于年份代號x的經(jīng)驗(yàn)回歸方程為=6.06x+50.36(x=1,2,3,4,5,6,7),由經(jīng)驗(yàn)回歸方程預(yù)測我國在2035年年底人均國內(nèi)生產(chǎn)總值(單位:萬元)約為()A.13.18B.202.16C.13.58D.14.50關(guān)于x與y有以下數(shù)據(jù):x24568y3040605070已知x與y線性相關(guān),由最小二乘法得=6.5,(1)求y與x的經(jīng)驗(yàn)回歸方程.(2)現(xiàn)有第二個線性模型:=7x+17,且R2=0.82.若與(1)的線性模型比較,哪一個線性模型擬合效果比較好?請說明理由.棉鈴蟲是棉花的主要害蟲之一,其產(chǎn)卵數(shù)與溫度有關(guān)現(xiàn)收集到一只棉鈴蟲的產(chǎn)卵數(shù)y(單位:個)和溫度x(單位:℃)的的8組觀測數(shù)據(jù),制成圖(1)所示的散點(diǎn)圖.現(xiàn)用兩種模型①②分別進(jìn)行行擬合,由此得到相應(yīng)的回歸方程并進(jìn)行殘差分析,進(jìn)一步得到圖(2)所示的殘差圖.根據(jù)收集集到的數(shù)據(jù),計(jì)算得到下表的值.(2)252.8964616842268848.4870308表中,,,.(1)根據(jù)殘差圖判斷哪個模型擬合較好并說明理由.(2)根據(jù)(1)中所選擇的模型,求出y關(guān)于x的經(jīng)驗(yàn)回歸方程(計(jì)算過程中四舍五入保留兩位小數(shù)),并求溫度為35℃時,產(chǎn)卵數(shù)y的預(yù)報(bào)值.參考數(shù)據(jù):某學(xué)校共有名學(xué)生參加知識競賽,其中男生人,為了解該校學(xué)生在知識競賽中的情況,采取分層抽樣隨機(jī)抽取了名學(xué)生進(jìn)行調(diào)查,分?jǐn)?shù)分布在分之間,根據(jù)調(diào)查的結(jié)果繪制的學(xué)生分?jǐn)?shù)頻率分布直方圖如圖所示,將分?jǐn)?shù)不低于分的學(xué)生稱為“高分選手”.(1)求的值,并估計(jì)該校學(xué)生分?jǐn)?shù)的平均

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論