




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第一節(jié)隨機抽樣、用樣本估計總體
?最新考綱?
1.理解隨機抽樣的必要性和重要性.
2.會用簡單隨機抽樣方法從總體中抽取樣本;了解分層抽樣和系統抽樣的方法.
3.了解分布的意義和作用,能根據頻率分布表畫頻率分布直方圖、頻率折線圖、莖葉圖,
體會它們各自的特點.
4.理解樣本數據標準差的意義和作用,會計算數據標準差.
5.能從樣本數據中提取基本的數字特征(如平均數、標準差),并做出合理的解釋.
6.會用樣本的頻率分布估計總體分布,會用樣本的基本數字特征估計總體的基本數字特
征,理解用樣本估計總體的思想.
7.會用隨機抽樣的基本方法和樣本估計總體的思想解決一些簡單的實際問題.
?考向預測?
考情分析:簡單隨機抽樣、系統抽樣、分層抽樣在高考中極少單獨考查,有時與概率問
題相結合出現在題目的已知條件中;頻率分布直方圖、莖葉圖等統計圖表屬于高考的??純?/p>
容,題型多為選擇題,有時也與概率相結合出現在解答題中.
學科素養(yǎng):通過隨機抽樣、統計圖表、數字特征考查數據分析、數學運算的核心素養(yǎng).
積累必備知識——基礎落實贏得良好開端
一、必記5個知識點
1.簡單隨機抽樣
(1)抽取方式:逐個不放回地抽取.
(2)特點:每個個體被抽到的概率相等.
(3)常用方法:抽簽法和隨機數法.
2.分層抽樣
(1)在抽樣時,將總體分成互不交叉的層,然后按照一定的比例,從各層獨立地抽取一定
數量的個體,將各層取出的個體合在一起作為樣本,這種抽樣方法叫做分層抽樣.
(2)分層抽樣的應用范圍
當總體是由差異明顯的幾個部分組成時,往往選用分層抽樣.
3.作頻率分布直方圖的步驟
(1)求極差(即一組數據中最大值與最小值的差);
(2)決定組距與組數;
(3)將數據分組;
(4)列頻率分布表;
(5)畫頻率分布直方圖.
4.頻率分布折線圖和總體密度曲線
(1)頻率分布折線圖:連接頻率分布直方圖中各小長方形上端的中點,就得到頻率分布折
線圖.
(2)總體密度曲線:隨著樣本容量的增加,作圖時所分的組數增加,組距減小,相應的頻
率折線圖會越來越接近于一條光滑曲線,統計中稱這條光滑曲線為總體密度曲線.
5.樣本的數字特征
(1)眾數:一組數據中出現次數最多的那個數據,叫做這組數據的眾數.
(2)中位數:把〃個數據按大小順序排列,處于最中間位置的一個數據(或最中間兩個數據
的平均數)叫做這組數據的中位數.
(3)平均數:把a,+a,+an稱為0,及,…,α“這〃個數的平均數.
(4)標準差與方差:設一組數據Xi,X2,X3,…,X”的平均數為處則這組數據的標準差和
方差分別是
S=Jl[Gl一幻2+(X2—天)2+…+(Xn—又)2],
52=?[(??—X)2+(X2-X)2H-----F(X,,—X)2].
二、必明2個常用結論
I.必記結論
(1)眾數的估計值是最高矩形底邊中點的橫坐標.
(2)平均數的估計值等于頻率分布直方圖中每個小矩形的面積乘以小矩形底邊中點的橫
坐標之和.
(3)中位數的估計值的左邊和右邊小矩形的面積和是相等的.
2.常用公式
⑴若數據Xi,X2)…,X"的平均數是處則mxι+α,mx2^?-a,???,nzx”+a的平均數是加+
a.
(2)若數據乃,X2,???,X”的方差為據,則“x∣+b,axz+b,???,Or“+6的方差為i?2,
標準差為as.
三、必練4類基礎題
(一)判斷正誤
1.判斷下列說法是否正確(請在括號中打“或"X”).
(1)簡單隨機抽樣是一種不放回抽樣.()
(2)在抽簽法中,先抽的人抽中的可能性較大.()
(3)一組數據的方差越大,說明這組數據的波動越大.()
(4)在頻率分布直方圖中,小矩形的面積越大,表示樣本數據落在該區(qū)間內的頻率越
大.()
(5)頻率分布表和頻率分布直方圖是一組數據頻率分布的兩種形式,前者準確,后者直
觀.()
(6)在頻率分布直方圖中,最高的小長方形底邊中點的橫坐標是眾數的估計值.()
(二)教材改編
2.[選修3?P64習題T5改編]某公司有員工500人,其中不到35歲的有125人,35?49
歲的有280人,50歲及50歲以上的有95人,為了調查員工的身體健康狀況,從中抽取IOO
名員工,則應在這三個年齡段分別抽取人數為()
A.33,34,33B.25,56,19
C.20,40,30D.30,50,20
3.[必修3?P7∣練習Tl改編]如圖所示是一樣本的頻率分布直方圖.若樣本容量為100,
則樣本數據在[15,20]內的頻數是.
(三)易錯易混
4.(忽視系統抽樣中可以先剔除部分個體)某學校為了解高一年級1203名學生對某項教
改試驗的意見,打算從中抽取一個容量為40的樣本,若采用系統抽樣,則分段間隔為
5.(方差的性質不熟致誤)若數據為,X2,X3,…,X”的平均數又=5,方差s2=2,則數據
3x1+l,3x2+1,3冷+1,…,3x,,+l的平均數和方差分別為.
(四)走進高考
6.[2021?全國甲卷]為了解某地農村經濟情況,對該地農戶家庭年收入進行抽樣調查,將
農戶家庭年收入的調查數據整理得到如下頻率分布直方圖:
根據此頻率分布直方圖,下面結論中不正確的是()
A.該地農戶家庭年收入低于4.5萬元的農戶比率估計為6%
B.該地農戶家庭年收入不低于10.5萬元的農戶比率估計為10%
C.估計該地農戶家庭年收入的平均值不超過6.5萬元
D.估計該地有一半以上的農戶,其家庭年收入介于4.5萬元至8.5萬元之間
提升關鍵能力——考點突破掌握類題通法
考點一抽樣方法[基礎性]
I.利用簡單隨機抽樣,從〃個個體中抽取一個容量為10的樣本.若第二次抽取時,余
下的每個個體被抽到的概率為則在整個抽樣過程中,每個個體被抽到的概率為()
10
A.-bC.?D.
4?I1427
2.[2022?漳州質檢]某公司決定利用隨機數表對今年新招聘的800名員工進行抽樣調查他
們對目前工作的滿意程度,先將這800名員工進行編號,編號分別為001,002,799,
800,從中抽取80名進行調查,下面提供隨機數表的第4行到第6行:
322118342978645407325242064438
12234356773578905642
844212533134578607362530073286
23457889072368960804
325678084367895355773489948375
22535578324377892345
若從表中第5行第6列開始向右依次讀取3個數據,則抽到的第5名員工的編號是()
A.007B.253C.328D.736
3.[2022?蚌埠模擬]某市小學,初中,高中在校學生人數分別為7.5萬,4.5萬,3萬.為
了調查全市中小學生的體質健康狀況,擬隨機抽取1OOO人進行體質健康檢測,則應抽取的
初中生人數為()
A.750B.500C.450D.300
反思感悟
1.應用隨機數法的兩個關鍵點
(1)確定以表中的哪個數(哪行哪列)為起點,以哪個方向為讀數的方向;
(2)讀數時注意結合編號特點進行讀取.若編號為兩位數字,則兩位兩位地讀?。喝艟幪?/p>
為三位數字,則三位三位地讀取,有超過總體號碼或出現重復號碼的數字舍去,這樣繼續(xù)下
去,直到獲取整個樣本.
2.解決分層抽樣的常用公式
先確定抽樣比,然后把各層個體數乘以抽樣比,即得各層要抽取的個體數.
(1)抽樣比=也出=各層樣本容量;
v7總體容量各層個體總量'
(2)層1的容量:層2的容量:層3的容量=樣本中層1的容量:樣本中層2的容量:樣
本中層3的容量.
考點二統計圖表及應用[基礎性、應用性、創(chuàng)新性]
角度1扇形圖
[例1][全國卷I]某地區(qū)經過一年的新農村建設,農村的經濟收入增加了一倍,實現翻
番.為更好地了解該地區(qū)農村的經濟收入變化情況,統計了該地區(qū)新農村建設前后農村的經
濟收入構成比例,得到如下餅狀圖:
/L`%區(qū)三產業(yè)收入
(其他收入
種植收入(≡彳Y
?30%/
\)7養(yǎng)殖收入
建設前經濟收入構成比例
K一、第三產業(yè)收入
種植收入(37^^^其他收入
養(yǎng)殖收入
建設后經濟收入構成比例
則下面結論中不正確的是()
A.新農村建設后,種植收入減少
B.新農村建設后,其他收入增加了一倍以上
C.新農村建設后,養(yǎng)殖收入增加了一倍
D.新農村建設后,養(yǎng)殖收入與第三產業(yè)收入的總和超過了經濟收入的一半
聽課筆記:
角度2折線圖
[例2]空氣質量指數AQl是反映空氣狀況的指數,AQl指數值越小,表明空氣質量越
好,其對應關系如下表:
AQI
0~5051~100101~150151~200201~300>300
指數
空氣
優(yōu)良輕度污染中度污染重度污染嚴重污染
質量
下圖是某市10月1日?20日AQl指數變化趨勢,則下列敘述不正確的是()
1234567891011121314151617181920
A.這20天中AQI指數值的中位數略高于100
B.這20天中的中度污染及以上的天數占;
C.該市10月的前半個月的空氣質量越來越好
D.總體來說,該市10月上旬的空氣質量比中旬的好
聽課筆記:
角度3莖葉圖
[例3]
甲組乙組
879
64883〃8
5m29225
[2022?廣東廣雅中學、江西南昌二中聯考]某市重點中學奧數培訓班共有14人,分為兩個
小組,在一次階段考試中兩個小組成績的莖葉圖如圖所示,其中甲組學生成績的平均數是88,
乙組學生成績的中位數是89,則團+〃的值是()
A.10B.IlC.12D.13
聽課筆記:
角度4頻率分布直方圖
[例4][2022?長沙市統一模擬考試]某學校對本校高三500名學生的視力進行了一次調
查,隨機抽取了100名學生的體檢表,得到的頻率分布直方圖如圖所示,若頻率分布直方圖
后四組的頻數成等差數列,則估計本校高三這500名學生中視力在4.8以上(含4.8)的人數為
()
A.185B.180
聽課筆記:
反思感悟(1)通過扇形統計圖可以很清楚地表示出各部分數量同總數之間的關系.
(2)折線圖可以顯示隨時間(根據常用比例放置)而變化的連續(xù)數據,因此非常適用于顯示
在相等時間間隔下數據的趨勢.
(3)由莖葉圖可以清晰地看到數據的分布情況,這一點同頻率分布直方圖類似.它優(yōu)于頻
率分布直方圖的第一點是從莖葉圖中能看到原始數據,沒有任何信息損失,第二點是莖葉圖
便于記錄和表示.其缺點是當樣本容量較大時,作圖較煩瑣.
(4)準確理解頻率分布直方圖的數據特點:
①頻率分布直方圖中縱軸上的數據是各組的頻率除以組距的結果,不要誤以為縱軸上的
數據是各組的頻率,不要和條形圖混淆.
②頻率分布直方圖中各小長方形的面積之和為1,這是解題的關鍵,常利用頻率分布直
方圖估計總體分布.
【對點訓練】
1.已知我市某居民小區(qū)戶主人數和戶主對戶型結構的滿意率分別如圖1和圖2所示,為
了解該小區(qū)戶主對戶型結構的滿意程度,用分層抽樣的方法抽取30%的戶主進行調查,則樣
本容量和抽取的戶主對四居室滿意的人數分別為()
滿意率/%
々居室/、
白主/四房\40........——
?√??30-----------
20-I-I
四
三
二
戶
三居室戶主型
居
居
400人居
室
室
室
圖2
圖1
A.240,18B.200,20
C.240,20D.200,18
2.[2022?德州模擬]港珠澳大橋于2018年10月2日正式通車,它是中國境內一座連接香
港、珠海和澳門的橋隧工程,橋隧全長55千米.橋面為雙向六車道高速公路,大橋通行限速
IOOkm∕h,現對大橋某路段上1OOO輛汽車的行駛速度進行抽樣調查.畫出頻率分布直方圖(如
圖),根據直方圖估計在此路段上汽車行駛速度在區(qū)間[85,90)的車輛數和行駛速度超過90
km/h的頻率分別為()
C.60,0.25D.60,0.35
3.某院校教師情況如下表所示:
老年中年青年
年底
男女男女男女
202012060240120IOO40
202121040320200200120
2022300150400270320280
關于2020年、2021年、2022年這3年該院校的教師情況,下面說法不正確的是()
A.2021年男教師最多
B.該校教師最多的是2022年
C.2021年中年男教師比2020年多80人
D.2020年到2022年,該校青年年齡段的男教師人數增長率為220%
4.某調查機構對全國互聯網行業(yè)進行調查統計,得到整個互聯網行業(yè)從業(yè)者年齡分布餅
狀圖、90后從事互聯網行業(yè)者崗位分布條形圖,則下列結論中不正確的是()
注:90后指1990年及以后出生,80后指1980?1989年之間出生,80前指1979年及以
前出生.
80前3%
技術∣?U39.6%
運營I―117%
市場I-113.2%
設計I112.3%
智能I19.8%
產品I------16.5%
其他□1.6%
者年齡分布飾伏圖90后從事互聯網行業(yè)崗位分布圖
A.互聯網行業(yè)從業(yè)人員中90后占一半以上
B.互聯網行業(yè)中從事技術崗位的人數超過總人數的20%
C.互聯網行業(yè)中從事運營崗位的人數90后比80前多
D.互聯網行業(yè)中從事技術崗位的人數90后比80后多
考點三用樣本的數字特征估計總體的數字特征[應用性、創(chuàng)新性]
[例5][2020?全國卷I]某廠接受了一項加工業(yè)務,加工出來的產品(單位:件)按標準
分為A,B,C,D四個等級.加工業(yè)務約定:對于A級品、B級品、C級品,廠家每件分別
收取加工費90元,50元,20元;對于D級品,廠家每件要賠償原料損失費50元.該廠有
甲、乙兩個分廠可承接加工業(yè)務.甲分廠加工成本費為25元/件,乙分廠加工成本費為20元
/件.廠家為決定由哪個分廠承接加工業(yè)務,在兩個分廠各試加工了100件這種產品,并統計
了這些產品的等級,整理如下:
甲分廠產品等級的頻數分布表
等級ABCD
頻數40202020
乙分廠產品等級的頻數分布表
等級ABCD
頻數28173421
(1)分別估計甲、乙兩分廠加工出來的一件產品為A級品的概率;
(2)分別求甲、乙兩分廠加工出來的100件產品的平均利潤,以平均利潤為依據,廠家應
選哪個分廠承接加工業(yè)務?
聽課筆記:
反思感悟利用樣本的數字特征解決優(yōu)化決策問題的依據
(1)平均數反映了數據取值的平均水平;標準差、方差描述了一組數據圍繞平均數波動的
大小.標準差、方差越大,數據的離散程度越大,越不穩(wěn)定:標準差、方差越小,數據的離
散程度越小,越穩(wěn)定.
(2)用樣本估計總體就是利用樣本的數字特征來描述總體的數字特征.
【對點訓練】
[2021?全國甲卷]某廠研制了一種生產高精產品的設備,為檢驗新設備生產產品的某項指
標有
無提高,用一臺舊設備和一臺新設備各生產了10件產品,得到各件產品該項指標數據如
下:
舊設備9.810.310.010.29.99.810.010.110.29.7
新設備IOl10.410.110.010.110.310.610.510410.5
舊設備和新設備生產產品的該項指標的樣本平均數分別記為落叼,樣本方差分別記為*
和登.
⑴求元,y,s?,S於
(2)判斷新設備生產產品的該項指標的均值較舊設備是否有顯著提高(如果y-天學
2產手,則認為新設備生產產品的該項指標的均值較舊設備有顯著提高,否則不認為有顯
著提高).
微專題38讀取統計圖表中的數據數據分析
數據分析是指針對研究對象獲得相關數據,運用統計方法對數據中的有用信息進行分析
和推斷,形成知識的過程.主要包括:收集數據,整理數據,提取信息,構建模型對信息進
行分析、推斷,獲得結論.
[例][2022?武漢調研測試]某學校為了了解本校學生的上學方式,在全校范圍內隨機抽
查部分學生,了解到上學方式主要有:A—結伴步行,B—自行乘車,C—家人接送,D—其
他方式,并將收集的數據整理繪制成如下兩幅不完整的統計圖.請根據圖中信息,求本次抽
查的學生中A類人數是()
學生上學方式條形統計圖學生上學方式扇形統計圖
A.30B.40C.42D.48
解析:由條形統計圖知,B—自行乘車上學的有42人,C—家人接送上學的有30人,D—
其他方式上學的有18人,采用B,C,D三種方式上學的共90人,設A-結伴步行上學的
有X人,由扇形統計圖知,A—結伴步行上學與B—自行乘車上學的學生占60%,所以等=
X+90
黑,解得x=30.
答案:A
名師點評本例由條形圖可以讀出頻數,由扇形圖可讀出頻率,從而問題即可解決.
第十一章統計與統計案例
第一節(jié)隨機抽樣、用樣本估計總體
積累必備知識
1.答案:(I)J(2)×(3)√(4)√(5)√(6)√
2.解析:因為125:280:95=25:56:19,所以抽取人數分別為25,56,19.
答案:B
3.解析:因為[15,20]對應的小矩形的面積為1—0.04X5—0.1X5=0.3,所以樣本落在
[15,20]內的頻數為0.3X100=30.
答案:30
4.解析:?.T203除以40不是整數,
二先隨機的去掉3個人,再除以40,得到每一段有30個人,
則分段的間隔為30.
答案:30
5.解析:Wl,X2,X3,…,X"的平均數為5,
.Xi+X+X+-+Xn_c
??23?,
n
?3x1+3?+3×3+→3x∏+?=3χ5+1=16)...χ∣,χ2,X3,…,兒的方差為2,
n
Λ3xι+1,3X2+1,3x3+1,…,3xfl+l的方差是32+2=18.
答案:1618
6.解析:對于A:根據頻率分布直方圖知該地農戶家庭年收入低于4.5萬元的農戶比率
估計為(0.02+0.04)X1=0.06,正確;對于B:根據頻率分布直方圖知該地農戶家庭年收入不
低于10.5萬元的農戶比率估計為(0.04+002+0.02+0.02)X1=010,正確;對于C:根據頻
率分布直方圖知該地農戶家庭年收入的平均值估計為3X0.02+4X0.04+5X0.10+6X0.14
+7×0.20+8×0.20+9×0.10+10×0.10+ll×0.04+12×0.02+13×0.02+14×0.02=
7.68(萬元),錯誤;對于D:根據頻率分布直方圖知該地農戶家庭年收入介于4.5萬元至8.5
萬元之間的農戶比率估計為(0.10+0.14+0.20+0.20)X1=0.64,正確.
答案:C
提升關鍵能力
考點一
1.解析:根據題意,A=i解得〃=28.故在整個抽樣過程中每個個體被抽到的概率為
n-13
10__5_
2814,
答案:C
2.解析:由題意知,前五名員工的編號依次為253,313,457,736,007.
答案:A
3.解析:初中生抽取的人數為J~*X4.5=300.
7.5+4.5+3
答案:D
考點二
例1解析:設新農村建設前,農村的經濟收入為。,則新農村建設后,農村經濟收入為
2α.新農村建設前后,各項收入的對比如下表:
新農村建新農村新農村建設后變化
結論
________________建__設后情況
37%×2?
種植收入60%α增加A錯
=74%。
50∕×2a
其他收入40∕a0增加一倍以上B對
0=10%α
30%X2?
養(yǎng)殖收入30%α增加了一倍C對
=60%。
養(yǎng)殖收入+第三產(30%+6%>(30%+28%)超過經濟收入24的
D對
業(yè)收入=36%”X2α=116%。一半
答案:A
例2解析:A項,由題圖知排序后第10個數據、第11個數據的平均數大于100,即中
位數略高于100;B項,中度污染及以上的天數為5天,占;;由題圖知C錯誤;D項,總體
4
來說,該市10月上旬的空氣質量比中旬的空氣質量好.
答案:C
例3解析:???甲組學生成績的平均數是88,
,由莖葉圖可知78+86+84+88+95+90+機+92=88X7,m=3,
Y乙組學生成績的中位數是89,??."=9,
Λw+w-12.
答案:C
例4解析:由題意得頻率分布直方圖前三組的頻率依次為0.03,0.07,0.27,所以前三
組的頻數依次為3,7,27,則后四組的頻數和為90,又后四組的頻數成等差數列,所以后四
組的頻數依次為27,24,21,18,所以視力在4.8以上(含4.8)的頻率為39%,故本校高三這
500名學生中視力在4.8以上(含4.8)的人數約為500×39%=195.
答案:C
對點訓練
1.解析:樣本容量n=(250+150+400)×30%=240,抽取的戶主對四居室滿意的人數
為150X30%X40%=18.
答案:A
2.解析:由頻率分布直方圖得在此路段上汽車行駛速度在區(qū)間[85,90)的頻率為0.06X5
=0.3,在此路段上汽車行駛速度在區(qū)間[85,90)的車輛數為0.3X1000=300,行駛速度超
過90km/h的頻率為(0.05+0.02)X5=0.35.
答案:B
3.解析:由題意知,2022年的男教師最多,A錯誤;將表中各年度人數橫向求和可知,
2022年共有1720人,為人數最多的一年,B正確;2021年中年男教師比2020年多320—240
=80(人),故C正確;2020~2022青年男教師增加了220人,增長率為220÷100X100%=220%,
D正確.
答案:A
4.解析:由餅狀圖可知互聯網從業(yè)人員中90后占56%,一半以上,故A項正確;由條
形圖知,90后從事技術崗位的人數占互聯網行業(yè)為39.6%X56%=22.176%>20%,所以互聯
網行業(yè)中從事技術崗位的人數占總人數的百分比大于等于22.176%,B項正確;由條形圖知,
90后從事運營崗位的人數占互聯網行業(yè)為17%×56%=9.52%,大于80前互聯網從業(yè)人數,
C項正確;因為技術所占比例80后未知,且90后從事技術崗位的人數比22.176%V41%,
所以D項不一定正確.
答案:D
考點三
例5解析:(1)由試加工產品等級的頻數分布表知,
甲分廠加工出來的一件產品為A級品的概率的估計值為意=0.4;
乙分廠加工出來的一件產品為A級品的概率的估計值為急=0.28.
(2)由數據知甲分廠加工出來的IOO件產品利潤的頻數分布表為
利潤6525-5一75
頻數40202020
因此甲分廠加工出來的100件產品的平均利潤為
65×40+25×20-5×20-75×20,,
-------------------二15.
100
由數據知乙分廠加工出來的100件產品利潤的頻數分布表為
利潤70300-70
頻數28173421
因此乙分廠加工出來的100件產品的平均利潤為
70×28+30×17+0×34-70×21?
-------------------------------=110.
100
比較甲、乙兩分廠加工的產品的平均利潤,應選甲分廠承接加工業(yè)務.
對點訓練
-0.2+0.3+0+0.2-0.1-0.2+0+0.1+0.2-0.3
解析:(1)由表格中的數據易得:X1-10.0=10.0,
10
一0.1+0.4+0.1+0+0.1÷0.3÷0.6+0.5+0.4+0.5∣???
114o
V=---------------------1--0---------------------+0?O=10?3,
sf=^×[(9.7-10.0)2+2×(9.8-10.0)2+(9.9-10.0)2+2×(10.0-10.0)2+(10.1-10.0)2
+2×(10.2-10.0)2+(10.3-10.0)2]=0.036,
s∣=?×[(10.0-103)2+3×(10.1-10.3)2+(10.3-103)2+2×(10.4-103)2+2×(10.5-
10.3)2+(10.6-10.3)2]=0.04.
(2)由(1)中數據可得y—又=10.3-10.0=0.3,而2Jl(s;+Sg)=V據0304,顯
然有?一元>2成立,所以認為新設備生產產品的該項指標的均值較舊設備有顯著提
高.
第二節(jié)變量間的相關關系、統計案例
?最新考綱?
1.會作兩個有關聯變量的數據的散點圖,并利用散點圖認識變量間的相關關系.
2.了解最小二乘法的思想,能根據給出的線性回歸方程系數公式建立線性回歸方程(線
性回歸方程系數公式不要求記憶).
3.了解獨立性檢驗的思想、方法,并能初步應用獨立性檢驗的思想方法解決一些簡單的
實際問題.
4.通過典型案例了解回歸分析的思想方法,并能初步應用回歸分析的思想、方法解決一
些簡單的實際問題.
?考向預測?
考情分析:兩個變量線性相關的判斷及應用,回歸直線方程的求法及應用,利用2X2
列聯表判斷兩個變量的相關關系將是高考考查的熱點,題型將是選擇與填空題或者在解答題
中綜合考查.
學科素養(yǎng):通過線性回歸分析及獨立性檢驗的應用考查數學建模、數據分析、數學運算
的核心素養(yǎng).
積累必備知識——基礎落實贏得良好開端
一、必記3個知識點
1.變量間的相關關系
常見的兩變量之間的關系有兩類:一類是函數關系,另一類是相關關系;與函數關系不
同,相關關系是一種非確定性關系.
2.兩個變量的線性相關
(1)從散點圖上看,如果這些點從整體上看大致分布在通過散點圖中心的一條直線附近,
稱兩個變量之間具有線性相關關系,這條直線叫回歸直線.
(2)從散點圖上看,點分布在從左下角到右上角的區(qū)域內,兩個變量的這種相關關系稱為
正相關,點分布在左上角到右下角的區(qū)域內,兩個變量的相關關系為負相關.
(3)回歸方程為?=bx+a,其中5=個學-苧,a=y-bx.
乙i=Xi一???
(4)相關系數
當r>0時,表明兩個變量正相關;
當r<0時,表明兩個變量負相關.
r的絕對值越接近于1,表明兩個變量的線性相關性越強?r的絕對值越接近于0,表明
兩個變量之間幾乎不存在線性相關關系,通常Irl大于0.75時,認為兩個變量有很強的線性相
關性.
3.獨立性檢驗
(1)2X2列聯表:假設有兩個分類變量X和Y,它們的取值分別為{x∣,X2}和{y∣,y2}.
其樣本頻數列聯表(稱2X2列聯表)為:
yIy2總計
Xlaba+b
X2cdc+d
總計a÷cb+da÷b÷c÷d
(2)K2統計量
n(ad-bc)2
K2=(其中n=a+b+c+d為樣本容量).
(a+b)(c÷d)(a÷c)(b+d)
二、必明3個常用結論
1.求解回歸方程的關鍵是確定回歸系數a,b,應充分利用回歸直線過樣本中心點(后刃.
2.根據K2的值可以判斷兩個分類變量有關的可信程度,若K2越大,則兩分類變量有關
的把握越大.
3.根據回歸方程計算的夕值,僅是一個預報值,不是真實發(fā)生的值.
三、必練4類基礎題
(一)判斷正誤
1.判斷下列說法是否正確(請在括號中打“J”或"X”).
(1)散點圖是判斷兩個變量是否相關的一種重要方法和手段.()
(2)回歸直線方程?=氤+&至少經過點(X”yι),(X2,y2),…,(Xn,%)中的一個點.()
(3)若事件X,Y關系越密切,則由觀測數據計算得到的K2的觀測值越小.()
(4)兩個變量的相關系數的絕對值越接近于1,它們的相關性越強.()
(二)教材改編
2.[必修3/9。例題改編]某研究機構對高三學生的記憶力X和判斷力y進行統計分析,
所得數據如表:
X681012
y2356
則y對X的線性回歸直線方程為()
A.9=2.3χ-0.7B.夕=2.3x+0.7
C.y=0.7χ-2.3D.y=0.7x+2.3
3.[選修2-3√?例2改編]兩個變量y與X的回歸模型中,分別選擇了4個不同模型,
它們的相關指數R2如下,其中擬合效果最好的模型是()
4模型1的相關指數R2為0.98
B.模型2的相關指數R2為0.80
C.模型3的相關指數R2為0.50
D模型4的相關指數R2為0.25
(三)易錯易混
4.(回歸方程的概念不清)設某大學的女生體重y(單位:像)與身高x(單位:cm)具有線性
相關關系,根據一組樣本數據(xi,yi)(i=l,2,…,n),用最小二乘法建立的回歸方程為9=
0.85χ-85.71,則下列結論中不正確的是.(填序號)
①y與X具有正的線性相關關系;
②回歸直線過樣本點的中心磔,刃;
③若該大學某女生身高增加1cm,則其體重約增加0.85奴;
④若該大學某女生身高為170Cm則可斷定其體重必為58.794g.
5.(忽視回歸直線方程這樣本點中心)在一次考試中,5名學生的數學和物理成績如下表
(已知學生的數學和物理成績具有線性相關關系):
學生的編號i12345
數學成績X8075706560
物理成績y-7066686462
現已知其線性回歸方程為夕=0.36x+α,則根據此線性回歸方程估計數學得90分的同學
的物理成績?yōu)榉?(四舍五入取整數)
(四)走進高考
6.[2020?全國卷I]某校一個課外學習小組為研究某作物種子的發(fā)芽率y和溫度x(單
位:℃)的關系,在20個不同的溫度條件下進行種子發(fā)芽實驗,由實驗數據(Xi,yi)(i=1,2,…,
20)得到下面的散點圖:
由此散點圖,在10℃至40℃之間,下面四個回歸方程類型中最適宜作為發(fā)芽率y和溫
度X的回歸方程類型的是()
A.y=a÷bxB.y=a+bx2
C.y=a+be'D.y=a+bInX
提升關鍵能力——考點突破掌握類題通法
考點一相關關系的判斷[基礎性]
1.對變量X,y有觀測數據(xi,y)(i=l,2,…,10),得散點圖如圖①,對變量u,V
有觀測數據(W,vi)(i=l,2,…,10),得散點圖如圖②.由這兩個散點圖可以判斷()
y
3060
安?50
20??40
15*30
1020
510
01234567工O1234567w
①②
4.變量X與y正相關,U與V正相關
B.變量X與y正相關,u與V負相關
C.變量X與y負相關,u與V正相關
D.變量X與y負相關,U與V負相關
2.某公司在2019年上半年的月收入x(單位:萬元)與月支出y(單位:萬元)的統計資料
如表所示:
月份1月份2月份3月份4月份5月份6月份
收入X12.314.515.017.019.820.6
支出y5.635.755.825.896.116.18
根據統計資料,則()
A.月收入的中位數是15,X與y有正線性相關關系
8.月收入的中位數是17,X與y有負線性相關關系
C.月收入的中位數是16,X與y有正線性相關關系
D.月收入的中位數是16,X與y有負線性相關關系
3.四名同學根據各自的樣本數據研究變量X,y之間的相關關系,并求得回歸直線方程,
分別得到以下四個結論:
①y與X負相關且歹=2.347χ-6.423;
②y與X負相關且夕=-3.476x+5.648;
③y與X正相關且j>=5.437x+8.493;
④y與X正相關且y=-4.326χ-4.578.
其中一定不正確的結論的序號是()
A.①②B.②③
C.③④D.①④
反思感悟)判定兩個變量正、負相關性的方法
(1)畫散點圖:點的分布從左下角到右上角,兩個變量正相關;點的分布從左上角到右下
角,兩個變量負相關.
(2)相關系數:r>0時,正相關;r<0時,負相關.
(3)線性回歸方程中:b>0時,正相關:B<0時,負相關.
考點二回歸分析[綜合性、應用性、創(chuàng)新性]
角度1線性回歸方程及其應用
[例1]某手機廠商在銷售200萬臺某型號手機時開展“手機碎屏險”活動.活動規(guī)則如
下:用戶購買該型號手機時可選購''手機碎屏險",保費為X元.若在購機后一年內發(fā)生碎
屏可免費更換一次屏幕.該手機廠商將在這200萬臺該型號手機全部銷售完畢一年后,在購
買碎屏險且購機后一年內未發(fā)生碎屏的用戶中隨機抽取1000名,每名用戶贈送1000元的紅
包.為了合理確定保費X的值,該手機廠商進行了問卷調查,統計后得到下表(其中y表示保
費為X元時愿意購買該“手機碎屏險”的用戶比例):
X1020304050
y0.790.590.380.230.01
(1)根據上面的數據求出y關于X的回歸直線方程;
(2)通過大數據分析,在使用該型號手機的用戶中,購機后一年內發(fā)生碎屏的比例為0.5%.
己知更換一次該型號手機屏幕的費用為800元,若該手機廠商要求在這次活動中因銷售該
“手機碎屏險”產生的利潤不少于70萬元,能否把保費X定為5元?
參考數據:表中X的5個值從左到右分別記為Xi,x2,X3,X4,X5,相應的y值分別記為
y”丫2,丫3,丫4,Y5>
5__—15_15
經計算有S(XLX)(y,-y)=-19.2,其中X=q??,?,y=-∑yi
/=1?/=1/=1
聽課筆記:
(反思感悟)求線性回歸方程的基本步驟
(1)先把數據制成表,從表中計算出五,y,Xi÷%2T-------F%n,Xiyi+x2y2T-------卜Xnyn
的值;
(2)計算回歸系數&,e;
(3)寫出線性回歸方程夕=bx+a
角度2相關系數及其應用
[例2][2020?全國卷II]某沙漠地
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 租用意向協議書
- 經營撤股協議書
- 臺球廳承包合同協議書
- 租憑工廠協議書
- 美發(fā)合資協議書
- 聘請砍樹協議書
- 經營轉讓協議書
- 向廠方解除合同協議書
- 自愿出資協議書
- 拱墅區(qū)土方運輸協議書
- 起重裝卸機械操作工(中級工)理論考試復習題庫(含答案)
- 樁基施工安全教育培訓
- 臨床醫(yī)學教師的勝任力
- 江西天宇化工有限公司30萬噸年離子膜氯堿項目環(huán)境影響報告書
- 《計算機網絡實驗教程》全套教學課件
- DL∕T 904-2015 火力發(fā)電廠技術經濟指標計算方法
- DL∕T 552-2015 火力發(fā)電廠空冷凝汽器傳熱元件性能試驗規(guī)程
- 數字化設計與制造課程教學大綱
- php校友管理系統論文
- TD/T 1040-2013 土地整治項目制圖規(guī)范(正式版)
- 2023北京朝陽區(qū)高二下學期期末英語試題及答案
評論
0/150
提交評論