版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第=page1212頁,總=sectionpages3131頁專題10.1統(tǒng)計與統(tǒng)計案例【考綱要求】1.抽樣(1)簡單隨機抽樣通過實例,了解簡單隨機抽樣的含義及其解決問題的過程,掌握兩種簡單隨機抽樣方法:抽簽法和隨機數(shù)法.會計算樣本均值和樣本方差,了解樣本與總體的關(guān)系.(2)分層隨機抽樣通過實例,了解分層隨機抽樣的特點和適用范圍,了解分層隨機抽樣的必要性,掌握各層樣本量比例分配的方法.結(jié)合具體實例,掌握分層隨機抽樣的樣本均值和樣本方差.(3)抽樣方法的選擇在簡單的實際情境中,能根據(jù)實際問題的特點,設計恰當?shù)某闃臃椒ń鉀Q問題.2.統(tǒng)計圖表能根據(jù)實際問題的特點,選擇恰當?shù)慕y(tǒng)計圖表對數(shù)據(jù)進行可視化描述,體會合理使用統(tǒng)計圖表的重要性.3.用樣本估計總體(1)結(jié)合實例,能用樣本估計總體的集中趨勢參數(shù)(平均數(shù)、中位數(shù)、眾數(shù)),理解集中趨勢參數(shù)的統(tǒng)計含義.(2)結(jié)合實例,能用樣本估計總體的離散程度參數(shù)(標準差、方差、極差),理解離散程度參數(shù)的統(tǒng)計含義.(3)結(jié)合實例,能用樣本估計總體的取值規(guī)律.4.成對數(shù)據(jù)的統(tǒng)計相關(guān)性(1)結(jié)合實例,了解樣本相關(guān)系數(shù)的統(tǒng)計含義.(2)結(jié)合實例,會通過相關(guān)系數(shù)比較多組成對數(shù)據(jù)的相關(guān)性.5.一元線性回歸模型(1)結(jié)合具體實例,了解一元線性回歸模型的含義,了解模型參數(shù)的統(tǒng)計意義,了解最小二乘原理,掌握一元線性回歸模型參數(shù)的最小二乘估計方法.(2)針對實際問題,會用一元線性回歸模型進行預測.6.2×2列聯(lián)表(1)通過實例,理解2×2列聯(lián)表的統(tǒng)計意義.(2)通過實例,了解2×2列聯(lián)表獨立性檢驗及其應用.【知識清單】知識點一.隨機抽樣與用樣本估計總體1.簡單隨機抽樣(1)定義:一般地,設一個總體含有N個個體,從中逐個不放回地抽取n個個體作為樣本(n≤N),如果每次抽取時總體內(nèi)的各個個體被抽到的機會都相等,就把這種抽樣方法叫做簡單隨機抽樣.這樣抽取的樣本,叫做簡單隨機樣本.(2)常用方法:抽簽法和隨機數(shù)法.2.分層抽樣(1)在抽樣時,將總體分成互不交叉的層,然后按照一定的比例,從各層獨立地抽取一定數(shù)量的個體,將各層取出的個體合在一起作為樣本,這種抽樣方法是一種分層抽樣.(2)分層抽樣的應用范圍當總體是由差異明顯的幾個部分組成時,往往選用分層抽樣.3.頻率分布直方圖(1)縱軸表示eq\f(頻率,組距),即小長方形的高=eq\f(頻率,組距);(2)小長方形的面積=組距×eq\f(頻率,組距)=頻率;(3)各個小方形的面積總和等于1.4.頻率分布表的畫法第一步:求極差,決定組數(shù)和組距,組距=eq\f(極差,組數(shù));第二步:分組,通常對組內(nèi)數(shù)值所在區(qū)間取左閉右開區(qū)間,最后一組取閉區(qū)間;第三步:登記頻數(shù),計算頻率,列出頻率分布表.5.條形圖、折線圖及扇形圖(1)條形圖:建立直角坐標系,用橫軸(橫軸上的數(shù)字)表示樣本數(shù)據(jù)類型,用縱軸上的單位長度表示一定的數(shù)量,根據(jù)每個樣本(或某個范圍內(nèi)的樣本)的數(shù)量多少畫出長短不同的等寬矩形,然后把這些矩形按照一定的順序排列起來,這樣一種表達和分析數(shù)據(jù)的統(tǒng)計圖稱為條形圖.(2)折線圖:建立直角坐標系,用橫軸上的數(shù)字表示樣本值,用縱軸上的單位長度表示一定的數(shù)量,根據(jù)樣本值和數(shù)量的多少描出相應各點,然后把各點用線段順次連接,得到一條折線,用這種折線表示出樣本數(shù)據(jù)的情況,這樣的一種表示和分析數(shù)據(jù)的統(tǒng)計圖稱為折線圖.(3)扇形圖:用一個圓表示總體,圓中各扇形分別代表總體中的不同部分,每個扇形的大小反映所表示的那部分占總體的百分比的大小,這樣的一種表示和分析數(shù)據(jù)的統(tǒng)計圖稱為扇形圖.6.中位數(shù)、眾數(shù)、平均數(shù)的定義(1)中位數(shù)將一組數(shù)據(jù)按大小依次排列,處于最中間位置的一個數(shù)據(jù)(或最中間兩個數(shù)據(jù)的平均數(shù))叫做這組數(shù)據(jù)的中位數(shù).(2)眾數(shù)一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)據(jù)叫做這組數(shù)據(jù)的眾數(shù).(3)平均數(shù)一組數(shù)據(jù)的算術(shù)平均數(shù)即為這組數(shù)據(jù)的平均數(shù),n個數(shù)據(jù)x1,x2,…,xn的平均數(shù)eq\x\to(x)=eq\f(1,n)(x1+x2+…+xn).7.樣本的數(shù)字特征如果有n個數(shù)據(jù)x1,x2,…,xn,那么這n個數(shù)的(1)標準差.(2)方差.[常用結(jié)論]1.頻率分布直方圖中的常見結(jié)論(1)眾數(shù)的估計值為最高矩形的中點對應的橫坐標.(2)平均數(shù)的估計值等于頻率分布直方圖中每個小矩形的面積乘以小矩形底邊中點的橫坐標之和.(3)中位數(shù)的估計值的左邊和右邊的小矩形的面積和是相等的.2.平均數(shù)、方差的公式推廣(1)若數(shù)據(jù)x1,x2,…,xn的平均數(shù)為eq\x\to(x),則mx1+a,mx2+a,mx3+a,…,mxn+a的平均數(shù)是meq\x\to(x)+a.(2)若數(shù)據(jù)x1,x2,…,xn的方差為s2,則數(shù)據(jù)ax1+b,ax2+b,…,axn+b的方差為a2s2.知識點二.變量間的相關(guān)關(guān)系與統(tǒng)計案例1.變量間的相關(guān)關(guān)系(1)常見的兩變量之間的關(guān)系有兩類:一類是函數(shù)關(guān)系,另一類是相關(guān)關(guān)系;與函數(shù)關(guān)系不同,相關(guān)關(guān)系是一種非確定性關(guān)系.eq\x(體現(xiàn)的不一定是因果關(guān)系.)(2)從散點圖上看,點散布在從左下角到右上角的區(qū)域內(nèi),兩個變量的這種相關(guān)關(guān)系稱為正相關(guān);點散布在左上角到右下角的區(qū)域內(nèi),兩個變量的這種相關(guān)關(guān)系為負相關(guān).2.兩個變量的線性相關(guān)(1)從散點圖上看,如果這些點從整體上看大致分布在通過散點圖中心的一條直線附近,稱兩個變量之間具有線性相關(guān)關(guān)系,這條直線叫做回歸直線.(2)回歸方程為eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),其中,(3)通過求eq\a\vs4\al(Q=\i\su(i=1,n,)yi-bxi-a2)的最小值而得到回歸直線的方法,即使得樣本數(shù)據(jù)的點到回歸直線的距離的平方和最小,這一方法叫做最小二乘法.(4)相關(guān)系數(shù):當r>0時,表明兩個變量正相關(guān);當r<0時,表明兩個變量負相關(guān).r的絕對值越接近于1,表明兩個變量的線性相關(guān)性越強.r的絕對值越接近于0,表明兩個變量之間幾乎不存在線性相關(guān)關(guān)系.通常|r|大于0.75時,認為兩個變量有很強的線性相關(guān)性.3.獨立性檢驗(1)2×2列聯(lián)表設X,Y為兩個變量,它們的取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(2×2列聯(lián)表)如下:y1y2總計x1aba+bx2cdc+d總計a+cb+da+b+c+d(2)獨立性檢驗利用隨機變量K2(也可表示為χ2)的觀測值(其中n=a+b+c+d為樣本容量)來判斷“兩個變量有關(guān)系”的方法稱為獨立性檢驗.獨立性檢驗是對兩個變量有關(guān)系的可信程度的判斷,而不是對其是否有關(guān)系的判斷.[常用結(jié)論]1.求解回歸方程的關(guān)鍵是確定回歸系數(shù)eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^)),應充分利用回歸直線過樣本中心點(eq\x\to(x),eq\x\to(y)).2.根據(jù)K2的值可以判斷兩個分類變量有關(guān)的可信程度,若K2越大,則兩分類變量有關(guān)的把握越大.3.根據(jù)回歸方程計算的eq\o(y,\s\up6(^))值,僅是一個預報值,不是真實發(fā)生的值.【考點梳理】考點一統(tǒng)計數(shù)據(jù)與圖表在實際問題中的應用【典例1】(2017·全國高考真題(理))某城市為了解游客人數(shù)的變化規(guī)律,提高旅游服務質(zhì)量,收集并整理了2014年1月至2016年12月期間月接待游客量(單位:萬人)的數(shù)據(jù),繪制了如圖所示的折線圖.根據(jù)該折線圖,下列結(jié)論錯誤的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相對于7月至12月,波動性更小,變化比較平穩(wěn)【答案】A【解析】對于選項A,由圖易知月接待游客量每年7,8月份明顯高于12月份,故A錯;對于選項B,觀察折線圖的變化趨勢可知年接待游客量逐年增加,故B正確;對于選項C,D,由圖可知顯然正確.故選A.【典例2】(2018·全國高考真題(文))某地區(qū)經(jīng)過一年的新農(nóng)村建設,農(nóng)村的經(jīng)濟收入增加了一倍.實現(xiàn)翻番.為更好地了解該地區(qū)農(nóng)村的經(jīng)濟收入變化情況,統(tǒng)計了該地區(qū)新農(nóng)村建設前后農(nóng)村的經(jīng)濟收入構(gòu)成比例.得到如下餅圖:則下面結(jié)論中不正確的是A.新農(nóng)村建設后,種植收入減少B.新農(nóng)村建設后,其他收入增加了一倍以上C.新農(nóng)村建設后,養(yǎng)殖收入增加了一倍D.新農(nóng)村建設后,養(yǎng)殖收入與第三產(chǎn)業(yè)收入的總和超過了經(jīng)濟收入的一半【答案】A【解析】首先設出新農(nóng)村建設前的經(jīng)濟收入為M,根據(jù)題意,得到新農(nóng)村建設后的經(jīng)濟收入為2M,之后從圖中各項收入所占的比例,得到其對應的收入是多少,從而可以比較其大小,并且得到其相應的關(guān)系,從而得出正確的選項.詳解:設新農(nóng)村建設前的收入為M,而新農(nóng)村建設后的收入為2M,則新農(nóng)村建設前種植收入為0.6M,而新農(nóng)村建設后的種植收入為0.74M,所以種植收入增加了,所以A項不正確;新農(nóng)村建設前其他收入我0.04M,新農(nóng)村建設后其他收入為0.1M,故增加了一倍以上,所以B項正確;新農(nóng)村建設前,養(yǎng)殖收入為0.3M,新農(nóng)村建設后為0.6M,所以增加了一倍,所以C項正確;新農(nóng)村建設后,養(yǎng)殖收入與第三產(chǎn)業(yè)收入的綜合占經(jīng)濟收入的,所以超過了經(jīng)濟收入的一半,所以D正確;故選A.【規(guī)律方法】條形圖、折線圖及扇形圖(1)條形圖:建立直角坐標系,用橫軸(橫軸上的數(shù)字)表示樣本數(shù)據(jù)類型,用縱軸上的單位長度表示一定的數(shù)量,根據(jù)每個樣本(或某個范圍內(nèi)的樣本)的數(shù)量多少畫出長短不同的等寬矩形,然后把這些矩形按照一定的順序排列起來,這樣一種表達和分析數(shù)據(jù)的統(tǒng)計圖稱為條形圖.(2)折線圖:建立直角坐標系,用橫軸上的數(shù)字表示樣本值,用縱軸上的單位長度表示一定的數(shù)量,根據(jù)樣本值和數(shù)量的多少描出相應各點,然后把各點用線段順次連接,得到一條折線,用這種折線表示出樣本數(shù)據(jù)的情況,這樣的一種表示和分析數(shù)據(jù)的統(tǒng)計圖稱為折線圖.(3)扇形圖:用一個圓表示總體,圓中各扇形分別代表總體中的不同部分,每個扇形的大小反映所表示的那部分占總體的百分比的大小,這樣的一種表示和分析數(shù)據(jù)的統(tǒng)計圖稱為扇形圖.【變式探究】1.(2020·西城·北京鐵路二中高三期中)我國新冠肺炎疫情進入常態(tài)化,各地有序推進復工復產(chǎn),下面是某地連續(xù)11天復工復產(chǎn)指數(shù)折線圖,給出下列四個結(jié)論:①第3天至第11天復工復產(chǎn)指數(shù)均超過80%;②這11天期間,復產(chǎn)指數(shù)增量大于復工指數(shù)的增量;③第9天至第11天復產(chǎn)指數(shù)增量大于復工指數(shù)的增量;④第1天至第3天復工指數(shù)的方差大于第2天至第4天復工指數(shù)的方差.其中所有正確結(jié)論的序號是____________________.【答案】①③【解析】由圖像可得,第3天至第11天復工復產(chǎn)指數(shù)均超過80%,故①正確;由圖像可得,第1天復產(chǎn)指數(shù)與復工指數(shù)的差大于第11天復產(chǎn)指數(shù)與復工指數(shù)的差,所以這11天期間,復產(chǎn)指數(shù)增量小于復工指數(shù)的增量,故②錯誤;由圖像可得,第9天至第11天復產(chǎn)指數(shù)增量大于復工指數(shù)的增量;故③正確;由圖像可得,第1天至第3天復工指數(shù)波動較小,第2天至第4天復工指數(shù)波動較大,所以第1天至第3天復工指數(shù)的方差小于第2天至第4天復工指數(shù)的方差,故④錯誤.故答案為:①③2.(多選)(2019·貴州省適應性考試)2018年12月1日,貴陽市地鐵1號線全線開通,在一定程度上緩解了市內(nèi)交通的擁堵狀況.為了了解市民對地鐵1號線開通的關(guān)注情況,某調(diào)查機構(gòu)在地鐵開通后的某兩天抽取了部分乘坐地鐵的市民作為樣本,分析其年齡和性別結(jié)構(gòu),并制作出如下等高條形圖:根據(jù)圖中(35歲以上含35歲)的信息,下列結(jié)論中一定正確的是()A.樣本中男性比女性更關(guān)注地鐵1號線全線開通B.樣本中多數(shù)女性是35歲以上C.樣本中35歲以下的男性人數(shù)比35歲以上的女性人數(shù)多D.樣本中35歲以上的人對地鐵1號線的開通關(guān)注度更高【答案】ABD【解析】設等高條形圖對應2×2列聯(lián)表如下:35歲以上35歲以下總計男性aca+c女性bdb+d總計a+bc+da+b+c+d根據(jù)第1個等高條形圖可知,35歲以上男性比35歲以上女性多,即a>b;35歲以下男性比35歲以下女性多,即c>d.根據(jù)第2個等高條形圖可知,男性中35歲以上的比35歲以下的多,即a>c;女性中35歲以下的比35歲以下的多,即b>d.對于A,男性人數(shù)為a+c,女性人數(shù)為b+d,因為a>b,c>d,所以a+c>b+d,所以A正確;對于B,35歲以上女性人數(shù)為b,35歲以下女性人數(shù)為d,因為b>d,所以B正確;對于C,35歲以下男性人數(shù)為c,35歲以上女性人數(shù)為b,無法從圖中直接判斷b與c的大小關(guān)系,所以C不一定正確;對于D,35歲以上的人數(shù)為a+b,35歲以下的人數(shù)為c+d,因為a>c,b>d,所以a+b>c+d,所以D正確.故選A、B、D.考點二抽樣方法【典例3】(2020·橫峰中學高三其他(理))某中學高二年級共有學生2400人,為了解他們的身體狀況,用分層抽樣的方法從中抽取一個容量為80的樣本,若樣本中共有男生42人,則該校高二年級共有女生()A.1260 B.1230 C.1200 D.1140【答案】D【解析】設女生總?cè)藬?shù)為:人,由分層抽樣的方法可得:抽取女生人數(shù)為:人,所以,解得:故選:D【典例4】(2019·山東省泰安實驗中學高一開學考試)總體由編號為01,02,,29,30的30個個體組成,現(xiàn)從中9抽取一個容量為6的樣本,請以隨機數(shù)表第1行第3列開始,向右讀取,則選出來的第6個個體的編號為()70291712134033123826138951035662183735968350877597125593A.12 B.13 C.03 D.40【答案】C【解析】從隨機數(shù)表第行第列開始由左到右依次選取兩個數(shù)字中小于30的編號依次為29,17,12,13,26,03,則第6個個體的編號為26.故選C.【總結(jié)提升】1.不論哪種抽樣方法,總體中的每一個個體入樣的概率都是相同的.2.分層抽樣的前提和遵循的兩條原則(1)前提:分層抽樣使用的前提是總體可以分層,層與層之間有明顯區(qū)別,而層內(nèi)個體間差異較小,每層中所抽取的個體數(shù)可按各層個體數(shù)在總體的個體數(shù)中所占比例抽?。?2)遵循的兩條原則:①將相似的個體歸入一類,即為一層,分層要求每層的各個個體互不交叉,即遵循不重復、不遺漏的原則;②分層抽樣為保證每個個體等可能入樣,需遵循在各層中進行簡單隨機抽樣,每層樣本數(shù)量與每層個體數(shù)量的比等于抽樣比.3.兩種抽樣方法的特點、聯(lián)系及適用范圍類別共同點各自特點聯(lián)系適用范圍簡單隨機抽樣①抽樣過程中每個個體被抽到的可能性相等;②每次抽出個體后不再將它放回,即不放回抽樣從總體中逐個抽取總體個數(shù)較少分層抽樣將總體分成幾層,分層進行抽取各層抽樣時,采用簡單隨機抽樣總體由差異明顯的幾部分組成【變式探究】1.(2019·綏德中學高二月考(文))高二年級有男生560人,女生420人,為了解學生職業(yè)規(guī)劃,現(xiàn)用分層抽樣的方法從該年級全體學生中抽取一個容量為280人的樣本,則此樣本中男生人數(shù)為()A.120 B.160 C.280 D.400【答案】B【解析】有男生560人,女生420人,年級共有,用分層抽樣的方法從該年級全體學生中抽取一個容量為280的樣本,每個個體被抽到的概率是,要從男生中抽取,故選:B.2.下列抽取樣本的方式屬于簡單隨機抽樣的個數(shù)為()①從無限多個個體中抽取100個個體作為樣本.②盒子里共有80個零件,從中選出5個零件進行質(zhì)量檢驗.在抽樣操作時,從中任意拿出一個零件進行質(zhì)量檢驗后再把它放回盒子里.③從20件玩具中一次性抽取3件進行質(zhì)量檢驗.④某班有56名同學,指定個子最高的5名同學參加學校組織的籃球賽.A.0B.1C.2 D.3【答案】A【解析】①不是簡單隨機抽樣,因為被抽取樣本的總體的個數(shù)是無限的,而不是有限的;②不是簡單隨機抽樣.因為它是有放回抽樣;③不是簡單隨機抽樣.因為這是“一次性”抽取,而不是“逐個”抽取;④不是簡單隨機抽樣.因為不是等可能抽樣.故選A.【易錯提醒】1.應用簡單隨機抽樣應注意的問題(1)一個抽樣試驗能否用抽簽法,關(guān)鍵看兩點:一是抽簽是否方便;二是號簽是否易攪勻.一般地,當總體容量和樣本容量都較小時可用抽簽法.(2)在使用隨機數(shù)法時,如遇到三位數(shù)或四位數(shù),可從選擇的隨機數(shù)表中的某行某列的數(shù)字計起,每三個或四個作為一個單位,自左向右選取,有超過總體號碼或出現(xiàn)重復號碼的數(shù)字舍去.2.分層抽樣問題的類型及解題思路(1)求某層應抽個體數(shù)量:按該層所占總體的比例計算.(2)已知某層個體數(shù)量,求總體容量或反之求解:根據(jù)分層抽樣就是按比例抽樣,列比例式進行計算.(3)分層抽樣的計算應根據(jù)抽樣比構(gòu)造方程求解,其中“抽樣比=eq\f(樣本容量,總體容量)=eq\f(各層樣本數(shù)量,各層個體數(shù)量)”.考點三頻率分布直方圖的應用【典例5】(2020·天津高考真題)從一批零件中抽取80個,測量其直徑(單位:),將所得數(shù)據(jù)分為9組:,并整理得到如下頻率分布直方圖,則在被抽取的零件中,直徑落在區(qū)間內(nèi)的個數(shù)為()
A.10 B.18 C.20 D.36【答案】B【解析】根據(jù)直方圖,直徑落在區(qū)間之間的零件頻率為:,則區(qū)間內(nèi)零件的個數(shù)為:.故選:B.【典例6】(2019·全國高考真題(理))為了解甲、乙兩種離子在小鼠體內(nèi)的殘留程度,進行如下試驗:將200只小鼠隨機分成兩組,每組100只,其中組小鼠給服甲離子溶液,組小鼠給服乙離子溶液.每只小鼠給服的溶液體積相同、摩爾濃度相同.經(jīng)過一段時間后用某種科學方法測算出殘留在小鼠體內(nèi)離子的百分比.根據(jù)試驗數(shù)據(jù)分別得到如下直方圖:
記為事件:“乙離子殘留在體內(nèi)的百分比不低于”,根據(jù)直方圖得到的估計值為.(1)求乙離子殘留百分比直方圖中的值;(2)分別估計甲、乙離子殘留百分比的平均值(同一組中的數(shù)據(jù)用該組區(qū)間的中點值為代表).【答案】(1),;(2),.【解析】(1)由題得,解得,由,解得.(2)由甲離子的直方圖可得,甲離子殘留百分比的平均值為,乙離子殘留百分比的平均值為【規(guī)律方法】(1)在頻率分布直方圖中,各小長方形的面積表示相應各組的頻率,所有小長方形的面積的和等于1;(2)eq\f(頻率,組距)×組距=頻率;(3)eq\f(頻數(shù),樣本容量)=頻率,此關(guān)系式的變形為eq\f(頻數(shù),頻率)=樣本容量,樣本容量×頻率=頻數(shù)【變式探究】1.(2020·海南高三期中)為了評估某家快遞公司的服務質(zhì)量,某評估小組進行了客戶滿意度調(diào)查,從該公司參與調(diào)查的客戶中隨機抽取500名客戶的評分,評分均在區(qū)間上,分組為,,,,,其頻率分布直方圖如圖所示.規(guī)定評分在60分以下表示對該公司的服務質(zhì)量不滿意,則這500名客戶中對該公司的服務質(zhì)量不滿意的客戶的人數(shù)為()
A.15 B.16 C.17 D.18【答案】A【解析】由頻率分布直方圖可知,評分在區(qū)間上的頻率為,所以評分在區(qū)間上的客戶有(人),即對該公司的服務質(zhì)量不滿意的客戶有15人.故選:A2.(2017北京,文17)某大學藝術(shù)專業(yè)400名學生參加某次測評,根據(jù)男女學生人數(shù)比例,使用分層抽樣的方法從中隨機抽取了100名學生,記錄他們的分數(shù),將數(shù)據(jù)分成7組:[20,30),[30,40),┄,[80,90],并整理得到如下頻率分布直方圖:(Ⅰ)從總體的400名學生中隨機抽取一人,估計其分數(shù)小于70的概率;(Ⅱ)已知樣本中分數(shù)小于40的學生有5人,試估計總體中分數(shù)在區(qū)間[40,50)內(nèi)的人數(shù);(Ⅲ)已知樣本中有一半男生的分數(shù)學.科網(wǎng)不小于70,且樣本中分數(shù)不小于70的男女生人數(shù)相等.試估計總體中男生和女生人數(shù)的比例.【答案】(Ⅰ)0.4;(Ⅱ)5人;(Ⅲ).【解析】(Ⅰ)根據(jù)頻率分布直方圖可知,樣本中分數(shù)不小于70的頻率為,所以樣本中分數(shù)小于70的頻率為.所以從總體的400名學生中隨機抽取一人,其分數(shù)小于70的概率估計為0.4.(Ⅱ)根據(jù)題意,樣本中分數(shù)不小于50的頻率為,分數(shù)在區(qū)間內(nèi)的人數(shù)為.學科%網(wǎng)所以總體中分數(shù)在區(qū)間內(nèi)的人數(shù)估計為.【易錯提醒】頻率分布直方圖的縱坐標是eq\f(頻率,組距),而不是頻率考點四用樣本的數(shù)字特征估計總體的數(shù)字特征【典例7】(2020·全國高考真題(理))在一組樣本數(shù)據(jù)中,1,2,3,4出現(xiàn)的頻率分別為,且,則下面四種情形中,對應樣本的標準差最大的一組是()A. B.C. D.【答案】B【解析】對于A選項,該組數(shù)據(jù)的平均數(shù)為,方差為;對于B選項,該組數(shù)據(jù)的平均數(shù)為,方差為;對于C選項,該組數(shù)據(jù)的平均數(shù)為,方差為;對于D選項,該組數(shù)據(jù)的平均數(shù)為,方差為.因此,B選項這一組的標準差最大.故選:B.【典例8】(2019年高考全國Ⅱ卷文)某行業(yè)主管部門為了解本行業(yè)中小企業(yè)的生產(chǎn)情況,隨機調(diào)查了100個企業(yè),得到這些企業(yè)第一季度相對于前一年第一季度產(chǎn)值增長率y的頻數(shù)分布表.的分組企業(yè)數(shù)22453147(1)分別估計這類企業(yè)中產(chǎn)值增長率不低于40%的企業(yè)比例、產(chǎn)值負增長的企業(yè)比例;(2)求這類企業(yè)產(chǎn)值增長率的平均數(shù)與標準差的估計值(同一組中的數(shù)據(jù)用該組區(qū)間的中點值為代表).(精確到0.01)附:.【答案】(1)產(chǎn)值增長率不低于40%的企業(yè)比例為21%,產(chǎn)值負增長的企業(yè)比例為2%;(2)這類企業(yè)產(chǎn)值增長率的平均數(shù)與標準差的估計值分別為30%,17%.【解析】(1)根據(jù)產(chǎn)值增長率頻數(shù)分布表得,所調(diào)查的100個企業(yè)中產(chǎn)值增長率不低于40%的企業(yè)頻率為.產(chǎn)值負增長的企業(yè)頻率為.用樣本頻率分布估計總體分布得這類企業(yè)中產(chǎn)值增長率不低于40%的企業(yè)比例為21%,產(chǎn)值負增長的企業(yè)比例為2%.(2),,,所以,這類企業(yè)產(chǎn)值增長率的平均數(shù)與標準差的估計值分別為30%,17%.【總結(jié)提升】(1)平均數(shù)反映了數(shù)據(jù)取值的平均水平;標準差、方差描述了一組數(shù)據(jù)圍繞平均數(shù)波動的大小.標準差、方差越大,數(shù)據(jù)的離散程度越大,越不穩(wěn)定;標準差、方差越小,數(shù)據(jù)的離散程度越小,越穩(wěn)定.(2)用樣本估計總體就是利用樣本的數(shù)字特征來描述總體的數(shù)字特征.【變式探究】1.(2019·全國高考真題(理))演講比賽共有9位評委分別給出某選手的原始評分,評定該選手的成績時,從9個原始評分中去掉1個最高分、1個最低分,得到7個有效評分.7個有效評分與9個原始評分相比,不變的數(shù)字特征是A.中位數(shù) B.平均數(shù)C.方差 D.極差【答案】A【解析】設9位評委評分按從小到大排列為.則①原始中位數(shù)為,去掉最低分,最高分,后剩余,中位數(shù)仍為,A正確.②原始平均數(shù),后來平均數(shù)平均數(shù)受極端值影響較大,與不一定相同,B不正確③由②易知,C不正確.④原極差,后來極差可能相等可能變小,D不正確.2.(2020·全國高考真題(文))設一組樣本數(shù)據(jù)x1,x2,…,xn的方差為0.01,則數(shù)據(jù)10x1,10x2,…,10xn的方差為()A.0.01 B.0.1 C.1 D.10【答案】C【解析】因為數(shù)據(jù)的方差是數(shù)據(jù)的方差的倍,所以所求數(shù)據(jù)方差為故選:C【總結(jié)提升】1.眾數(shù)、中位數(shù)、平均數(shù)、方差的意義及常用結(jié)論(1)平均數(shù)與方差都是重要的數(shù)字特征,是對總體的一種簡明的描述,它們所反映的情況有著重要的實際意義,平均數(shù)、中位數(shù)、眾數(shù)描述其集中趨勢,方差和標準差描述波動大?。?2)方差的簡化計算公式:s2=eq\f(1,n)[(xeq\o\al(2,1)+xeq\o\al(2,2)+…+xeq\o\al(2,n))-neq\x\to(x)2]或?qū)懗蓅2=eq\f(1,n)(xeq\o\al(2,1)+xeq\o\al(2,2)+…+xeq\o\al(2,n))-eq\x\to(x)2,即方差等于原數(shù)據(jù)平方的平均數(shù)減去平均數(shù)的平方.2.主要命題角度:(1)樣本的數(shù)字特征與頻率分布直方圖交匯(2)樣本的數(shù)字特征與莖葉圖交匯=1\*GB3①在使用莖葉圖時,一定要觀察所有的樣本數(shù)據(jù),弄清楚這個圖中數(shù)字的特點,不要漏掉了數(shù)據(jù),也不要混淆莖葉圖中莖與葉的含義.=2\*GB3②莖葉圖既可以表示兩組數(shù)據(jù),也可以表示一組數(shù)據(jù),用它表示的數(shù)據(jù)是完整的數(shù)據(jù),因此可以從莖葉圖中看出數(shù)據(jù)的眾數(shù)(數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù))、中位數(shù)(中間位置的一個數(shù),或中間兩個數(shù)的平均數(shù))等.(3)樣本的數(shù)字特征與優(yōu)化決策問題交匯:利用樣本的數(shù)字特征解決優(yōu)化決策問題的依據(jù)=1\*GB3①平均數(shù)反映了數(shù)據(jù)取值的平均水平;標準差、方差描述了一組數(shù)據(jù)圍繞平均數(shù)波動的大?。畼藴什睢⒎讲钤酱?,數(shù)據(jù)的離散程度越大,越不穩(wěn)定;標準差、方差越小,數(shù)據(jù)的離散程度越小,越穩(wěn)定.=2\*GB3②用樣本估計總體就是利用樣本的數(shù)字特征來描述總體的數(shù)字特征.考點五相關(guān)關(guān)系的判斷【典例9】對變量x,y有觀測數(shù)據(jù)(xi,yi)(i=1,2,…,10),得散點圖如圖①,對變量u,v有觀測數(shù)據(jù)(ui,vi)(i=1,2,…,10),得散點圖如圖②.由這兩個散點圖可以判斷()A.變量x與y正相關(guān),u與v正相關(guān)B.變量x與y正相關(guān),u與v負相關(guān)C.變量x與y負相關(guān),u與v正相關(guān)D.變量x與y負相關(guān),u與v負相關(guān)【答案】C【解析】由散點圖可得兩組數(shù)據(jù)均線性相關(guān),且圖①的線性回歸方程斜率為負,圖②的線性回歸方程斜率為正,則由散點圖可判斷變量x與y負相關(guān),u與v正相關(guān).【典例10】(2020·云南師大附中高二期中)已知變量和滿足關(guān)系,變量與負相關(guān).下列結(jié)論正確的是()A.與負相關(guān),與負相關(guān) B.與負相關(guān),與正相關(guān)C.與正相關(guān),與負相關(guān) D.與正相關(guān),與正相關(guān)【答案】C【解析】因為變量和滿足關(guān)系,,所以和正相關(guān),又因為與負相關(guān),設,所以,可得,,所以與負相關(guān),所以與正相關(guān),與負相關(guān),故選:C【總結(jié)提升】判斷相關(guān)關(guān)系的2種方法(1)散點圖法:如果所有的樣本點都落在某一函數(shù)的曲線附近,變量之間就有相關(guān)關(guān)系.如果所有的樣本點都落在某一直線附近,變量之間就有線性相關(guān)關(guān)系.(2)相關(guān)系數(shù)法:利用相關(guān)系數(shù)判定,當|r|越趨近于1相關(guān)性越強.【變式探究】(2019·鄭州市第一次質(zhì)量預測)某商家今年上半年各月的人均銷售額(單位:千元)與利潤率統(tǒng)計表如下:月份123456人均銷售額658347利潤率(%)12.610.418.53.08.116.3根據(jù)表中數(shù)據(jù),下列說法正確的是()A.利潤率與人均銷售額成正相關(guān)關(guān)系B.利潤率與人均銷售額成負相關(guān)關(guān)系C.利潤率與人均銷售額成正比例函數(shù)關(guān)系D.利潤率與人均銷售額成反比例函數(shù)關(guān)系【答案】A【解析】畫出利潤率與人均銷售額的散點圖,如圖.由圖可知利潤率與人均銷售額成正相關(guān)關(guān)系,故選A.考點六線性回歸方程、回歸分析【典例11】(2018·全國高考真題(文))下圖是某地區(qū)2000年至2016年環(huán)境基礎(chǔ)設施投資額(單位:億元)的折線圖.為了預測該地區(qū)2018年的環(huán)境基礎(chǔ)設施投資額,建立了與時間變量的兩個線性回歸模型.根據(jù)2000年至2016年的數(shù)據(jù)(時間變量的值依次為)建立模型①:;根據(jù)2010年至2016年的數(shù)據(jù)(時間變量的值依次為)建立模型②:.(1)分別利用這兩個模型,求該地區(qū)2018年的環(huán)境基礎(chǔ)設施投資額的預測值;(2)你認為用哪個模型得到的預測值更可靠?并說明理由.【答案】(1)利用模型①預測值為226.1,利用模型②預測值為256.5,(2)利用模型②得到的預測值更可靠.【解析】(1)利用模型①,該地區(qū)2018年的環(huán)境基礎(chǔ)設施投資額的預測值為=–30.4+13.5×19=226.1(億元).利用模型②,該地區(qū)2018年的環(huán)境基礎(chǔ)設施投資額的預測值為=99+17.5×9=256.5(億元).(2)利用模型②得到的預測值更可靠.理由如下:(i)從折線圖可以看出,2000年至2016年的數(shù)據(jù)對應的點沒有隨機散布在直線y=–30.4+13.5t上下,這說明利用2000年至2016年的數(shù)據(jù)建立的線性模型①不能很好地描述環(huán)境基礎(chǔ)設施投資額的變化趨勢.2010年相對2009年的環(huán)境基礎(chǔ)設施投資額有明顯增加,2010年至2016年的數(shù)據(jù)對應的點位于一條直線的附近,這說明從2010年開始環(huán)境基礎(chǔ)設施投資額的變化規(guī)律呈線性增長趨勢,利用2010年至2016年的數(shù)據(jù)建立的線性模型=99+17.5t可以較好地描述2010年以后的環(huán)境基礎(chǔ)設施投資額的變化趨勢,因此利用模型②得到的預測值更可靠.(ii)從計算結(jié)果看,相對于2016年的環(huán)境基礎(chǔ)設施投資額220億元,由模型①得到的預測值226.1億元的增幅明顯偏低,而利用模型②得到的預測值的增幅比較合理,說明利用模型②得到的預測值更可靠.【典例12】(2020·全國高考真題(理))某沙漠地區(qū)經(jīng)過治理,生態(tài)系統(tǒng)得到很大改善,野生動物數(shù)量有所增加.為調(diào)查該地區(qū)某種野生動物的數(shù)量,將其分成面積相近的200個地塊,從這些地塊中用簡單隨機抽樣的方法抽取20個作為樣區(qū),調(diào)查得到樣本數(shù)據(jù)(xi,yi)(i=1,2,…,20),其中xi和yi分別表示第i個樣區(qū)的植物覆蓋面積(單位:公頃)和這種野生動物的數(shù)量,并計算得,,,,.(1)求該地區(qū)這種野生動物數(shù)量的估計值(這種野生動物數(shù)量的估計值等于樣區(qū)這種野生動物數(shù)量的平均數(shù)乘以地塊數(shù));(2)求樣本(xi,yi)(i=1,2,…,20)的相關(guān)系數(shù)(精確到0.01);(3)根據(jù)現(xiàn)有統(tǒng)計資料,各地塊間植物覆蓋面積差異很大.為提高樣本的代表性以獲得該地區(qū)這種野生動物數(shù)量更準確的估計,請給出一種你認為更合理的抽樣方法,并說明理由.附:相關(guān)系數(shù)r=,≈1.414.【答案】(1);(2);(3)詳見解析【解析】(1)樣區(qū)野生動物平均數(shù)為,地塊數(shù)為200,該地區(qū)這種野生動物的估計值為(2)樣本(i=1,2,…,20)的相關(guān)系數(shù)為(3)由(2)知各樣區(qū)的這種野生動物的數(shù)量與植物覆蓋面積有很強的正相關(guān)性,由于各地塊間植物覆蓋面積差異很大,從俄各地塊間這種野生動物的數(shù)量差異很大,采用分層抽樣的方法較好地保持了樣本結(jié)構(gòu)與總體結(jié)構(gòu)得以執(zhí)行,提高了樣本的代表性,從而可以獲得該地區(qū)這種野生動物數(shù)量更準確的估計.【總結(jié)提升】一、線性回歸分析問題的類型及解題方法1.求線性回歸方程(1)利用公式,求出回歸系數(shù)eq\o(b,\s\up6(^)),eq\o(a,\s\up6(^)).(2)待定系數(shù)法:利用回歸直線過樣本點的中心求系數(shù).2.利用回歸方程進行預測,把線性回歸方程看作一次函數(shù),求函數(shù)值.3.利用回歸直線判斷正、負相關(guān),決定正相關(guān)還是負相關(guān)的是系數(shù)eq\o(b,\s\up6(^)).二、模型擬合效果的判斷(1)殘差平方和越小,模型的擬合效果越好.(2)相關(guān)指數(shù)R2越大,模型的擬合效果越好.(3)回歸方程的擬合效果,可以利用相關(guān)系數(shù)判斷,當|r|越趨近于1時,兩變量的線性相關(guān)性越強.【變式探究】1.(2017·山東高考真題(理))為了研究某班學生的腳長(單位厘米)和身高(單位厘米)的關(guān)系,從該班隨機抽取名學生,根據(jù)測量數(shù)據(jù)的散點圖可以看出與之間有線性相關(guān)關(guān)系,設其回歸直線方程為.已知,,.該班某學生的腳長為,據(jù)此估計其身高為()A. B. C. D.【答案】C【解析】由已知,,故選C.2.(2020·河南鄭州一中高三期中(文))新型冠狀病毒肺炎COVID-19疫情發(fā)生以來,在世界各地逐漸蔓延.在全國人民的共同努力和各級部門的嚴格管控下,我國的疫情已經(jīng)得到了很好的控制.然而,小王同學發(fā)現(xiàn),每個國家在疫情發(fā)生的初期,由于認識不足和措施不到位,感染人數(shù)都會出現(xiàn)快速的增長.下表是小王同學記錄的某國連續(xù)8天每日新型冠狀病毒感染確診的累計人數(shù).日期代碼x12345678累計確診人數(shù)y.481631517197122為了分析該國累計感染人數(shù)的變化趨勢,小王同學分別用兩桿模型:①,②對變量x和y的關(guān)系進行擬合,得到相應的回歸方程并進行殘差分析,殘差圖如下(注:殘差):經(jīng)過計算得,,,,其中,.(1)根據(jù)殘差圖,比較模型①,②的擬合效果,應該選擇哪個模型?并簡要說明理由;(2)根據(jù)(1)問選定的模型求出相應的回歸方程(系數(shù)均保留兩位小數(shù));(3)由于時差,該國截止第9天新型冠狀病毒感染確診的累計人數(shù)尚未公布.小王同學認為,如果防疫形勢沒有得到明顯改善,在數(shù)據(jù)公布之前可以根據(jù)他在(2)問求出的回歸方程來對感染人數(shù)做出預測,那么估計該地區(qū)第9天新型冠狀病毒感染確診的累計人數(shù)是多少?附:回歸直線的斜率和截距的最小二乘估計公式分別為:,【答案】(1)選擇模型①,理由見解析;(2);(3)157人.【解析】(1)選擇模型①.理由如下:根據(jù)殘差圖可以看出,模型①的估計值和真實值相對比較接近,模型②的殘差相對較大一些,所以模型①的擬合效果相對較好(2)由(1),知y關(guān)于x的回歸方程為,令,則.由所給數(shù)據(jù)得:,.,∴y關(guān)于x的回歸方程為(3)將代入上式,得(人)所以預測該地區(qū)第9天新型冠狀病毒感染確診的累計人數(shù)為157人.【總結(jié)提升】一般地,建立回歸模型的基本步驟為:(1)確定研究對象,明確哪個變量是解釋變量,哪個變量是預報變量.(2)畫出解釋變量和預報變量的散點圖,觀察它們之間的關(guān)系(如是否存在線性關(guān)系等).(3)由經(jīng)驗確定回歸方程的類型(如我們觀察到數(shù)據(jù)呈線性關(guān)系,則選用線性回歸方程).(4)按一定規(guī)則(如最小二乘法)估計回歸方程中的參數(shù).(5)得出結(jié)果后分析殘差圖是否有異常(如個別數(shù)據(jù)對應殘差過大,殘差呈現(xiàn)不隨機的規(guī)律性等).若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等.考點七獨立性檢驗【典例13】(2019·全國高考真題(文))某商場為提高服務質(zhì)量,隨機調(diào)查了50名男顧客和50名女顧客,每位顧客對該商場的服務給出滿意或不滿意的評價,得到下面列聯(lián)表:滿意不滿意男顧客4010女顧客3020(1)分別估計男、女顧客對該商場服務滿意的概率;(2)能否有95%的把握認為男、女顧客對該商場服務的評價有差異?附:.P(K2≥k)0.0500.0100.001k3.8416.63510.828【答案】(1);(2)能有的把握認為男、女顧客對該商場服務的評價有差異.【解析】(1)由題中表格可知,50名男顧客對商場服務滿意的有40人,所以男顧客對商場服務滿意率估計為,50名女顧客對商場滿意的有30人,所以女顧客對商場服務滿意率估計為,(2)由列聯(lián)表可知,所以能有的把握認為男、女顧客對該商場服務的評價有差異.【典例14】(2017·全國高考真題(文))海水養(yǎng)殖場進行某水產(chǎn)品的新、舊網(wǎng)箱養(yǎng)殖方法的產(chǎn)量對比,收獲時各隨機抽取了100個網(wǎng)箱,測量各箱水產(chǎn)品的產(chǎn)量(單位:kg),其頻率分布直方圖如下:(1)記A表示事件“舊養(yǎng)殖法的箱產(chǎn)量低于50kg”,估計A的概率;(2)填寫下面列聯(lián)表,并根據(jù)列聯(lián)表判斷是否有99%的把握認為箱產(chǎn)量與養(yǎng)殖方法有關(guān):箱產(chǎn)量<50kg箱產(chǎn)量≥50kg舊養(yǎng)殖法新養(yǎng)殖法(3)根據(jù)箱產(chǎn)量的頻率分布直方圖,對兩種養(yǎng)殖方法的優(yōu)劣進行較.附:P(K2≥k)0.0500.0100.001k3.8416.63510.828【答案】(1)0.62(2)有99%的把握(3)新養(yǎng)殖法優(yōu)于舊養(yǎng)殖法【解析】(1)舊養(yǎng)殖法的箱產(chǎn)量低于50kg的頻率為(0.012+0.014+0.024+0.034+0.04
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年(全新版)中國小肽市場前景展望與投資發(fā)展戰(zhàn)略分析報告
- 2025-2030年中國高爾夫產(chǎn)業(yè)規(guī)模分析及投資前景規(guī)劃研究報告
- 2025-2030年中國雪茄市場運行現(xiàn)狀及投資發(fā)展前景預測報告
- 2025年戶外廣告牌租賃合同(含稅)2篇
- 二零二五年度工業(yè)用地廠房買賣合同(含項目融資)3篇
- 典當行員工激勵與績效管理考核試卷
- 二手房首付款支付與退款協(xié)議(2024年度)3篇
- 醫(yī)院科研項目管理知識考核試卷
- 2025年度智能門窗定制與安裝一體化服務合同
- 農(nóng)業(yè)機械租賃設備操作安全考核試卷
- 割接方案的要點、難點及采取的相應措施
- 2025年副護士長競聘演講稿(3篇)
- 2025至2031年中國臺式燃氣灶行業(yè)投資前景及策略咨詢研究報告
- 原發(fā)性腎病綜合征護理
- 第三章第一節(jié)《多變的天氣》說課稿2023-2024學年人教版地理七年級上冊
- 2025年中國電科集團春季招聘高頻重點提升(共500題)附帶答案詳解
- 2025年度建筑施工現(xiàn)場安全管理合同2篇
- 福建省廈門市2023-2024學年高二上學期期末考試語文試題(解析版)
- 加油站施工情況報告安裝
- 分子標記及遺傳連鎖圖譜
- 防火墻施工組織設計
評論
0/150
提交評論