高三數(shù)一輪復習 第十章 統(tǒng)計、統(tǒng)計案例及算法初步(4課時)講解與練習 文_第1頁
高三數(shù)一輪復習 第十章 統(tǒng)計、統(tǒng)計案例及算法初步(4課時)講解與練習 文_第2頁
高三數(shù)一輪復習 第十章 統(tǒng)計、統(tǒng)計案例及算法初步(4課時)講解與練習 文_第3頁
高三數(shù)一輪復習 第十章 統(tǒng)計、統(tǒng)計案例及算法初步(4課時)講解與練習 文_第4頁
高三數(shù)一輪復習 第十章 統(tǒng)計、統(tǒng)計案例及算法初步(4課時)講解與練習 文_第5頁
已閱讀5頁,還剩60頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

eq\a\vs4\al(第一節(jié)隨機抽樣)[備考方向要明了]考什么怎么考1.理解隨機抽樣的必要性和重要性.2.會用簡單隨機抽樣方法從總體中抽取樣本,了解分層抽樣和系統(tǒng)抽樣.對隨機抽樣(尤其是分層抽樣)的考查,幾乎年年都出現(xiàn)在高考試題中,題型以選擇題和填空題為主,難度較低,如年江蘇T2,福建T14等.[歸納·知識整合]1.簡單隨機抽樣(1)抽取方式:不放回抽取;(2)每個個體被抽到的概率相等;(3)常用方法:抽簽法和隨機數(shù)法.[探究]1.簡單隨機抽樣有什么特點?提示:(1)被抽取樣本的總體個數(shù)N是有限的;(2)樣本是從總體中逐個抽取的;(3)是一種不放回抽樣;(4)是等可能的抽?。?.系統(tǒng)抽樣的步驟假設要從容量為N的總體中抽取容量為n的樣本.(1)先將總體的N個個體編號;(2)確定分段間隔k,對編號進行分段.當eq\f(N,n)(n是樣本容量)是整數(shù)時,取k=eq\f(N,n);(3)在第1段用簡單隨機抽樣確定第一個個體編號l(l≤k);(4)按照一定的規(guī)則抽取樣本,通常是將l加上間隔k得到第2個個體編號l+k,再加k得到第3個個體編號l+2k,依次進行下去,直到獲取整個樣本.[探究]2.系統(tǒng)抽樣有什么特點?提示:適用于元素個數(shù)很多且均衡的總體;各個個體被抽到的機會均等;總體分組后,在起始部分抽樣時,采用簡單隨機抽樣.3.分層抽樣(1)定義:在抽樣時,將總體分成互不交叉的層,然后按照一定的比例,從各層獨立地抽取一定數(shù)量的個體,將各層取出的個體合在一起作為樣本,這種抽樣方法是一種分層抽樣.(2)分層抽樣的應用范圍:當總體是由差異明顯的幾個部分組成時,往往選用分層抽樣.[探究]3.分層抽樣有什么特點?提示:適用于總體由差異明顯的幾部分組成的情況;分層后,在每一層抽樣時可采用簡單隨機抽樣或系統(tǒng)抽樣.[自測·牛刀小試]1.在抽樣過程中,每次抽取的個體不再放回總體的為不放回抽樣,在分層抽樣、系統(tǒng)抽樣、簡單隨機抽樣三種抽樣中,不放回抽樣有()A.0個 B.1個C.2個 D.3個解析:選D三種抽樣都是不放回抽樣.2.(·溫州模擬)某工廠生產A,B,C三種不同型號的產品,產品數(shù)量之比為3∶4∶7,現(xiàn)在用分層抽樣的方法抽出容量為n的樣本,樣本中A型號產品有15件,那么樣本容量n為()A.50 B.60C.70 D.80解析:選C由分層抽樣的方法得eq\f(3,3+4+7)×n=15,解得n=70.3.利用簡單隨機抽樣,從n個個體中抽取一個容量為10的樣本.若第二次抽取時,余下的每個個體被抽到的概率為eq\f(1,3),則在整個抽樣過程中,每個個體被抽到的概率為()A.eq\f(1,3) B.eq\f(5,14)C.eq\f(1,4) D.eq\f(10,27)解析:選B由題意知eq\f(9,n-1)=eq\f(1,3),解得n=28.故P=eq\f(10,28)=eq\f(5,14).4.某單位青年、中年、老年職員的人數(shù)之比為10∶8∶7,從中抽取200名職員作為樣本,若每人被抽到的概率為0.2,則該單位青年職員的人數(shù)為________.解析:總人數(shù)為eq\f(200,0.2)=1000,該單位青年職員的人數(shù)為1000×eq\f(10,25)=400.答案:4005.(·湖北高考)一支田徑運動隊有男運動員56人,女運動員42人.現(xiàn)用分層抽樣的方法抽取若干人,若抽取的男運動員有8人,則抽取的女運動員有________人.解析:分層抽樣的特點是按照各層占總體的比抽取樣本,設抽取的女運動員有x人,則eq\f(x,8)=eq\f(42,56),解得x=6.答案:6簡單隨機抽樣[例1]為了支援我國西部教育事業(yè),決定從級學生報名的30名志愿者中,選取10人組成志愿小組,請用抽簽法和隨機數(shù)表法設計抽樣方案.[自主解答]抽簽法:第一步:將30名志愿者編號,編號為1,2,3,…,30.第二步:將30個號碼分別寫在30張外觀完全相同的紙條上,并揉成團,制成號簽.第三步:將30個號簽放入一個不透明的盒子中,充分攪勻.第四步:從盒子中逐個抽取10個號簽,并記錄上面的編號.第五步:所得號碼對應的志愿者,就是志愿小組的成員.隨機數(shù)法:第一步:將30名志愿者編號,編號為01,02,03,…,30.第二步:在隨機數(shù)表中任選一數(shù)開始,按某一確定方向讀數(shù).第三步:凡不在01~30中的數(shù)或已讀過的數(shù),都跳過去不作記錄,依次記錄下10個得數(shù).第四步:找出號碼與記錄的數(shù)相同的志愿者組成志愿小組.把本例中“30名志愿者”改為“1800名志愿者”,仍抽取10人,應如何進行抽樣?解:因為總體數(shù)較大,若選用抽簽法制簽太麻煩,故應選用隨機數(shù)法.第一步:先將1800名志愿者編號,可以編為0001,0002,0003,…,1800.第二步:在隨機數(shù)表中任選一個數(shù),例如選出第2行第1列的數(shù)9.第三步:從選定的數(shù)開始向右讀,依次可得以0736,0751,0732,1355,1410,1256,0503,1557,1210,1421為樣本的10個號碼,這樣我們就得到一個容量為10的樣本.———————————————————應用簡單隨機抽樣應注意的問題(1)一個抽樣試驗能否用抽簽法,關鍵看兩點:一是抽簽是否方便;二是號簽是否易攪勻.一般地,當總體容量和樣本容量都較小時可用抽簽法.(2)在使用隨機數(shù)表時,如遇到三位數(shù)或四位數(shù)時,可從選擇的隨機數(shù)表中的某行某列的數(shù)字計起,每三個或四個作為一個單位,自左向右選取,有超過總體號碼或出現(xiàn)重復號碼的數(shù)字舍去.1.今用簡單隨機抽樣從含有6個個體的總體中抽取一個容量為2的樣本.問:(1)總體中的某一個體a在第一次抽取時被抽到的概率是多少?(2)個體a不是在第一次被抽到,而是在第二次被抽到的概率是多少?(3)在整個抽樣過程中,個體a被抽到的概率是多少?解:①用簡單隨機抽樣,從含有N個個體的總體中抽取一個容量為n的樣本,每次抽取一個個體時任一個體被抽到的概率為eq\f(1,N);在整個抽樣過程中各個個體被抽到的概率為eq\f(n,N);②抽簽有先后,但概率都是相同的.故(1)eq\f(1,6);(2)eq\f(1,6);(3)eq\f(1,3).系統(tǒng)抽樣[例2](·山東高考)采用系統(tǒng)抽樣方法從960人中抽取32人做問卷調查,為此將他們隨機編號為1,2,…,960,分組后在第一組采用簡單隨機抽樣的方法抽到的號碼為9.抽到的32人中,編號落入?yún)^(qū)間[1,450]的人做問卷A,編號落入?yún)^(qū)間[451,750]的人做問卷B,其余的人做問卷C,則抽到的人中,做問卷B的人數(shù)為()A.7 B.9C.10 D.15[自主解答]第n個抽到的編號為9+(n-1)×30=30n-21,由題意得451≤30n-21≤750,解得15eq\f(11,15)≤n≤25eq\f(7,10).又n∈Z,故滿足條件的共有10個.[答案]C———————————————————解決系統(tǒng)抽樣應注意的幾個問題(1)適合元素個數(shù)較多且均衡的總體;(2)各個個體被抽到的機會均等;(3)樣本的第一個個體用簡單隨機抽樣.2.為規(guī)范學校辦學,省教育廳督察組對某所高中進行了抽樣調查.抽到的班級一共有52名學生,現(xiàn)將該班學生隨機編號,用系統(tǒng)抽樣的方法抽取一個容量為4的樣本,已知7號、33號、46號同學在樣本中,那么樣本中還有一位同學的編號應是()A.13 B.19C.20 D.51解析:選C由系統(tǒng)抽樣的原理知抽樣的間隔為eq\f(52,4)=13,故抽取的樣本的編號分別為7,7+13,7+13×2,7+13×3,從而可知選C.分層抽樣[例3]某學校共有教職工900人,分成三個批次進行教育培訓,在三個批次中男、女教職工人數(shù)如下表所示.已知在全體教職工中隨機抽取1名,抽到第二批次中女教職工的概率是0.16.第一批次第二批次第三批次女教職工196xy男教職工204156z(1)求x的值;(2)現(xiàn)用分層抽樣的方法在全體教職工中抽取54名做培訓效果的調查,問應在第三批次中抽取教職工多少名?[自主解答](1)由eq\f(x,900)=0.16,解得x=144.(2)第三批次的人數(shù)為y+z=900-(196+204+144+156)=200,設應在第三批次中抽取m名,則eq\f(m,200)=eq\f(54,900),解得m=12.故應在第三批次中抽取12名教職工.———————————————————分層抽樣的步驟第一步:將總體按一定標準分層;第二步:計算各層的個體數(shù)與總體數(shù)的比,按各層個體數(shù)占總體數(shù)的比確定各層應抽取的樣本容量;第三步:在每一層進行抽樣(可用簡單隨機抽樣或系統(tǒng)抽樣).3.(·天津高考)某地區(qū)有小學150所,中學75所,大學25所.現(xiàn)采用分層抽樣的方法從這些學校中抽取30所學校對學生進行視力調查,應從小學中抽取____________所學校,中學中抽取____________所學校.解析:從小學中抽取30×eq\f(150,150+75+25)=18所學校;從中學中抽取30×eq\f(75,150+75+25)=9所學校.答案:1891組比較——三種抽樣方法的比較類別共同點各自特點相互聯(lián)系適用范圍簡單隨機抽樣抽樣過程中每個個體被抽取的機會相等從總體中逐個抽取總體中的個體數(shù)較少系統(tǒng)抽樣將總體均分成幾部分,按事先確定的規(guī)則在各部分抽取在起始部分抽樣時采用簡單隨機抽樣總體中的個體數(shù)較多分層抽樣將總體分成幾層進行抽取各層抽樣時采用簡單隨機抽樣或系統(tǒng)抽樣總體由差異明顯的幾部分組成易誤警示——抽樣方法中的解題誤區(qū)[典例](·江蘇高考)某學校高一、高二、高三年級的學生人數(shù)之比是3∶3∶4,現(xiàn)用分層抽樣的方法從該校高中三個年級的學生中抽取容量為50的樣本,則應從高二年級抽取________名學生.[解析]由題意得高二年級的學生人數(shù)占該學校高中人數(shù)的eq\f(3,10),利用分層抽樣的有關知識得應從高二年級抽取50×eq\f(3,10)=15名學生.[答案]15eq\a\vs4\al([易誤辨析])1.因不能正確確認抽樣的比例從而導致失誤.2.在求解過程中計算失誤.3.解答隨機抽樣問題時,還有以下幾點容易造成失誤:(1)分不清系統(tǒng)抽樣中各段入樣的個體編號成等差數(shù)列;(2)分層抽樣中各層所占的比例不準確;(3)系統(tǒng)抽樣時總體容量不能被樣本容量整除時,不知隨機從總體中剔除余數(shù);分層抽樣時所取各層個體數(shù)不是整數(shù)時,不會微調個體數(shù)目.eq\a\vs4\al([變式訓練])1.從2006名學生中選取50名組成參觀團,若采用下面的方法選取:先用簡單隨機抽樣從2006人中剔除6人,剩下的2000人再按照系統(tǒng)抽樣的方法進行,則每人入選的概率()A.不全相等 B.均不相等C.都相等,且為eq\f(25,1003) D.都相等,且為eq\f(1,40)解析:選C抽樣過程中每個個體被抽取的機會均等,概率相等,剔除后的抽取過程與從人中抽取50人,每人入選的概率相同,其概率為eq\f(50,2006)=eq\f(25,1003).2.中央電視臺在因特網上就觀眾對年春節(jié)晚會這一節(jié)目的喜愛程度進行調查,參加調查的總人數(shù)為12000,其中持各種態(tài)度的人數(shù)如表所示:很喜愛喜愛一般不喜愛2435460039261039電視臺為進一步了解觀眾的具體想法和意見,打算從中抽取60人進行更為詳細的調查,其中持“喜愛”態(tài)度的觀眾應抽取________人.解析:由于樣本容量與總體容量的比為eq\f(60,12000)=eq\f(1,200),故應抽取“喜愛”態(tài)度的觀眾人數(shù)為4600×eq\f(1,200)=23(人).答案:23一、選擇題(本大題共6小題,每小題5分,共30分)1.下列抽取樣本的方式是簡單隨機抽樣的有()①從無限多個個體中抽取50個個體作為樣本;②箱子里有100支鉛筆,今從中選取10支進行檢驗.在抽樣操作時,從中任意拿出一支檢測后再放回箱子里;③從50個個體中一次性抽取5個個體作為樣本.A.0個 B.1個C.2個 D.3個解析:選A①不滿足樣本的總體數(shù)較少的特點;②不滿足不放回抽取的特點;③不滿足逐個抽取的特點.2.某校高三年級有男生500人,女生400人,為了解該年級學生的健康情況,從男生中任意抽取25人,從女生中任意抽取20人進行調查.這種抽樣方法是()A.簡單隨機抽樣法 B.抽簽法C.隨機數(shù)表法 D.分層抽樣法解析:選D由于總體容量較大,且男、女生健康差異明顯,因此采用分層抽樣方法抽取樣本.3.(·浙江高考改編)某個年級有男生560人,女生420人,用分層抽樣的方法從該年級全體學生中抽取一個容量為280的樣本,則此樣本中男生人數(shù)為()A.80 B.120C.160 D.240解析:選C設樣本中男、女生分別為x,y,且x∶y=4∶3,所以x=280×eq\f(4,7)=160.4.800名學生中抽50名學生做牙齒健康檢查.現(xiàn)將800名學生從1到800進行編號,求得間隔數(shù)k=eq\f(800,50)=16,即每16人抽取一個人.在1~16中隨機抽取一個數(shù),如果抽到的是7,則從33~48這16個數(shù)中應取的數(shù)是()A.40 B.39C.38 D.37解析:選B按系統(tǒng)抽樣分組,33~48這16個數(shù)屬第3組,則這一組應抽到的數(shù)是7+2×16=39.5.某工廠有A,B,C三種不同型號的產品,這三種產品數(shù)量之比為2∶3∶5,現(xiàn)用分層抽樣從中抽出一個容量為n的樣本,該樣本中A種型號產品有8件,那么這次樣本的容量n是()A.12 B.16C.20 D.40解析:選D設三種產品的數(shù)量之和為2k+3k+5k=10k,依題意有eq\f(n,10k)=eq\f(8,2k),解得n=40.6.在100個零件中,有一級品20個,二級品30個,三級品50個,從中抽取20個作為樣本:①采用隨機抽樣法,將零件編號為00,01,02,…,99,抽出20個;②采用系統(tǒng)抽樣法,將所有零件分成20組,每組5個,然后每組中隨機抽取1個;③采用分層抽樣法,隨機從一級品中抽取4個,二級品中抽取6個,三級品中抽取10個,則()A.不論采取哪種抽樣方法,這100個零件中每個被抽到的概率都是eq\f(1,5)B.①②兩種抽樣方法,這100個零件中每個被抽到的概率都是eq\f(1,5),③并非如此C.①③兩種抽樣方法,這100個零件中每個被抽到的概率都是eq\f(1,5),②并非如此D.采用不同的抽樣方法,這100個零件中每個被抽到的概率各不相同解析:選A由抽樣方法的性質知,抽樣過程中每個個體被抽到的概率都相等,這個比例只與樣本容量和總體有關.二、填空題(本大題共3小題,每小題5分,共15分)7.某高中共有學生2000名,已知在全校學生中隨機抽取1名,抽到高三年級男生的概率是0.1現(xiàn)用分層抽樣的方法在全校抽取若干名學生參加社區(qū)服務,相關信息如下表:年級高一高二高三男生(人數(shù))a310b女生(人數(shù))cd200抽樣人數(shù)x1510則x=________.解析:由eq\f(b,2000)=0.1,可得b=200.設在全校抽取n名學生參加社區(qū)服務,則有eq\f(n,2000)=eq\f(10,200+200).解得n=50.故x=50-15-10=25.答案:258.將參加夏令營的600名學生編號為:001,002,…,600.采用系統(tǒng)抽樣方法抽取一個容量為50的樣本,且隨機抽得的號碼為003.這600名學生分住在三個營區(qū),從001到300在第Ⅰ營區(qū),從301到495在第Ⅱ營區(qū),從496到600在第Ⅲ營區(qū),三個營區(qū)被抽中的人數(shù)依次為________.解析:依題意及系統(tǒng)抽樣的意義可知,將這600名學生按編號依次分成50組,每一組各有12名學生,第k(k∈N*)組抽中的號碼為3+12(k-1).令3+12(k-1)≤300得k≤eq\f(103,4),因此第Ⅰ營區(qū)被抽中的人數(shù)是25,令300<3+12(k-1)≤495,得eq\f(103,4)<k≤42,因此第Ⅱ營區(qū)被抽中的人數(shù)是42-25=17.故第Ⅲ營區(qū)被抽中的人數(shù)是50-25-17=8.答案:25,17,89.某企業(yè)三月中旬生產A、B、C三種產品共3000件,根據(jù)分層抽樣的結果,企業(yè)統(tǒng)計員制作了如下的統(tǒng)計表格:產品類別ABC產品數(shù)量(件)1300樣本容量(件)130由于不小心,表格中A、C產品的有關數(shù)據(jù)已被污染看不清楚,統(tǒng)計員記得A產品的樣本容量比C產品的樣本容量多10,根據(jù)以上信息,可得C的產品數(shù)量是________.解析:設C產品的樣本容量為x,則A產品的樣本容量為10+x,由B知抽取的比例為eq\f(1,10),故x+10+x+130=300,解得x=80.所以C產品的數(shù)量為800.答案:800三、解答題(本大題共3小題,每小題12分,共36分)10.一次數(shù)學模擬考試,共12道選擇題,每題5分,共計60分,每道題有四個可供選擇的答案,僅有一個是正確的.學生小張只能確定其中10道題的正確答案,其余2道題完全靠猜測回答.小張所在班級共有40人,此次考試選擇題得分情況統(tǒng)計表:得分(分)4045505560百分率15%10%25%40%10%現(xiàn)采用分層抽樣的方法從此班抽取20人的試卷進行選擇題質量分析.(1)應抽取多少張選擇題得60分的試卷?(2)若小張選擇題得60分,求他的試卷被抽到的概率.解:(1)得60分的人數(shù)40×10%=4.設抽取x張選擇題得60分的試卷,則eq\f(40,20)=eq\f(4,x),即x=2.故應抽取2張選擇題得60分的試卷.(2)設小張的試卷為a1,另三名得60分的同學的試卷為a2,a3,a4,所有抽取60分試卷的方法為:(a1,a2),(a1,a3),(a1,a4),(a2,a3),(a2,a4),(a3,a4)共6種,其中小張的試卷被抽到的抽法共有3種,故小張的試卷被抽到的概率為P=eq\f(3,6)=eq\f(1,2).11.(·天津高考)某地區(qū)有小學21所,中學14所,大學7所,現(xiàn)采用分層抽樣的方法從這些學校中抽取6所學校對學生進行視力調查.(1)求應從小學、中學、大學中分別抽取的學校數(shù)目;(2)若從抽取的6所學校中隨機抽取2所學校做進一步數(shù)據(jù)分析,①列出所有可能的抽取結果;②求抽取的2所學校均為小學的概率.解:(1)從小學、中學、大學中分別抽取的學校數(shù)目為3,2,1.(2)①在抽取到的6所學校中,3所小學分別記為A1,A2,A3,2所中學分別記為A4,A5,大學記為A6,則抽取2所學校的所有可能結果為{A1,A2},{A1,A3},{A1,A4},{A1,A5},{A1,A6},{A2,A3},{A2,A4},{A2,A5},{A2,A6},{A3,A4},{A3,A5},{A3,A6},{A4,A5},{A4,A6},{A5,A6},共15種.②從6所學校中抽取的2所學校均為小學(記為事件B)的所有可能結果為{A1,A2},{A1,A3},{A2,A3},共3種,所以P(B)=eq\f(3,15)=eq\f(1,5).12.(·北京高考)近年來,某市為了促進生活垃圾的分類處理,將生活垃圾分為廚余垃圾、可回收物和其他垃圾三類,并分別設置了相應的垃圾箱.為調查居民生活垃圾分類投放情況,現(xiàn)隨機抽取了該市三類垃圾箱中總計1000噸生活垃圾,數(shù)據(jù)統(tǒng)計如下(單位:噸):“廚余垃圾”箱“可回收物”箱“其他垃圾”箱廚余垃圾400100100可回收物3024030其他垃圾202060(1)試估計廚余垃圾投放正確的概率;(2)試估計生活垃圾投放錯誤的概率;(3)假設廚余垃圾在“廚余垃圾”箱、“可回收物”箱、“其他垃圾”箱的投放量分別為a,b,c,其中a>0,a+b+c=600.當數(shù)據(jù)a,b,c的方差s2最大時,寫出a,b,c的值(結論不要求證明),并求此時s2的值.(注:s2=eq\f(1,n)[(x1-eq\x\to(x))2+(x2-eq\x\to(x))2+…+(xn-eq\x\to(x))2],其中eq\x\to(x)為數(shù)據(jù)x1,x2,…,xn的平均數(shù))解:(1)廚余垃圾投放正確的概率約為eq\f(“廚余垃圾”箱里廚余垃圾量,廚余垃圾總量)=eq\f(400,400+100+100)=eq\f(2,3).(2)設“生活垃圾投放錯誤”為事件A,則事件eq\x\to(A)表示“生活垃圾投放正確”.事件eq\x\to(A)的概率約為“廚余垃圾”箱里廚余垃圾量、“可回收物”箱里可回收物量與“其他垃圾”箱里其他垃圾量的總和除以生活垃圾總量,即P(eq\x\to(A))約為eq\f(400+240+60,1000)=0.7,所以P(A)約為1-0.7=0.3.(3)當a=600,b=c=0時,s2取得最大值.因為eq\x\to(x)=eq\f(1,3)(a+b+c)=200,所以s2=eq\f(1,3)×[(600-200)2+(0-200)2+(0-200)2]=80000.1.(·福建高考)一支田徑隊有男女運動員98人,其中男運動員有56人.按男女比例用分層抽樣的方法,從全體運動員中抽出一個容量為28的樣本,那么應抽取女運動員人數(shù)是________.解析:應抽取女運動員的人數(shù)為eq\f(98-56,98)×28=12.答案:122.某學校在校學生2000人,學校舉行了跑步和登山比賽,每人都參加且每人只參加其中一項比賽,各年級參加比賽的人數(shù)情況如下表:高一年級高二年級高三年級跑步人數(shù)abc登山人數(shù)xyz其中a:b:c=2∶5∶3,全校參加登山的人數(shù)占總人數(shù)的eq\f(1,4).為了了解學生對本次活動的滿意程度,按分層抽樣的方式從中抽取一個200人的樣本進行調查,則高三年級參加跑步的學生中應抽取()A.15人 B.30人C.40人 D.45人解析:選D由題意,全校參加跑步的人數(shù)占總人數(shù)的eq\f(3,4),高三年級參加跑步的總人數(shù)為eq\f(3,4)×2000×eq\f(3,10)=450,由分層抽樣的特征,得高三年級參加跑步的學生中應抽取eq\f(1,10)×450=45人.eq\a\vs4\al(第二節(jié)用樣本估計總體)[備考方向要明了]考什么怎么考1.了解分布的意義和作用,會列頻率分布表,會畫頻率分布直方圖、頻率折線圖、莖葉圖,理解它們各自的特點.2.理解樣本數(shù)據(jù)標準差的意義和作用,會計算數(shù)據(jù)標準差.3.能從樣本數(shù)據(jù)中提取基本的數(shù)字特征(平均數(shù)、標準差),并給出合理解釋.4.會用樣本的頻率分布估計總體的分布,會用樣本的基本數(shù)字特征估計總體的基本數(shù)字特征,理解用樣本估計總體的思想.5.會用隨機抽樣的基本方法和樣本估計總體的思想解決一些簡單的實際問題.1.由于高考對統(tǒng)計考查的覆蓋面廣,幾乎對所有的統(tǒng)計考點都有涉及,其中頻率分布直方圖、均值與方差、莖葉圖是核心,題型多是選擇題或填空題,難度不大,如年山東T4,T14,年湖南T13等.2.近幾年來,對概率統(tǒng)計的綜合問題考查的力度有所加大,題目難度中低檔,如年陜西T19,廣東T17等.[歸納·知識整合]1.作頻率分布直方圖的步驟(1)求極差(即一組數(shù)據(jù)中最大值與最小值的差);(2)決定組距與組數(shù);(3)將數(shù)據(jù)分組;(4)列頻率分布表;(5)畫頻率分布直方圖.2.頻率分布折線圖和總體密度曲線(1)頻率分布折線圖:連接頻率分布直方圖中各小長方形上端的中點,就得到頻率分布折線圖.(2)總體密度曲線:隨著樣本容量的增加,作圖時所分組數(shù)增加,組距減小,相應的頻率折線圖會越來越接近于一條光滑曲線,即總體密度曲線.3.莖葉圖的優(yōu)點莖葉圖的優(yōu)點是可以保留原始數(shù)據(jù),而且可以隨時記錄,方便記錄與表示.4.標準差和方差(1)標準差是樣本數(shù)據(jù)到平均數(shù)的一種平均距離.(2)標準差:s=eq\r(\f(1,n)[x1-\o(x,\s\up6(-))2+x2-\o(x,\s\up6(-))2+…+xn-\o(x,\s\up6(-))2]).(3)方差:s2=eq\f(1,n)[(x1-eq\o(x,\s\up6(-)))2+(x2-eq\o(x,\s\up6(-)))2+…+(xn-eq\o(x,\s\up6(-)))2](xn是樣本數(shù)據(jù),n是樣本容量,eq\x\to(x)是樣本平均數(shù)).5.利用頻率分布直方圖估計樣本的數(shù)字特征(1)中位數(shù):在頻率分布直方圖中,中位數(shù)左邊和右邊的直方圖的面積應該相等,由此可以估計中位數(shù)的值.(2)平均數(shù):平均數(shù)的估計值等于頻率分布直方圖中每個小矩形的面積乘以小矩形底邊中點的橫坐標之和.(3)眾數(shù):在頻率分布直方圖中,眾數(shù)是最高的矩形的中點的橫坐標.[探究]1.在頻率分布直方圖中如何確定中位數(shù)?提示:在頻率分布直方圖中,中位數(shù)左邊和右邊的直方圖的面積是相等的.2.利用莖葉圖求數(shù)據(jù)的中位數(shù)的步驟是什么?提示:(1)將莖葉圖中數(shù)據(jù)按大小順序排列;(2)找中間位置的數(shù).[自測·牛刀小試]1.(·山東高考)在某次測量中得到的A樣本數(shù)據(jù)如下:82,84,84,86,86,86,88,88,88,88.若B樣本數(shù)據(jù)恰好是A樣本數(shù)據(jù)每個都加2后所得數(shù)據(jù),則A,B兩樣本的下列數(shù)字特征對應相同的是()A.眾數(shù) B.平均數(shù)C.中位數(shù) D.標準差解析:選D只有標準差不變,其中眾數(shù)、平均數(shù)和中位數(shù)都加2.15557816133517122.(·安慶模擬)如圖是根據(jù)某校10位高一同學的身高(單位:cm)畫出的莖葉圖,其中左邊的數(shù)字從左到右分別表示學生身高的百位數(shù)字和十位數(shù)字,右邊的數(shù)字表示學生身高的個位數(shù)字,從圖中可以得到這10位同學身高的中位數(shù)是()A.161 B.162C.163 D.164解析:選B由給定的莖葉圖可知,這10位同學身高的中位數(shù)為eq\f(161+163,2)=162.3.某校舉行年元旦匯演,七位評委為某班的小品打出的分數(shù)如下莖葉統(tǒng)計圖,去掉一個最高分和一個最低分,所剩數(shù)據(jù)的方差為________.7984464793解析:由莖葉圖知,去掉一個最高分和一個最低分,所剩數(shù)據(jù)為84,84,86,84,87,所以由公式得方差為1.6.答案:1.64.從一堆蘋果中任取10只,稱得它們的質量如下(單位:克):125,120,122,105,130,114,116,95,120,134,則樣本數(shù)據(jù)落在[114.5,124.5)內的頻率為________.解析:數(shù)據(jù)落在[114.5,124.5)內的有:120,122,116,120共4個,故所求頻率為eq\f(4,10)=0.4.答案:0.45.(·大同模擬)將容量為n的樣本中的數(shù)據(jù)分為6組,繪制頻率分布直方圖,若第一組至第六組的數(shù)據(jù)的頻率之比為2∶3∶4∶6∶4∶1,且前三組數(shù)據(jù)的頻數(shù)之和為27,則n=________.解析:由已知,得eq\f(2+3+4,2+3+4+6+4+1)·n=27,即eq\f(9,20)·n=27,解得n=60.答案:60頻率分布直方圖的應用[例1](1)在樣本頻率分布直方圖中,共有11個小長方形,若中間一個小長方形的面積等于其他10個小長方形面積和的eq\f(1,4),且樣本容量為160,則中間一組的頻數(shù)為()A.32 B.0.2C.40 D.0.25(2)某區(qū)高二年級的一次數(shù)學統(tǒng)考中,隨機抽取200名同學的成績,成績全部在50分至100分之間,將成績按如下方式分成5組:第一組,成績大于等于50分且小于60分;第二組,成績大于等于60分且小于70分;……第五組,成績大于等于90分且小于等于100分,據(jù)此繪制了如圖所示的頻率分布直方圖.則這200名同學中成績大于等于80分且小于90分的學生有______名.[自主解答](1)由頻率分布直方圖的性質,可設中間一組的頻率為x,則x+4x=1,解得x=0.2.故中間一組的頻數(shù)為160×0.2=32.(2)由題知,成績大于等于80分且小于90分的學生所占的頻率為1-(0.005×2+0.025+0.045)×10=0.2,所以這200名同學中成績大于等于80分且小于90分的學生有200×0.2=40名.[答案](1)A(2)40———————————————————頻率分布直方圖反映了樣本的頻率分布(1)在頻率分布直方圖中縱坐標表示eq\f(頻率,組距),頻率=組距×eq\f(頻率,組距).(2)頻率分布表中頻率的和為1,故頻率分布直方圖中各長方形的面積和為1.1.已知一個樣本容量為100的樣本數(shù)據(jù)的頻率分布直方圖如圖所示,樣本數(shù)據(jù)落在[6,10)內的樣本頻數(shù)為________,樣本數(shù)據(jù)落在[2,10)內的頻率為________.解析:樣本數(shù)據(jù)落在[6,10)內的樣本頻數(shù)為0.08×4×100=32,樣本數(shù)據(jù)落在[2,10)內的頻率為(0.02+0.08)×4=0.4.答案:320.4數(shù)字特征的應用[例2](·安徽高考)甲、乙兩人在一次射擊比賽中各射靶5次,兩人成績的條形統(tǒng)計圖如圖所示,則()A.甲的成績的平均數(shù)小于乙的成績的平均數(shù)B.甲的成績的中位數(shù)等于乙的成績的中位數(shù)C.甲的成績的方差小于乙的成績的方差D.甲的成績的極差小于乙的成績的極差[自主解答]由題意可知,甲的成績?yōu)?,5,6,7,8,乙的成績?yōu)?,5,5,6,9.所以甲、乙的成績的平均數(shù)均為6,A錯;甲、乙的成績的中位數(shù)分別為6,5,B錯;甲、乙的成績的方差分別為eq\f(1,5)×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,eq\f(1,5)×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=eq\f(12,5),C對;甲、乙的成績的極差均為4,D錯.[答案]C———————————————————樣本數(shù)字特征及公式推廣(1)平均數(shù)和方差都是重要的數(shù)字特征,是對總體一種簡明的闡述.平均數(shù)、中位數(shù)、眾數(shù)描述總體的集中趨勢,方差和標準差描述波動大?。?2)平均數(shù)、方差公式的推廣若數(shù)據(jù)x1,x2,…,xn的平均數(shù)為eq\o(x,\s\up6(-)),方差為s2,則數(shù)據(jù)mx1+a,mx2+a,…,mxn+a的平均數(shù)為meq\o(x,\s\up6(-))+a,方差為m2s2.2.為了普及環(huán)保知識,增強環(huán)保意識,某大學隨機抽取30名學生參加環(huán)保知識測試,得分(十分制)如圖所示,假設得分值的中位數(shù)為me,眾數(shù)為m0,平均值為eq\x\to(x),則()A.me=m0=eq\x\to(x) B.me=m0<eq\x\to(x)C.me<m0<eq\x\to(x) D.m0<me<eq\x\to(x)解析:選D由圖可知,30名學生的得分情況依次為:2個人得3分,3個人得4分,10個人得5分,6個人得6分,3個人得7分,2個人得8分,2個人得9分,2個人得10分.中位數(shù)為第15,16個數(shù)(分別為5,6)的平均數(shù)即me=5.5,5出現(xiàn)次數(shù)最多,故m0=5,eq\x\to(x)=eq\f(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10,30)≈5.97.于是得m0<me<eq\x\to(x).莖葉圖的應用[例3]某校高三年級進行了一次數(shù)學測驗,隨機從甲、乙兩班各抽取6名同學,所得分數(shù)的莖葉圖如圖所示.甲班乙班2917080366272586(1)根據(jù)莖葉圖判斷哪個班的平均分數(shù)較高,并說明理由;(2)現(xiàn)從甲班這6名同學中隨機抽取兩名同學,求他們的分數(shù)之和大于165分的概率.[自主解答](1)因為乙班的成績集中在80分,且沒有低分,所以乙班的平均分比較高.(2)設從甲班中任取兩名同學,兩名同學分數(shù)之和超過165分為事件A.從甲班6名同學中任取兩名同學,則基本事件空間中包含了15個基本事件,又事件A中包含4個基本事件,所以,P(A)=eq\f(4,15).即從甲班中任取兩名同學,兩名同學分數(shù)之和超過165分的概率為eq\f(4,15).———————————————————莖葉圖的優(yōu)缺點由莖葉圖可以清晰地看到數(shù)據(jù)的分布情況,這一點同頻率分布直方圖類似.它優(yōu)于頻率分布直方圖的第一點是從莖葉圖中能看到原始數(shù)據(jù),沒有任何信息損失,第二點是莖葉圖便于記錄和表示.其缺點是當樣本容量較大時,作圖較繁瑣.08910353.(·湖南高考)如圖是某學校一名籃球運動員在五場比賽中所得分數(shù)的莖葉圖,則該運動員在這五場比賽中得分的方差為________.(注:方差s2=eq\f(1,n)[(x1-eq\x\to(x))2+(x2-eq\x\to(x))2+…+(xn-eq\x\to(x))2],其中eq\x\to(x)為x1,x2,…,xn的平均數(shù))解析:該運動員五場比賽中的得分為8,9,10,13,15,平均得分eq\x\to(x)=eq\f(8+9+10+13+15,5)=11,方差s2=eq\f(1,5)[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=6.8.答案:6.84.隨機抽取某中學甲、乙兩班各10名同學,測量他們的身高(單位:cm),獲得身高數(shù)據(jù)的莖葉圖(中間的數(shù)字表示身高的百位、十位數(shù),旁邊的數(shù)字分別表示身高的個位數(shù))如圖所示.甲班乙班2181981017256698842163598157(1)根據(jù)莖葉圖判斷哪個班的平均身高較高;(2)計算甲班的樣本方差.解:(1)由莖葉圖可知乙班身高比較集中在170~181之間,所以乙班的平均身高較高.(2)甲班的方差為:eq\f(1,10)×[(182-170)2+(179-170)2+(178-170)2+(171-170)2+(170-170)2+(168-170)2+(168-170)2+(164-170)2+(162-170)2+(158-170)2]=54.2.2個異同——眾數(shù)、中位數(shù)和平均數(shù)的異同,標準差和方差的異同(1)眾數(shù)、中位數(shù)和平均數(shù)的異同①眾數(shù)、中位數(shù)和平均數(shù)都是描述一組數(shù)據(jù)集中趨勢的量,平均數(shù)是最重要的量.②由于平均數(shù)與每一個樣本數(shù)據(jù)有關,所以任何一個樣本數(shù)據(jù)的改變都會引起平均數(shù)的改變,這是眾數(shù)和中位數(shù)都不具有的性質.③眾數(shù)考查各數(shù)據(jù)出現(xiàn)的頻率,其大小只與這組數(shù)據(jù)中部分數(shù)據(jù)有關.當一組數(shù)據(jù)中有不少數(shù)據(jù)多次重復出現(xiàn)時,其眾數(shù)往往更能反映問題.④某些數(shù)據(jù)的改動對中位數(shù)可能沒有影響,中位數(shù)可能出現(xiàn)在所給的數(shù)據(jù)中,也可能不在所給的數(shù)據(jù)中.當一組數(shù)據(jù)中的個別數(shù)據(jù)變動較大時,可用中位數(shù)描述其集中趨勢.(2)標準差和方差的異同標準差和方差描述了一組數(shù)據(jù)圍繞平均數(shù)波動的大?。畼藴什?、方差越大,數(shù)據(jù)的離散程度就越大;標準差、方差越小,數(shù)據(jù)的離散程度則越?。驗榉讲钆c原始數(shù)據(jù)的單位不同,且平方后可能夸大了偏差程度,所以雖然方差與標準差在刻畫樣本數(shù)據(jù)的分散程度上是一樣的,但在解決實際問題時,一般多采用標準差.2個區(qū)別——直方圖與條形圖的區(qū)別不要把直方圖錯以為條形圖,兩者的區(qū)別在于條形圖是離散隨機變量,縱坐標刻度為頻數(shù)或頻率,直方圖是連續(xù)隨機變量,縱坐標刻度為頻率/組距,這是密度,連續(xù)隨機變量在某一點上是沒有頻率的.易誤警示——頻率分布直方圖中的易誤點[典例](·山東高考)如圖是根據(jù)部分城市某年6月份的平均氣溫(單位:℃)數(shù)據(jù)得到的樣本頻率分布直方圖,其中平均氣溫的范圍是[20.5,26.5],樣本數(shù)據(jù)的分組為[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知樣本中平均氣溫低于22.5℃的城市個數(shù)為11,則樣本中平均氣溫不低于25.5℃的城市個數(shù)為________.[解析]最左邊兩個矩形面積之和為0.10×1+0.12×1=0.22,總城市數(shù)為11÷0.22=50,最右邊矩形面積為0.18×1=0.18,50×0.18=9.[答案]9eq\a\vs4\al([名師點評])1.忽視頻率分布直方圖中縱軸的含義為頻率/組距,誤認為是每組相應的頻率值,導致失誤;2.不清楚直方圖中各組的面積之和為1,導致某組的頻率不會求;3.不理解由直方圖求樣本平均值的方法,誤用每組的頻率乘以每組的端點值而導致失誤;4.由直方圖確定眾數(shù)時應為最高矩形中點對應的橫坐標值,中位數(shù)應為左右兩側的頻率均等各為eq\f(1,2).eq\a\vs4\al([變式訓練])對某種電子元件的使用壽命進行跟蹤調查,所得樣本的頻率分布直方圖如圖所示,由圖可知,這一批電子元件中使用壽命在100~300h的電子元件的數(shù)量與使用壽命在300~600h的電子元件的數(shù)量的比是________.解析:壽命在100~300h的電子元件的頻率為eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(1,2000)+\f(3,2000)))×100=eq\f(4,20)=eq\f(1,5);壽命在300~600h的電子元件的頻率為eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(1,400)+\f(1,250)+\f(3,2000)))×100=eq\f(4,5).則它們的電子元件數(shù)量之比為eq\f(1,5)∶eq\f(4,5)=eq\f(1,4).答案:eq\f(1,4)一、選擇題(本大題共6小題,每小題5分,共30分)1.(·湖北高考)容量為20的樣本數(shù)據(jù),分組后的頻數(shù)如下表:分組[10,20)[20,30)[30,40)[40,50)[50,60)[60,70)頻數(shù)234542則樣本數(shù)據(jù)落在區(qū)間[10,40)的頻率為()A.0.35 B.0.45C.0.55 D.0.65解析:選B求得該頻數(shù)為2+3+4=9,樣本容量是20,所以頻率為eq\f(9,20)=0.45.2.某校100名學生的數(shù)學測試成績分布直方圖如圖所示,分數(shù)不低于a即為優(yōu)秀,如果優(yōu)秀的人數(shù)為20人,則a的估計值是()A.130 B.140C.134 D.137解析:選C由題意知,優(yōu)秀的頻率為0.2,故a的值在130~140之間,則(140-a)×0.015=0.1,解得a=133.4.3.(·陜西高考)對某商店一個月內每天的顧客人數(shù)進行了統(tǒng)計,得到樣本的莖葉圖(如圖所示),則該樣本的中位數(shù)、眾數(shù)、極差分別是()A.46,45,56B.46,45,53C.47,45,56D.45,47,53解析:選A從莖葉圖中可以看出樣本數(shù)據(jù)的中位數(shù)為中間兩個數(shù)的平均數(shù),即eq\f(45+47,2)=46,眾數(shù)為45,極差為68-12=56.4.某校甲、乙兩個班級各有5名編號為1,2,3,4,5的學生進行投籃練習,每人投10次,投中的次數(shù)如下表:學生1號2號3號4號5號甲班67787乙班67679則以上兩組數(shù)據(jù)的方差中較小的一個為s2,則s2=()A.eq\f(2,5) B.eq\f(7,25)C.eq\f(3,5) D.2解析:選Aeq\x\to(x)甲=7,seq\o\al(2,甲)=eq\f(1,5)[(6-7)2+(7-7)2+(7-7)2+(8-7)2+(7-7)2]=eq\f(2,5),eq\x\to(x)乙=7,seq\o\al(2,乙)=eq\f(1,5)[(6-7)2+(7-7)2+(6-7)2+(7-7)2+(9-7)2]=eq\f(6,5),兩組數(shù)據(jù)的方差中較小的一個為seq\o\al(2,甲),即s2=eq\f(2,5).5.某單位舉辦技能比賽,9位評委給生產科打出的分數(shù)如莖葉圖所示,統(tǒng)計員在去掉一個最高分和一個最低分后,算得平均分為91,復核員在復核時,發(fā)現(xiàn)有一個數(shù)字(莖葉圖中的x)無法看清,若記分員計算無誤,則數(shù)字x應該是()評委給生產科打出的分數(shù)898792x3421A.2 B.3C.4 D.5解析:選A若數(shù)字90+x是最高分,則為eq\x\to(x)1=eq\f(1,7)(88+89+91+92+92+93+94)≈91.3,不合題意,因此最高分為94分,此時平均分eq\x\to(x)2=eq\f(1,7)(88+89+91+92+92+93+90+x),∴eq\f(1,7)(635+x)=91,解得x=2.6.(·江西高考)小波一星期的總開支分布如圖(1)所示,一星期的食品開支如圖(2)所示,則小波一星期的雞蛋開支占總開支的百分比為()A.30% B.10%C.3% D.不能確定解析:選C由圖(1)得到小波一星期的總開支,由圖(2)得到小波一星期的食品開支,從而再借助圖(2)計算出雞蛋開支占總開支的百分比.由圖(2)知,小波一星期的食品開支為30+40+100+80+50=300元,由圖(1)知,小波一星期的總開支為eq\f(300,30%)=1000元,則小波一星期的雞蛋開支占總開支的百分比為eq\f(30,1000)×100%=3%.二、填空題(本大題共3小題,每小題5分,共15分)7.(·徐州模擬)學校為了調查學生在課外讀物方面的支出情況,抽出了一個容量為n且支出在[20,60)元的樣本,其頻率分布直方圖如圖所示,其中支出在[50,60)元的同學有30人.則n的值為________.解析:支出在[50,60)的頻率為1-0.36-0.24-0.1=0.3,因此eq\f(30,n)=0.3,故n=100.答案:100147882018.(·南京模擬)為了分析某籃球運動員在比賽中發(fā)揮的穩(wěn)定程度,統(tǒng)計了該運動員在6場比賽中的得分,用莖葉圖表示如圖,則該組數(shù)據(jù)的方差為________.解析:該運動員6場的總得分為14+17+18+18+20+21=108,平均得分為eq\f(108,6)=18分,方差=eq\f(1,6)[(14-18)2+(17-18)2+(18-18)2+(18-18)2+(20-18)2+(21-18)2]=5.答案:59.為了了解大連市今年準備報考飛行員的學生的體重情況,將所得的數(shù)據(jù)整理后,畫出了頻率分布直方圖(如圖所示),已知圖中從左到右的前3個小組的頻率之比為1∶2∶3,第2小組的頻數(shù)為120,則抽取的學生人數(shù)是________.解析:由頻率分布直方圖知:學生的體重在65~75kg的頻率為(0.0125+0.0375)×5=0.25,則學生的體重在50~65kg的頻率為1-0.25=0.75.從左到右第2個小組的頻率為0.75×eq\f(2,6)=0.25,所以抽取的學生人數(shù)是120÷0.25=480.答案:480三、解答題(本大題共3小題,每小題12分,共36分)10.(·安徽高考)若某產品的直徑長與標準值的差的絕對值不超過1mm時,則視為合格品,否則視為不合格品,在近期一次產品抽樣檢查中,從某廠生產的此種產品中,隨機抽取5000件進行檢測,結果發(fā)現(xiàn)有50件不合格品.計算這50件不合格品的直徑長與標準值的差(單位:mm),將所得數(shù)據(jù)分組,得到如下頻率分布表:分組頻數(shù)頻率[-3,-2)0.10[-2,-1)8(1,2]0.50(2,3]10(3,4]合計501.00(1)將上面表格中缺少的數(shù)據(jù)補充完整;(2)估計該廠生產的此種產品中,不合格品的直徑長與標準值的差落在區(qū)間(1,3]內的概率;(3)現(xiàn)對該廠這種產品的某個批次進行檢查,結果發(fā)現(xiàn)有20件不合格品.據(jù)此估算這批產品中的合格品的件數(shù).解:(1)頻率分布表分組頻數(shù)頻率[-3,-2)50.10[-2,-1)80.16(1,2]250.50(2,3]100.20(3,4]20.04合計501.00(2)由頻率分布表知,該廠生產的此種產品中,不合格品的直徑長與標準值的差落在區(qū)間(1,3]內的概率約為0.50+0.20=0.70.(3)設這批產品中的合格品數(shù)為x件,依題意有eq\f(50,5000)=eq\f(20,x+20),解得x=eq\f(5000×20,50)-20=1980.所以該批產品的合格品件數(shù)估計是1980件.11.(·廣東高考)某校100名學生期中考試語文成績的頻率分布直方圖如圖所示,其中成績分組區(qū)間是:[50,60),[60,70),[70,80),[80,90),[90,100].(1)求圖中a的值;(2)根據(jù)頻率分布直方圖,估計這100名學生語文成績的平均分;(3)若這100名學生語文成績某些分數(shù)段的人數(shù)(x)與數(shù)學成績相應分數(shù)段的人數(shù)(y)之比如下表所示,求數(shù)學成績在[50,90)之外的人數(shù).分數(shù)段[50,60)[60,70)[70,80)[80,90)x∶y1∶12∶13∶44∶5解:(1)根據(jù)頻率分布直方圖,可知(0.04+0.03+0.02+2a)×10=1,所以a=0.005.(2)由頻率分布直方圖知這100名學生語文成績的平均分為0.005×10×55+0.04×10×65+0.03×10×75+0.02×10×85+0.005×10×95=73(分).(3)由頻率分布直方圖知這100名學生的語文成績在[50,60)內的人數(shù)為100×0.005×10=5;在[60,70)內的人數(shù)為100×0.04×10=40;在[70,80)內的人數(shù)為100×0.03×10=30;在[80,90)內的人數(shù)為100×0.02×10=20,即各分數(shù)段的人數(shù)為:語文分數(shù)段[50,60)[60,70)[70,80)[80,90)x5403020根據(jù)語文成績與數(shù)學成績各分數(shù)段的人數(shù)比可知:數(shù)學分數(shù)段[50,60)[60,70)[70,80)[80,90)y5204025所以數(shù)學成績在[50,90)之外的人數(shù)為100-5-20-40-25=10.12.某中學共有1000名學生參加了該地區(qū)高三第一次質量檢測的數(shù)學考試,數(shù)學成績如下表所示:數(shù)學成績分組[0,30)[30,60)[60,90)[90,120)[120,150]人數(shù)6090300x160(1)為了了解同學們前段復習的得失,以便制定下階段的復習計劃,學校將采用分層抽樣的方法抽取100名同學進行問卷調查,甲同學在本次測試中數(shù)學成績?yōu)?5分,求他被抽中的概率;(2)已知本次數(shù)學成績的優(yōu)秀線為110分,試根據(jù)所提供數(shù)據(jù)估計該中學達到優(yōu)秀線的人數(shù);(3)作出頻率分布直方圖,并估計該學校本次考試的數(shù)學平均分(同一組中的數(shù)據(jù)用該組區(qū)間的中點值作代表).解:(1)分層抽樣中,每個個體被抽到的概率均為eq\f(樣本容量,總體中個體總數(shù)),故甲同學被抽到的概率P=eq\f(1,10).(2)由題意得x=1000-(60+90+300+160)=390.故估計該中學達到優(yōu)秀線的人數(shù)m=160+390×eq\f(120-110,120-90)=290.(3)頻率分布直方圖如圖所示.該學校本次考試的數(shù)學平均分.eq\x\to(x)=eq\f(60×15+90×45+300×75+390×105+160×135,1000)=90.估計該學校本次考試的數(shù)學平均分為90分.1.(·陜西高考)從甲乙兩個城市分別隨機抽取16臺自動售貨機,對其銷售額進行統(tǒng)計,統(tǒng)計數(shù)據(jù)用莖葉圖表示(如圖所示).設甲乙兩組數(shù)據(jù)的平均數(shù)分別為eq\x\to(x)甲,eq\x\to(x)乙,中位數(shù)分別為m甲,m乙,則()A.eq\x\to(x)甲<eq\x\to(x)乙,m甲>m乙 B.eq\x\to(x)甲<eq\x\to(x)乙,m甲<m乙C.eq\x\to(x)甲>eq\x\to(x)乙,m甲>m乙 D.eq\x\to(x)甲>eq\x\to(x)乙,m甲<m乙解析:選B由莖葉圖可知甲數(shù)據(jù)集中在10至20之間,乙數(shù)據(jù)集中在20至40之間,明顯eq\x\to(x)甲<eq\x\to(x)乙,甲的中位數(shù)為20,乙的中位數(shù)為29,即m甲<m乙.2.某鄉(xiāng)鎮(zhèn)供電所為了調查農村居民用電量情況,隨機抽取了500戶居民去年的月均用電量(單位:kW/h),將所得數(shù)據(jù)整理后,畫出頻率分布直方圖如下,其中直方圖從左到右前3個小矩形的面積之比為1∶2∶3,試估計:(1)該鄉(xiāng)鎮(zhèn)月均用電量在[39.5,43.5)內的居民所占百分比約是多少?(2)該鄉(xiāng)鎮(zhèn)居民月均用電量的中位數(shù)約是多少?(精確到0.01)解:(1)設直方圖從左到右前3個小矩形的面積分別為P,2P,3P.由直方圖可知,最后兩個小矩形的面積之和為(0.0875+0.0375)×2=0.25.因為直方圖中各小矩形的面積之和為1,所以P+2P+3P=0.75,即P=0.125.所以3P+0.0875×2=0.55.由此估計,該鄉(xiāng)鎮(zhèn)居民月均用電量在[39.5,43.5)內的居民所占百分比約是55%.(2)顯然直方圖的面積平分線位于正中間一個矩形內,且該矩形在面積平分線左側部分的面積為0.5-P-2P=0.5-0.375=0.125,設樣本數(shù)據(jù)的中位數(shù)為39.5+x.因為正中間一個矩形的面積為3P=0.375,所以x∶2=0.125∶0.375,即x=eq\f(2,3)≈0.67.從而39.5+x≈40.17,由此估計,該鄉(xiāng)鎮(zhèn)居民月均用電量的中位數(shù)約是40.17(kW/h).3.為了解學生身高情況,某校以10%的比例對全校700名學生按性別進行分層抽樣調查,測得身高情況的統(tǒng)計圖如圖所示.(1)估計該校男生的人數(shù);(2)估計該校學生身高在170~185cm之間的概率;(3)從樣本中身高在180~190cm之間的男生中任選2人,求至少有1人身高在185~190cm之間的概率.解:(1)樣本中男生人數(shù)為40,分層抽樣比為10%.故估計全校男生人數(shù)為400.(2)由統(tǒng)計圖知,樣本中身高在170~185cm之間的學生有14+13+4+3+1=35人,樣本容量為70.故該校學生身高在170~185cm之間的概率P1=eq\f(35,70)=0.5.(3)由統(tǒng)計圖知,樣本中身高在180~185cm之間的男生有4人(不妨設為A、B、C、D),樣本身高在185~190cm之間的男生有2人(不妨設為E,F(xiàn))從身高在180~190cm之間的6人中任選2人有15種結果,其中至少1人身高在185~190cm之間的結果有9種,故所求事件的概率P2=eq\f(9,15)=eq\f(3,5).eq\a\vs4\al(第三節(jié)變量間的相關關系與統(tǒng)計案例)[備考方向要明了]考什么怎么考1.會作兩個相關變量的散點圖,會利用散點圖認識變量之間的相關關系.2.了解最小二乘法的思想,能根據(jù)給出的線性回歸系數(shù)公式建立線性回歸方程.3.了解獨立性檢驗(只要求2×2列聯(lián)表)的基本思想、方法及其簡單應用.4.了解回歸分析的基本思想、方法及其簡單應用.高考對本節(jié)內容的考查主要是線性回歸分析和獨立性檢驗的統(tǒng)計分析方法,三種題型都有可能出現(xiàn),難度中檔,如年湖南T4,遼寧T19等.[歸納·知識整合]1.兩個變量的線性相關(1)正相關:在散點圖中,點散布在從左下角到右上角的區(qū)域,對于兩個變量的這種相關關系,我們將它稱為正相關.(2)負相關:在散點圖中,點散布在從左上角到右下角的區(qū)域,兩個變量的這種相關關系稱為負相關.(3)線性相關關系、回歸直線如果散點圖中點的分布從整體上看大致在一條直線附近,就稱這兩個變量之間具有線性相關關系,這條直線叫做回歸直線.[探究]相關關系和函數(shù)關系有何異同點?提示:(1)相同點:兩者均是指兩個變量的關系.(2)不同點:①函數(shù)關系是一種確定的關系,而相關關系是一種非確定的關系.②函數(shù)關系是一種因果關系,而相關關系不一定是因果關系,也可能是伴隨關系.2.回歸方程(1)最小二乘法:求回歸直線使得樣本數(shù)據(jù)的點到它的距離的平方和最小的方法叫做最小二乘法.(2)回歸方程:方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))是兩個具有線性相關關系的變量的一組數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn)的回歸方程,其中eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^))是待定參數(shù).eq\b\lc\{\rc\(\a\vs4\al\co1(\o(b,\s\up6(^))=\f(\i\su(i=1,n,)xi-\o(x,\s\up6(-))yi-\o(y,\s\up6(-)),\i\su(i=1,n,)xi-\o(x,\s\up6(-))2)=\f(\i\su(i=1,n,x)iyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\i\su(i=1,n,x)\o\al(2,i)-n\o(x,\s\up6(-))2),,\o(a,\s\up6(^))=\o(y,\s\up6(-))-\o(b,\s\up6(^))\o(x,\s\up6(-)).))3.殘差分析(1)殘差:對于樣本點(x1,y1),(x2,y2),…,(xn,yn),它們的隨機誤差為ei=y(tǒng)i-bxi-a,i=1,2,…,n,其估計值為eq\o(e,\s\up6(^))i=y(tǒng)i-eq\o(y,\s\up6(^))i=y(tǒng)i-eq\o(b,\s\up6(^))xi-eq\o(a,\s\up6(^)),i=1,2,…,n,eq\o(e,\s\up6(^))i稱為相應于點(xi,yi)的殘差.(2)相關指數(shù)R2=1-eq\f(\i\su(i=1,n,)yi-\o(y,\s\up6(^))i2,\i\su(i=1,n,)yi-\o(y,\s\up6(-))2),R2越大,意味著殘差平方和越小,即模型的擬合效果越好;R2越小,殘差平方和越大,即模型的擬合效果越差.在線性回歸模型中,R2表示解釋變量對于預報變量變化的貢獻率,R2越接近于1,表示回歸的效果越好.4.獨立性檢驗(1)分類變量:變量的不同“值”表示個體所屬的不同類別,像這類變量稱為分類變量.(2)列聯(lián)表:列出兩個分類變量的頻數(shù)表,稱為列聯(lián)表.假設有兩個分類變量X和Y,它們的可能取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為2×2列聯(lián)表:y1y2總計x1aba+bx2cdc+d總計a+cb+da+b+c+dK2=eq\f(nad-bc2,a+ba+cb+dc+d)(其中n=a+b+c+d為樣本容量),則利用獨立性檢驗判斷表來判斷“X與Y的關系”.[自測·牛刀小試]1.下列結論正確的是()①函數(shù)關系是一種確定性關系;②相關關系是一種非確定性關系;③回歸分析是對具有函數(shù)關系的兩個變量進行統(tǒng)計分析的一種方法;④回歸分析是對具有相關關系的兩個變量進行統(tǒng)計分析的一種常用方法.A.①② B.①②③C.①②④ D.①②③④解析:選C由回歸分析的方法及概念判斷.2.已知x,y的取值如下表,從散點圖可以看出y與x線性相關,且回歸方程為y=0.95x+a,則a=()x0134y2.24.34.86.7A.3.25 C.2.2 D.0解析:選Beq\x\to(x)=2,eq\x\to(y)=4.5,因為回歸方程經過點(eq\x\to(x),eq\x\to(y)),所以a=4.5-0.95×2=2.6.3.工人月工資y(元)關于勞動生產率x(千元)的回歸方程為y=650+80x,下列說法中正確的個數(shù)是()①勞動生產率為1000元時,工資為730元;②勞動生產率提高1000元,則工資提高80元;③勞動生產率提高1000元,則工資提高730元;④當月工資為810元時,勞動生產率約為2000元.A.1 B.2C.3 D.4解析:選C將數(shù)據(jù)代入方程計算可判斷①②④正確.4.一位母親記錄了自己兒子3~9歲的身高數(shù)據(jù)(略),由此建立的身高與年齡的回歸模型為eq\o(y,\s\up6(^))=7.19x+73.93,用這個模型預測這個孩子10歲時的身高,則正確的敘述是()A.身高一定是145.83cmB.身高在145.83cm以上C.身高在145.83cm左右D.身高在145.83cm以下解析:選C用回歸模型eq\o(y,\s\up6(^))=7.19x+73.93,只能作預測,其結果不一定是一個確定值.5.在吸煙與患肺病這兩個分類變量的計算中,下列說法正確的是()A.若K2的觀測值為k=6.635,我們有99%的把握認為吸煙與患肺病有關系,那么在100個吸煙的人中必有99人患有肺病B.從獨立性檢驗可知,有99%的把握認為吸煙與患肺病有關時,我們說某人吸煙,那么他有99%的可能患有肺病C.若從統(tǒng)計量中求出有95%的把握認為吸煙與患肺病有關系,是指有5%的可能性使得推斷出現(xiàn)錯誤D.以上三種說法都不正確解析:選C根據(jù)獨立性檢驗的思想知.相關關系的判斷[例1]在某地區(qū)的12~30歲居民中隨機抽取了10個人的身高和體重的統(tǒng)計資料如表:身高(cm)143156159172165體重(kg)4149617968身高(cm)171177161164160體重(kg)6974696854根據(jù)上述數(shù)據(jù),畫出散點圖并判斷居民的身高和體重之間是否有相關關系.[自主解答]以x軸表示身高,y軸表示體重,可得到相應的散點圖如圖所示.由散點圖可知,兩者之間具有相關關系,且為正相關.———————————————————利用散點圖判斷相關關系的技巧(1)在散點圖中如果所有的樣本點都落在某一函數(shù)的曲線上,就用該函數(shù)來描述變量間的關系,即變量之間具有函數(shù)關系.(2)如果所有的樣本點都落在某一函數(shù)的曲線附近,變量之間就有相關關系.(3)如果所有的樣本點都落在某一直線附近,變量之間就有線性相關關系.1.變量X與Y相對應的一組數(shù)據(jù)為(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);變量U與V相對應的一組數(shù)據(jù)為(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示變量Y與X之間的線性相關系數(shù),r2表示變量V與U之間的線性相關系數(shù),則()A.r2<r1<0 B.0<r2<r1C.r2<0<r1 D.r2=r1解析:選C對于變量Y與X而言,Y隨X的增大而增大,故Y與X正相關,即r1>0;對于變量V與U而言,V隨U的增大而減小,故V與U負相關,即r2<0,所以有r2<0<r1.線性回歸方程及其應用[例2]某工廠為了對新研發(fā)的一種產品進行合理定價,將該產品按事先擬定的價格進行試銷,得到如下數(shù)據(jù):單價x(元)88.28.48.68.89銷量y(件)908483807568(1)求回歸直線方程eq\o(y,\s\up6(^))=bx+a,其中b=-20,a=eq\o(y,\s\up6(-))-beq\o(x,\s\up6(-));(2)預計在今后的銷售中,銷量與單價仍然服從(1)中的關系,且該產品的成本是4元/件,為使工廠獲得最大利潤,該產品的單價應定為多少元?(利潤=銷售收入-成本)[自主解答](1)由于eq\x\to(x)=eq\f(1,6)(x1+x2+x3+x4+x5+x6)=8.5,eq\x\to(y)=eq\f(1,6)(y1+y2+y3+y4+y5+y6)=80.所以a=eq\x\to(y)-beq\x\to(x)=80+20×8.5=250,從而回歸直線方程為eq\o(y,\s\up6(^))=-20x+250.(2)設工廠獲得的利潤為L元,依題意得L=x(-20x+250)-4(-20x+250)=-20x2+330x-1000=-20eq\b\lc\(\rc\)(\a\vs4\al\co1(x-\f(33,4)))2+361.25.當且僅當x=8.25時,L取得最大值.故當單價定為8.25元時,工廠可獲得最大利潤.———————————————————求回歸直線方程時的注意點求回歸方程,關鍵在于正確求出系數(shù)a,b,由于計算量較大,所以計算時要仔細謹慎,避免因計算產生失誤,特別注意,只有在散點圖大體呈線性時,求出的回歸方程才有意義.2.某種產品的廣告費支出x與銷售額(單位:百萬元)之間有如下對應數(shù)據(jù):x24568y3040506070如果y與x之間具有線性相關關系.(1)作出這些數(shù)據(jù)的散點圖;(2)求這些數(shù)據(jù)的線性回歸方程;(3)預測當廣告費支出為9百萬元時的銷售額.解:(1)(2)eq\x\to(x)=5,eq\x\to(y)=50,eq\i\su(i=1,5,x)iyi=1390,eq\i\su(i=1,5,x)eq\o\al(2,i)=145,eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,5,x)iyi-5\x\to(x)·\x\to(y),\i\su(i=1,5,x)\o\al(2,i)-5\o(x,\s\up6(-))2)=7,eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-))=15,∴線性回歸方程為eq\o(y,\s\up6(^))=7x+15.(3)當x=9時,eq\o(y,\s\up6(^))=78.即當廣告費支出為9百萬元時,銷售額為78百萬元.獨立性檢驗的基本思想及其應用[例3](·湖南衡陽第二次聯(lián)考)衡陽市第一次聯(lián)考后,某校對甲、乙兩個文科班的數(shù)學考試成績進行分析,規(guī)定:大于或等于120分為優(yōu)秀,120分以下為非優(yōu)秀.統(tǒng)計成績后,得到如下的2×2列聯(lián)表,且已知在甲、乙兩個文科班全部110人中隨機抽取1人為優(yōu)秀的概率為eq\f(3,11).優(yōu)秀非優(yōu)秀合計甲班10乙班30合計110(1)請完成上面的列聯(lián)表;(2)根據(jù)列表中的數(shù)據(jù),若按99.9%的可靠性要求,能否認為“成績與班級有關系”;參考公式與臨界值表:K2=eq\f(nad-bc2,a+bc+da+cb+d)P(K2≥k0)0.1000.0500.0250.0100.001k02.7063.8415.0246.63510.828[自主解答](1)列聯(lián)表如下:優(yōu)秀非優(yōu)秀合計甲班105060乙班203050合計3080110(2)根據(jù)列聯(lián)表中的數(shù)據(jù),得到K2=eq\f(110×10×30-20×502,60×50×30×80)≈7.486<10.828.因此按99.9%的可靠性要求,不能認為“成績與班級有關系”.———————————————————獨立性檢驗的步驟(1)根據(jù)樣本數(shù)據(jù)制成2×2列聯(lián)表.(2)根據(jù)公式K2=eq\f(nad-bc2,a+ba+cb+dc+d)計算K2的觀測值.(3)比較K2與臨界值的大小關系作統(tǒng)計推斷.3.地震、海嘯、洪水、森林大火等自然災害頻繁出現(xiàn),緊急避險常識越來越引起人們的重視,某校為了了解學生對緊急避險常識的了解情況,從七年級和八年級各選取100名同學進行緊急避險常識知識競賽.圖(1)和圖(2)分別是對七年級和八年級參加競賽的學生成績按[40,50),[50,60),[60,70),[70,80]分組,得到的頻率分布直方圖.(1)分別計算參加這次知識競賽的兩個年級學生的平均成績(注:統(tǒng)計方法中,同一組數(shù)據(jù)常用該組區(qū)間的中點值作為代表);(2)完成下面2×2列聯(lián)表,并回答是否有99%的把握認為“兩個年級學生對緊急避險常識的了解有差異”?成績小于60分人數(shù)成績不小于60分人數(shù)合計七年級八年級合計附:K2=eq\f(nad-bc2,a+bc+da+cb+d).臨界值表:P(K2≥k)0.100.050.010k2.7063.8416.635解:(1)七年級學生競賽平均成績?yōu)?45×30+55×40+65×20+75×10)÷100=56,八年級學生競賽平均成績?yōu)?45×15+55×35+65×35+75×15)÷100=60.(2)2×2列聯(lián)表如下:成績小于60分人數(shù)成績不小于60分人數(shù)合計七年級7030100八年級5050100合計12080200∴K2=eq\f(200×50×70-50×302,100×100×120×80)≈8.333>6.635.∴有99%的把握認為“兩個年級學生對緊急避險常識的了解有差異”.1種求法——相關關系的判定和線性回歸方程的求法(1)函數(shù)關系一種理想的關系模型,而相關關系是一種更為一般的情況.(2)如果兩個變量不具有線性相關關系,即使求出回歸直線方程也毫無意義,而且用其進行估計和預測也是不可信的.(3)回歸直線方程只適用于我們所研究的樣本的總體.樣本的取值范圍一般不超過回歸直線方程的適用范圍,否則就沒有實用價值.1個難點——獨立性檢驗思想的理解獨立性檢驗的思想類似于反證法,即要確定“兩個變量X和Y有關系”這一結論成立的可信度,首先假設結論不成立,即它們之間沒關系,也就是它們是相互獨立的,利用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論