學而思高中題庫完整版統(tǒng)計.板塊三.莖葉圖.學生版_第1頁
學而思高中題庫完整版統(tǒng)計.板塊三.莖葉圖.學生版_第2頁
學而思高中題庫完整版統(tǒng)計.板塊三.莖葉圖.學生版_第3頁
學而思高中題庫完整版統(tǒng)計.板塊三.莖葉圖.學生版_第4頁
學而思高中題庫完整版統(tǒng)計.板塊三.莖葉圖.學生版_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、板塊三.莖葉圖.板塊三.莖葉圖.題庫2好學百智5思宮曦國1Ml任知識內容一.隨機抽樣1 .隨機抽樣:滿足每個個體被抽到的機會是均等的抽樣,共有三種經(jīng)常采用的隨機抽樣方簡單隨機抽樣:從元素個數(shù)為N的總體中不放回地抽取容量為 n的樣本,如果每一次抽取時總體中的各個個體有相同的可能性被抽到,這種抽樣方法叫做簡單隨機抽樣.抽出辦法:抽簽法:用紙片或小球分別標號后抽簽的方法.隨機數(shù)表法:隨機數(shù)表是使用計算器或計算機的應用程序生成隨機數(shù)的功能生成的一張數(shù)表.表中每一位置出現(xiàn)各個數(shù)字的可能性相同.隨機數(shù)表法是對樣本進行編號后,按照一定的規(guī)律從隨機數(shù)表中讀數(shù),并取出相應的樣本的方法.簡單隨機抽樣是最簡單、最基

2、本的抽樣方法.系統(tǒng)抽樣:將總體分成均衡的若干部分,然后按照預先制定的規(guī)則,從每一部分抽取一個 個體,得到所需要的樣本的抽樣方法.抽出辦法:從元素個數(shù)為 N的總體中抽取容量為 n的樣本,如果總體容量能被樣本容量整除,設k N-,先對總體進行編號,號碼從 1到N ,再從數(shù)字1到k中隨機抽取一個數(shù) s作 n為起始數(shù),然后順次抽取第s k,s 2k, L , s (n 1)k個數(shù),這樣就得到容量為n的樣本.如果總體容量不能被樣本容量整除,可隨機地從總體中剔除余數(shù),然后再按系統(tǒng)抽樣 方法進行抽樣.系統(tǒng)抽樣適用于大規(guī)模的抽樣調查,由于抽樣間隔相等,又被稱為等距抽樣.分層抽樣:當總體有明顯差別的幾部分組成時

3、,要反映總體情況,常采用分層抽樣,使總體中各個個體按某種特征分成若干個互不重疊的幾部分,每一部分叫做層,在各層中按層在總體中所占比例進行簡單隨機抽樣,這種抽樣方法叫做分層抽樣.分層抽樣的樣本具有較強的代表性,而且各層抽樣時,可靈活選用不同的抽樣方法,應用廣泛.2 .簡單隨機抽樣必須具備下列特點:簡單隨機抽樣要求被抽取的樣本的總體個數(shù)N是有限的.簡單隨機樣本數(shù)n小于等于樣本總體的個數(shù) N .簡單隨機樣本是從總體中逐個抽取的.簡單隨機抽樣是一種不放回的抽樣.簡單隨機抽樣的每個個體入樣的可能性均為.N3 .系統(tǒng)抽樣時,當總體個數(shù) N恰好是樣本容量n的整數(shù)倍時,取k 包;n若N不是整數(shù)時,先從總體中隨

4、機地剔除幾個個體,使得總體中剩余的個體數(shù)能被樣本容n量n整除.因為每個個體被剔除的機會相等,因而整個抽樣過程中每個個體被抽取的機會仍然相等,為二.頻率直方圖列出樣本數(shù)據(jù)的頻率分布表和頻率分布直方圖的步驟:計算極差:找出數(shù)據(jù)的最大值與最小值,計算它們的差;決定組距與組數(shù):取組距,用決定組數(shù); 決定分點:決定起點,進行分組;列頻率分布直方圖:對落入各小組的數(shù)據(jù)累計,算出各小數(shù)的頻數(shù),除以樣本容量,得 到各小組的頻率.頻率繪制頻率分布直方圖:以數(shù)據(jù)的值為橫坐標,以而應的值為縱坐標繪制直萬圖,知小長方形的面積=組距 x?吃=頻率.組距頻率分布折線圖:將頻率分布直方圖各個長方形上邊的中點用線段連接起來,

5、就得到頻率分布折線圖,一般把折線圖畫成與橫軸相連,所以橫軸左右兩端點沒有實際意義.總體密度曲線:樣本容量不斷增大時,所分組數(shù)不斷增加,分組的組距不斷縮小,頻率分布直方圖可以用一條光滑曲線 y f(x)來描繪,這條光滑曲線就叫做總體密度曲線. 總體密度 曲線精確地反映了一個總體在各個區(qū)域內取值的規(guī)律.三.莖葉圖制作莖葉圖的步驟:將數(shù)據(jù)分為 莖”、葉”兩部分; 將最大莖與最小莖之間的數(shù)字按大小順序排成一列,并畫上豎線作為分隔線; 將各個數(shù)據(jù)的 葉”在分界線的一側對應莖處同行列出.四.統(tǒng)計數(shù)據(jù)的數(shù)字特征用樣本平均數(shù)估計總體平均數(shù);用樣本標準差估計總體標準差.數(shù)據(jù)的離散程序可以用極差、方差或標準差來描

6、述.極差又叫全距,是一組數(shù)據(jù)的最大值和最小值之差,反映一組數(shù)據(jù)的變動幅度; 樣本方差描述了一組數(shù)據(jù)平均數(shù)波動的大小,樣本的標準差是方差的算術平方根.一般地,設樣本的元素為 , X2 , L , %樣本的平均數(shù)為X ,/ _2 /_22定義樣本方差為s2(X1 x) (X2 x) L 3x),n樣本標準差s(% x)2 % x)2 L(xn x)2簡化公式:s2 1(x2 x; L x2) nx2. n五.獨立性檢驗1 .兩個變量之間的關系;常見的有兩類:一類是確定性的函數(shù)關系; 另一類是變量間存在關系, 但又不具備函數(shù)關系 所要求的確定性,它們的關系是帶有一定隨機性的. 當一個變量取值一定時,

7、另一個變量的 取值帶有一定隨機性的兩個變量之間的關系叫做相關關系.2 .散點圖:將樣本中的 n個數(shù)據(jù)點(x , yi)(i 1,2,L , n)描在平面直角坐標系中,就得到 了散點圖.散點圖形象地反映了各個數(shù)據(jù)的密切程度,根據(jù)散點圖的分布趨勢可以直觀地判斷分析兩個變量的關系.3 .如果當一個變量的值變大時,另一個變量的值也在變大,則這種相關稱為正相關;此時,散點圖中的點在從左下角到右上角的區(qū)域.反之,一個變量的值變大時,另一個變量的值由大變小,這種相關稱為負相關.此時,散點 圖中的點在從左上角到右下角的區(qū)域.散點圖可以判斷兩個變量之間有沒有相關關系.4 .統(tǒng)計假設:如果事件 A與B獨立,這時應

8、該有 P(AB) P(A)P(B),用字母H。表示此式, 即Ho: P(AB) P(A)P(B),稱之為統(tǒng)計假設.5 . 2 (讀作專方”)統(tǒng)計量:統(tǒng)計學中有一個非常有用的統(tǒng)計量,它的表達式為2 n(ni1n22 n12nj ,用它的大小可以ni n2 n in 2用來決定是否拒絕原來的統(tǒng)計假設Ho,如果2的值較大,就拒絕 H。,即認為A與B是有關的.2統(tǒng)計量的兩個臨界值: 3.841、6.635;當2 3.841時,有95%的把握說事件 A與B有 關;當2 6.635時,有99%的把握說事件 A與B有關;當2W 3.841時,認為事件A與B 是無關的.獨立性檢驗的基本思想與反證法類似,由結論

9、不成立時推出有利于結論成立的小概率事件發(fā)生,而小概率事件在一次試驗中通常是不會發(fā)生的,所以認為結論在很大程度上是成立的.1 .獨立性檢驗的步驟:統(tǒng)計假設:Ho ;列出2 2聯(lián)表;計算 2統(tǒng)計量;查對臨界值表,作出判斷.2 .幾個臨界值:P( 2 > 2.706) 0.10, P( 2 > 3.841) 0.05, P( 2 > 6.635) 0.01 .2 2聯(lián)表的獨立性檢驗:如果對于某個群體有兩種狀態(tài),對于每種狀態(tài)又有兩個情況,這樣排成一張2 2的表,如狀態(tài)B狀態(tài)B合計狀態(tài)Annn12n1狀態(tài)An21n22n2n 1n 2n如果有調查得來的四個數(shù)據(jù) nn , n12, n2

10、1 , n22 ,并希望根據(jù)這樣的4個數(shù)據(jù)來檢驗上述的兩種 狀態(tài)A與B是否有關,就稱之為 2 2聯(lián)表的獨立性檢驗.六.回歸分析1 .回歸分析:對于具有相關關系的兩個變量進行統(tǒng)計分析的方法叫做回歸分析,即回歸分 析就是尋找相關關系中這種非確定關系的某種確定性.回歸直線:如果散點圖中的各點都大致分布在一條直線附近,就稱這兩個變量之間具有線性相關關系,這條直線叫做回歸直線.2 .最小二乘法:記回歸直線方程為:? a bx,稱為變量Y對變量x的回歸直線方程,其中 a, b叫做回歸系數(shù).?是為了區(qū)分Y的實際值y ,當x取值x時,變量Y的相應觀察值為 y ,而直線上對應于 x 的縱坐標是? a bx .設

11、x,丫的一組觀察值為(x,y), i 1,2,L ,n ,且回歸直線方程為 y? a bx, 當x取值X時,Y的相應觀察值為 V ,差yi y?(i 1,2,L ,n)刻畫了實際觀察值 yi與回歸 直線上相應點的縱坐標之間的偏離程度,稱這些值為離差.板塊三.莖葉圖.題庫3我們希望這n個離差構成的總離差越小越好,這樣才能使所找的直線很貼近已知點. n記Q (yi a bxi)n =2(Xin(x)(i 1i6.相關系數(shù)r的性質: |r|越接近于1, x, y的線性相關程度越強;|r|越接近于0, x , y的線性相關程度越弱.可見,一條回歸直線有多大的預測功能,和變量間的相關系數(shù)密切相關.7.轉

12、化思想:根據(jù)專業(yè)知識或散點圖,對某些特殊的非線性關系,選擇適當?shù)淖兞看鷵Q,把非線性方程轉化為線性回歸方程,從而確定未知參數(shù).8. 一些備案回歸(regression)一詞的來歷: 回歸”這個詞英國統(tǒng)計學家 Francils Galton提出來的.1889 年,他在研究祖先與后代的身高之間的關系時發(fā)現(xiàn),身材較高的父母,他們的孩子也較高, 但這些孩子的平均身高并沒有他們父母的平均身高高;身材較矮的父母,他們的孩子也較矮,但這些孩子的平均身高卻比他們父母的平均身高高.Galton把這種后代的身高向中間值靠近的趨勢稱為回歸現(xiàn)象”.后來,人們把由一個變量的變化去推測另一個變量的變化的方法稱 為回歸分析.

13、 ,回歸直線就是所有直線中Q取最小值的那條.i 1這種使 離差平方和為最小”的方法,叫做最小二乘法.用最小二乘法求回歸系數(shù)a , b有如下的公式:.板塊三.莖葉圖.題庫5好學得智5思音曦nx yi nXyk?3,a y bX,其中a,b上方加、表示是由觀察值按最小二乘法求得的2 _2Xi nx i 1 回歸系數(shù).3 .線性回歸模型:將用于估計y值的線T函數(shù)a bx作為確定性函數(shù);y的實際值與估計值之間的誤差記為,稱之為隨機誤差;將 y a bx 稱為線性回歸模型.產(chǎn)生隨機誤差的主要原因有:所用的確定性函數(shù)不恰當即模型近似引起的誤差; 忽略了某些因素的影響,通常這些影響都比較??; 由于測量工具等

14、原因,存在觀測誤差.n(Xix)(yi y)$ 口n一 2(XiX)i 14 .線性回歸系數(shù)的最佳估計值: 利用最小二乘法可以得到 ,?, ?的計算公式為Xi yi nxy_1 n _1 n二,夕 y bX ,其中 x -Xi , y -yi22n i 1n i 1Xin(x)i 1由此得到的直線 ? a$x就稱為回歸直線,此直線方程即為線性回歸方程.其中c?, $ 分別為a, b的估計值,a稱為回歸截距,自稱為回歸系數(shù),y?稱為回歸值.5.相關系數(shù):(Xi i 1x)(yy)nxyi nxyi 1n一 2- 2X)(yiy)i 12 2yi n(y)1回歸系數(shù)的推導過程:Q(yi a) bx

15、22na 2a(b 為y)2 yb22a2 xyi2b把上式看成因此當aa的二次函數(shù),2(b Xa2的系數(shù)ny)yi b2n2 na2bxyi2V ,2ab0,士時取最小值.同理,把Q的展開式按b的降哥排列,看成b的二次函數(shù),a xi時取最小值.x解得:bnxi ynxyi 1-n(x x)(yi y)2Xi1_2 nx二 ,(xi x)a y bxxi是樣本平均數(shù).n9.對相關系數(shù) 提出統(tǒng)計假設r進行相關性檢驗的步驟:H。:變量x,y不具有線性相關關系;如果以95%的把握作出推斷,那么可以根據(jù) 1 0.95 關性檢驗的臨界值表中查出一個 r的臨界值r0.05 (其中1 計算樣本相關系數(shù)r;0

16、.05與n 2 (n是樣本容量)在相0.95 0.05稱為檢驗水平);作出統(tǒng)計推斷:若|r| r0.05,則否定H。,表明有95%的把握認為變量 y與x之間具有線 性相關關系;若|r性電.05 ,則沒有理由拒絕 H0 ,即就目前數(shù)據(jù)而言,沒有充分理由認為變量y與x之間具有線性相關關系.說明:對相關系數(shù)r進行顯著性檢驗, 這里的r指的是線性相關系數(shù), 關,可能是非線性相關的某種關系.般取檢驗水平0.05,即可靠程度為 95%.r的絕對值很小,只是說明線性相關程度低,不一定不相這里的r是對抽樣數(shù)據(jù)而言的.有時即使 |r| 1,兩者也不一定是線性相關的.故在統(tǒng)計 分析時,不能就數(shù)據(jù)論數(shù)據(jù),要結合實際

17、情況進行合理解釋.典例分析題型一莖葉圖【例1】(2010豐臺二模)甲、乙兩名運動員的 5次測試成績如下圖所示設si , S2分別表示甲、乙兩名運動員測試成績的標準差,xi , x2分別表示甲、乙兩名運動員測試成績的平均數(shù),則有()A. xx2,S1S2B.Xix2 ,SiS2C.Xix2,SiS2D. X乂2,Si S2.板塊三.莖葉圖.題庫5【例2】(2010宣武二模)隨機抽取某中學甲,乙兩班各10名同學,測量他們的身高(單位:cm),獲得身高數(shù)據(jù)的莖葉圖如圖 ,則下列關于甲,乙兩班這10名同學身高的結論正確的是A.甲班同學身高的方差較大B.甲班同學身高的平均值較大C.甲班同學身高的中位數(shù)較

18、大D.甲班同學身高在175以上的人數(shù)較多甲班 乙班2 18 19510 17 036 8 9.板塊三.莖葉圖.題庫7好學謂智5思音曦【例3】(2010天津高考)甲、乙兩人在10天中每天加工零件的個數(shù)用莖葉圖表示如下圖, 中間一列的數(shù)字表示零件 個數(shù)的十位數(shù),兩邊的數(shù)字表示零件個數(shù)的個位數(shù),則這 10天甲、乙兩人日加工零件的平 均數(shù)分別為 和.甲9 80 1320115女19712 14 2 43 0 2 0545267857【例4】右圖是某賽季甲、乙兩名籃球運動員每場比賽得分的莖葉圖,53 1368 2479 31 4則甲、乙兩人這幾場比賽得分的中位數(shù)之和是()A. 62B. 63C. 64D

19、. 65【例5】 在某五場籃球比賽中,甲、乙兩名運動員得分的莖葉圖如右.下列說法正確的是21089012312340A.在這五場比賽中,甲的平均得分比乙好,且甲比乙穩(wěn)定 B.在這五場比賽中,甲的平均得分比乙好,但乙比甲穩(wěn)定 C.在這五場比賽中,乙的平均得分比甲好,且乙比甲穩(wěn)定 D.在這五場比賽中,乙的平均得分比甲好,但甲比乙穩(wěn)定【例6】(2009年福建12)某校開展 愛我海西、愛我家鄉(xiāng)”攝影比賽,9位 評委為參賽作品 A給出的分數(shù)如莖葉圖所示, 記 分員在去掉一個最高分和一個最低分后, 算得平 均分為91,復核員在復核時,發(fā)現(xiàn)有一個數(shù)字(莖 葉圖中的x)無法看清.若記分員計算無誤,則數(shù)字作品A 889992 3 x 2 1 4x應該是.【例7】(2010東城一模)在一次數(shù)學統(tǒng)考后,某班隨機抽取10名

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論