




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、板塊三莖葉圖8 -知識(shí)內(nèi)容一. 隨機(jī)抽樣1隨機(jī)抽樣:滿足每個(gè)個(gè)體被抽到的機(jī)會(huì)是均等的抽樣,共有三種經(jīng)常采用的隨機(jī)抽樣方法:簡(jiǎn)單隨機(jī)抽樣:從元素個(gè)數(shù)為N的總體中不放回地抽取容量為n的樣本,如果每一次抽取時(shí)總體中的各個(gè)個(gè)體有相同的可能性被抽到,這種抽樣方法叫做簡(jiǎn)單隨機(jī)抽樣.抽出辦法:抽簽法:用紙片或小球分另悔號(hào)后抽簽的方法. 隨機(jī)數(shù)表法:隨機(jī)數(shù)表是使用計(jì)算器或計(jì)算機(jī)的應(yīng)用程序生成隨機(jī)數(shù)的功能生成的一張數(shù)表表中每一 位置出現(xiàn)各個(gè)數(shù)字的可能性相同.隨機(jī)數(shù)表法是對(duì)樣本進(jìn)行編號(hào)后,按照一定的規(guī)律從隨機(jī)數(shù)表中讀數(shù),并取出相應(yīng)的樣本的方法. 簡(jiǎn)單隨機(jī)抽樣是最簡(jiǎn)單、最基本的抽樣方法.系統(tǒng)抽樣:將總體分成均衡的若
2、干部分,然后按照預(yù)先制定的規(guī)則,從每一部分抽取一個(gè)個(gè)體,得到所 需要的樣本的抽樣方法.抽出辦法:從元素個(gè)數(shù)為 N的總體中抽取容量為 n的樣本,如果總體容量能被樣本容量整除,設(shè)k ,n 先對(duì)總體進(jìn)行編號(hào),號(hào)碼從 1到N,再?gòu)臄?shù)字1到k中隨機(jī)抽取一個(gè)數(shù) s作為起始數(shù),然后順次抽取第 s k ,s 2k丄,s (n 1)k個(gè)數(shù),這樣就得到容量為 n的樣本如果總體容量不能被樣本容量整除,可 隨機(jī)地從總體中剔除余數(shù),然后再按系統(tǒng)抽樣方法進(jìn)行抽樣.系統(tǒng)抽樣適用于大規(guī)模的抽樣調(diào)查,由于抽樣間隔相等,又被稱為等距抽樣.分層抽樣:當(dāng)總體有明顯差別的幾部分組成時(shí),要反映總體情況,常采用分層抽樣,使總體中各個(gè)個(gè)體
3、按某種特征分成若干個(gè)互不重疊的幾部分,每一部分叫做層,在各層中按層在總體中所占比例進(jìn)行簡(jiǎn)單隨機(jī)抽樣,這種抽樣方法叫做分層抽樣.分層抽樣的樣本具有較強(qiáng)的代表性,而且各層抽樣時(shí),可靈活選用不同的抽樣方法,應(yīng)用廣泛.2簡(jiǎn)單隨機(jī)抽樣必須具備下列特點(diǎn):簡(jiǎn)單隨機(jī)抽樣要求被抽取的樣本的總體個(gè)數(shù)N是有限的.簡(jiǎn)單隨機(jī)樣本數(shù)n小于等于樣本總體的個(gè)數(shù) N .簡(jiǎn)單隨機(jī)樣本是從總體中逐個(gè)抽取的.簡(jiǎn)單隨機(jī)抽樣是一種不放回的抽樣.簡(jiǎn)單隨機(jī)抽樣的每個(gè)個(gè)體入樣的可能性均為工.N3. 系統(tǒng)抽樣時(shí),當(dāng)總體個(gè)數(shù)N恰好是樣本容量n的整數(shù)倍時(shí),取k N;nn整除.因?yàn)镹n若N不是整數(shù)時(shí),先從總體中隨機(jī)地剔除幾個(gè)個(gè)體,使得總體中剩余的個(gè)體
4、數(shù)能被樣本容量n每個(gè)個(gè)體被剔除的機(jī)會(huì)相等,因而整個(gè)抽樣過程中每個(gè)個(gè)體被抽取的機(jī)會(huì)仍然相等,為二. 頻率直方圖列出樣本數(shù)據(jù)的頻率分布表和頻率分布直方圖的步驟: 計(jì)算極差:找出數(shù)據(jù)的最大值與最小值,計(jì)算它們的差;極差 決定組距與組數(shù):取組距,用極差 決定組數(shù);組距 決定分點(diǎn):決定起點(diǎn),進(jìn)行分組; 列頻率分布直方圖: 對(duì)落入各小組的數(shù)據(jù)累計(jì), 繪制頻率分布直方圖:以數(shù)據(jù)的值為橫坐標(biāo),以頻率 知小長(zhǎng)方形的面積=組距 X.=頻率.組距算出各小數(shù)的頻數(shù), 除以樣本容量,得到各小組的頻率. 頻率頻率的值為縱坐標(biāo)繪制直方圖,組距頻率分布折線圖:將頻率分布直方圖各個(gè)長(zhǎng)方形上邊的中點(diǎn)用線段連接起來,就得到頻率分布
5、折線圖, 般把折線圖畫成與橫軸相連,所以橫軸左右兩端點(diǎn)沒有實(shí)際意義.總體密度曲線:樣本容量不斷增大時(shí),所分組數(shù)不斷增加,分組的組距不斷縮小,頻率分布直方圖可以用 一條光滑曲線y f(x)來描繪,這條光滑曲線就叫做總體密度曲線總體密度曲線精確地反映了一個(gè)總體在各個(gè)區(qū)域內(nèi)取值的規(guī)律.三. 莖葉圖制作莖葉圖的步驟: 將數(shù)據(jù)分為 莖”、葉”兩部分; 將最大莖與最小莖之間的數(shù)字按大小順序排成一列,并畫上豎線作為分隔線; 將各個(gè)數(shù)據(jù)的葉”在分界線的一側(cè)對(duì)應(yīng)莖處同行列出.四. 統(tǒng)計(jì)數(shù)據(jù)的數(shù)字特征用樣本平均數(shù)估計(jì)總體平均數(shù);用樣本標(biāo)準(zhǔn)差估計(jì)總體標(biāo)準(zhǔn)差. 數(shù)據(jù)的離散程序可以用極差、方差或標(biāo)準(zhǔn)差來描述.極差又叫全
6、距,是一組數(shù)據(jù)的最大值和最小值之差,反映一組數(shù)據(jù)的變動(dòng)幅度; 樣本方差描述了一組數(shù)據(jù)平均數(shù)波動(dòng)的大小,樣本的標(biāo)準(zhǔn)差是方差的算術(shù)平方根.般地,設(shè)樣本的元素為Xi , X2 , L , Xn樣本的平均數(shù)為X ,定義樣本方差為22(為X)(X22X) L2(XnX)定義/|十本丿J差為sn樣本標(biāo)準(zhǔn)差s(Xi X)2 (X2X)2L XX)2V n簡(jiǎn)化公式:s21 2 2(XiX2 Ln2xJ_2 nx .五. 獨(dú)立性檢驗(yàn)1 兩個(gè)變量之間的關(guān)系;常見的有兩類:一類是確定性的函數(shù)關(guān)系;另一類是變量間存在關(guān)系,但又不具備函數(shù)關(guān)系所要求的確定 性,它們的關(guān)系是帶有一定隨機(jī)性的當(dāng)一個(gè)變量取值一定時(shí),另一個(gè)變量
7、的取值帶有一定隨機(jī)性的兩個(gè) 變量之間的關(guān)系叫做相關(guān)關(guān)系.2散點(diǎn)圖:將樣本中的 n個(gè)數(shù)據(jù)點(diǎn)(X , y )(i1,2丄,n)描在平面直角坐標(biāo)系中,就得到了散點(diǎn)圖.散點(diǎn)圖形象地反映了各個(gè)數(shù)據(jù)的密切程度,根據(jù)散點(diǎn)圖的分布趨勢(shì)可以直觀地判斷分析兩個(gè)變量的關(guān)系.3 .如果當(dāng)一個(gè)變量的值變大時(shí),另一個(gè)變量的值也在變大,則這種相關(guān)稱為正相關(guān);此時(shí),散點(diǎn)圖中的 點(diǎn)在從左下角到右上角的區(qū)域.反之,一個(gè)變量的值變大時(shí),另一個(gè)變量的值由大變小,這種相關(guān)稱為負(fù)相關(guān).此時(shí),散點(diǎn)圖中的點(diǎn)在從 左上角到右下角的區(qū)域.散點(diǎn)圖可以判斷兩個(gè)變量之間有沒有相關(guān)關(guān)系.4 .統(tǒng)計(jì)假設(shè):如果事件A與B獨(dú)立,這時(shí)應(yīng)該有P(AB) P(A)
8、P(B),用字母H。表示此式,即 Ho: P(AB) P(A)P(B),稱之為統(tǒng)計(jì)假設(shè).5. 2 (讀作 卡方”統(tǒng)計(jì)量:nt n2 n 小 2統(tǒng)計(jì)學(xué)中有一個(gè)非常有用的統(tǒng)計(jì)量,它的表達(dá)式為2 n(niin22旳),用它的大小可以用來決定是否 拒絕原來的統(tǒng)計(jì)假設(shè) Ho.如果2的值較大,就拒絕 Ho,即認(rèn)為A與B是有關(guān)的.2統(tǒng)計(jì)量的兩個(gè)臨界值:3.841、6.635 ;當(dāng)2 3.841時(shí),有95%的把握說事件 A與B有關(guān);當(dāng)2 6.635 時(shí),有99%的把握說事件 A與B有關(guān);當(dāng) 2 2.706) 0.10, P( 2 3.841) 0.05 , P( 2 6.635) 0.01 .2 2聯(lián)表的獨(dú)立
9、性檢驗(yàn):如果對(duì)于某個(gè)群體有兩種狀態(tài),對(duì)于每種狀態(tài)又有兩個(gè)情況,這樣排成一張2 2的表,如下:狀態(tài)B狀態(tài)B合計(jì)狀態(tài)Annn12n1狀態(tài)An21n22n2n 1n 2n如果有調(diào)查得來的四個(gè)數(shù)據(jù)nn ,門仁,n,1 , n?2,并希望根據(jù)這樣的4個(gè)數(shù)據(jù)來檢驗(yàn)上述的兩種狀態(tài)A與B是否有關(guān),就稱之為2 2聯(lián)表的獨(dú)立性檢驗(yàn).六. 回歸分析1. 回歸分析:對(duì)于具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的方法叫做回歸分析,即回歸分析就是尋找相 關(guān)關(guān)系中這種非確定關(guān)系的某種確定性.回歸直線:如果散點(diǎn)圖中的各點(diǎn)都大致分布在一條直線附近,就稱這兩個(gè)變量之間具有線性相關(guān)關(guān)系,這 條直線叫做回歸直線.2. 最小二乘法:記回歸直
10、線方程為: ? a bx,稱為變量Y對(duì)變量x的回歸直線方程,其中 a ,b叫做回歸系數(shù).?是為了區(qū)分Y的實(shí)際值y,當(dāng)x取值Xi時(shí),變量Y的相應(yīng)觀察值為 y,而直線上對(duì)應(yīng)于 Xi的縱坐標(biāo)是 ? a bx .設(shè)x,丫的一組觀察值為 * ,yj , i 1,2 ,L ,n,且回歸直線方程為 y? a bx ,當(dāng)x取值人時(shí),丫的相應(yīng)觀察值為y,差yi ?(i 1 , 2 , L ,n)刻畫了實(shí)際觀察值 與回歸直線上相應(yīng)點(diǎn)的 縱坐標(biāo)之間的偏離程度,稱這些值為離差.我們希望這n個(gè)離差構(gòu)成的總離差越小越好,這樣才能使所找的直線很貼近已知點(diǎn).n記Q (yi a bxj2,回歸直線就是所有直線中 Q取最小值的那
11、條.i 1這種使 離差平方和為最小”的方法,叫做最小二乘法.用最小二乘法求回歸系數(shù) a, b有如下的公式:nXi yi nxyI?七,0? y bx,其中a , b上方加人”表示是由觀察值按最小二乘法求得的回歸系數(shù).2 2Xi nxi 13. 線性回歸模型:將用于估計(jì) y值的線性函數(shù)a bx作為確定性函數(shù);y的實(shí)際值與估計(jì)值之間的誤差記 為,稱之為隨機(jī)誤差;將 y a bx稱為線性回歸模型.產(chǎn)生隨機(jī)誤差的主要原因有: 所用的確定性函數(shù)不恰當(dāng)即模型近似引起的誤差; 忽略了某些因素的影響,通常這些影響都比較??; 由于測(cè)量工具等原因,存在觀測(cè)誤差.4. 線性回歸系數(shù)的最佳估計(jì)值:利用最小二乘法可以得
12、到的計(jì)算公式為n(Xix)(yiy)i 1n2(XiX)i 1x yi nxyyi孚,a? y bX,其中x2 - 2Xin( x)由此得到的直線y?a? bx就稱為回歸直線,此直線方程即為線性回歸方程其中$分別為a , b的估i i計(jì)值,?稱為回歸截距,b稱為回歸系數(shù),y?稱為回歸值.5 相關(guān)系數(shù):n(Xi x)(yiy)xyii 1nxyn2 2X)(yiy)i 1n2 2n(x) )(yii 1回歸系數(shù)的推導(dǎo)過程:2Q(y a) bx 2y 2a y2na 2b x y 2ab xna 2a(bxiy)b2x2 2b2Xi yyi ,把上式看成a的二次函數(shù),a2的系數(shù)n0 ,r , r2
13、(b X因此當(dāng)ayi)yibx,-時(shí)取最小值.2nn的平均身高高.Galton把這種后代的身高向中間值靠近的趨勢(shì)稱為 的變化去推測(cè)另一個(gè)變量的變化的方法稱為回歸分析.同理,把Q的展開式按b的降幕排列,看成 b的二次函數(shù),當(dāng)b回歸現(xiàn)象”.后來,人們把由一個(gè)變量b2X2xy a2Xi時(shí)取最小值.2n(y)6. 相關(guān)系數(shù)r的性質(zhì): |r | 1 ;|r |越接近于1, X ,y的線性相關(guān)程度越強(qiáng);|r |越接近于0, x , y的線性相關(guān)程度越弱.可見,一條回歸直線有多大的預(yù)測(cè)功能,和變量間的相關(guān)系數(shù)密切相關(guān).7. 轉(zhuǎn)化思想:根據(jù)專業(yè)知識(shí)或散點(diǎn)圖,對(duì)某些特殊的非線性關(guān)系,選擇適當(dāng)?shù)淖兞看鷵Q,把非線性
14、方程轉(zhuǎn)化為線性回歸 方程,從而確定未知參數(shù).&一些備案回歸(regressio n) 詞的來歷: 回歸這個(gè)詞英國(guó)統(tǒng)計(jì)學(xué)家 Fran cils Galt on提出來的.1889年,他在研 究祖先與后代的身高之間的關(guān)系時(shí)發(fā)現(xiàn),身材較高的父母,他們的孩子也較高,但這些孩子的平均身高并 沒有他們父母的平均身高高;身材較矮的父母,他們的孩子也較矮,但這些孩子的平均身高卻比他們父母xyii 1nxyn22Xinxi 1解得:bny bx ,(Xi X)(yiy) c2 , a(Xi X)其中y yi , x xi是樣本平均數(shù).nn9.對(duì)相關(guān)系數(shù)r進(jìn)行相關(guān)性檢驗(yàn)的步驟: 提出統(tǒng)計(jì)假設(shè) H。:變量x , y不
15、具有線性相關(guān)關(guān)系; 如果以95%的把握作出推斷,那么可以根據(jù)1 0.95 0.05與n 2 ( n是樣本容量)在相關(guān)性檢驗(yàn)的臨界值表中查出一個(gè)r的臨界值心05 (其中1 0.95 0.05稱為檢驗(yàn)水平); 計(jì)算樣本相關(guān)系數(shù)r; 作出統(tǒng)計(jì)推斷:若|r| r.05,則否定H。,表明有95%的把握認(rèn)為變量y與x之間具有線性相關(guān)關(guān)系;若 |r | Da ,則沒有理由拒絕 H。,即就目前數(shù)據(jù)而言,沒有充分理由認(rèn)為變量 y與x之間具有線性相關(guān)關(guān)系. 說明:對(duì)相關(guān)系數(shù)r進(jìn)行顯著性檢驗(yàn),一般取檢驗(yàn)水平0.05,即可靠程度為95% .這里的r指的是線性相關(guān)系數(shù),r的絕對(duì)值很小,只是說明線性相關(guān)程度低,不一定不相
16、關(guān),可能是非線性相關(guān)的某種關(guān)系.這里的r是對(duì)抽樣數(shù)據(jù)而言的有時(shí)即使|r| 1,兩者也不一定是線性相關(guān)的故在統(tǒng)計(jì)分析時(shí),不能就數(shù)據(jù)論數(shù)據(jù),要結(jié)合實(shí)際情況進(jìn)行合理解釋.典例分析題型一莖葉圖【例1】(2010豐臺(tái)二模)甲、乙兩名運(yùn)動(dòng)員的 5次測(cè)試成績(jī)?nèi)缦聢D所示甲乙7 786 88 6 293 6 7X , X2分別表示甲、乙兩名運(yùn)動(dòng)員測(cè)試設(shè)si ,s2分別表示甲、乙兩名運(yùn)動(dòng)員測(cè)試成績(jī)的標(biāo)準(zhǔn)差,成績(jī)的平均數(shù),則有(A XX2 , s,S2x2 ,S2C XX,,SiS2D XX2 , sS2【例2】(2010宣武二模)隨機(jī)抽取某中學(xué)甲,乙兩班各10名同學(xué),測(cè)量他們的身高(單位:cm),獲得身高數(shù)據(jù)的莖
17、葉圖如圖,則下列關(guān)于甲,乙兩班這10名同學(xué)身高的結(jié)論正確的是()A 甲班同學(xué)身高的方差較大B 甲班同學(xué)身高的平均值較大C 甲班同學(xué)身高的中位數(shù)較大D 甲班同學(xué)身高在175以上的人數(shù)較多甲班乙班2181? 9 1 0Y10 3 6 8 98 3 3 2162 5 8g159【例3】(2010天津高考)中間一列的數(shù)字表示零件個(gè)數(shù)的十位數(shù),甲、乙兩人在10天中每天加工零件的個(gè)數(shù)用莖葉圖表示如下圖,兩邊的數(shù)字表示零件個(gè)數(shù)的個(gè)位數(shù),則這10天甲、乙兩人日加工零件的平均數(shù)分別為甲女9 81971013202142411530 2 0【例4】 右圖是某賽季甲、乙兩名籃球運(yùn)動(dòng)員每場(chǎng)比賽得分的莖葉圖,甲乙531
18、5368245479326781457則甲、乙兩人這幾場(chǎng)比賽得分的中位數(shù)之和是()A . 62B . 63C. 64D. 65【例5】 在某五場(chǎng)籃球比賽中,甲、乙兩名運(yùn)動(dòng)員得分的莖葉圖如右下列說法正確的是甲乙21001122348930A 在這五場(chǎng)比賽中,甲的平均得分比乙好,且甲比乙穩(wěn)定 B 在這五場(chǎng)比賽中,甲的平均得分比乙好,但乙比甲穩(wěn)定 C 在這五場(chǎng)比賽中,乙的平均得分比甲好,且乙比甲穩(wěn)定 D 在這五場(chǎng)比賽中,乙的平均得分比甲好,但甲比乙穩(wěn)定【例6】(2009年福建12)作品A89923x214某校開展愛我海西、愛我家鄉(xiāng)”攝影比賽,9位評(píng)委為參賽作 品A給出的分?jǐn)?shù)如莖葉圖所示,記分員在去掉一個(gè)最高分和一 個(gè)最低分后,算得平均分為 91,復(fù)核員在復(fù)核時(shí),發(fā)現(xiàn)有一個(gè) 數(shù)字(莖葉圖中的x)無法看清.若記分員計(jì)算無誤, 則數(shù)字x應(yīng)該是【例7】(2010東城一模)在一次數(shù)學(xué)統(tǒng)考后,某班隨
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 外科護(hù)理措施與患者安全管理
- 工會(huì)短培訓(xùn)課件
- 溫室大棚節(jié)能減排技術(shù)措施
- 房地產(chǎn)開發(fā)項(xiàng)目材料供貨及質(zhì)量措施
- 基于人工智能的智能倉(cāng)儲(chǔ)與配送調(diào)度優(yōu)化方案
- 電力公司參觀接待流程
- 2025-2030中國(guó)液體調(diào)味料行業(yè)市場(chǎng)發(fā)展分析及發(fā)展趨勢(shì)與投資戰(zhàn)略研究報(bào)告
- 2025-2030中國(guó)濃香雞汁行業(yè)營(yíng)銷策略趨勢(shì)及投資前景規(guī)劃研究報(bào)告
- 醫(yī)院信息安全應(yīng)急演練工作計(jì)劃
- 2025-2030中國(guó)水飛薊提取物行業(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略研究報(bào)告
- 實(shí)時(shí)熒光聚合酶鏈反應(yīng)臨床實(shí)驗(yàn)室應(yīng)用指南(WST-230-2024)
- 物流行業(yè)物流園區(qū)智慧安防方案
- 2024年出版專業(yè)資格考試《出版專業(yè)基礎(chǔ)知識(shí)》中級(jí)真題及答案
- 有機(jī)硅材料在電子封裝技術(shù)-洞察分析
- GB/T 45083-2024再生資源分揀中心建設(shè)和管理規(guī)范
- 中醫(yī)治療協(xié)議書范本(2篇)
- 沐足行業(yè)嚴(yán)禁黃賭毒承諾書
- 牧場(chǎng)物語(yǔ)礦石鎮(zhèn)的伙伴們攻略大全
- 中國(guó)肺動(dòng)脈高壓診治臨床路徑(2023版)解讀課件
- 【MOOC】C語(yǔ)言程序設(shè)計(jì)-華中科技大學(xué) 中國(guó)大學(xué)慕課MOOC答案
- 2024年廣東省基本藥物合理使用技能競(jìng)賽理論考試題庫(kù)(附答案)
評(píng)論
0/150
提交評(píng)論