




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、統(tǒng) 計抽樣方法1.抽樣方法:(1)簡單隨機抽樣(抽簽法、隨機數(shù)表法)常常用于總體個數(shù)較少時,它的特征是從總體中逐個抽??;(2)系統(tǒng)抽樣也叫等距離抽樣,常用于總體個數(shù)較多時,它的主要特征是均衡成若干部分,每部分只取一個;(3)分層抽樣,主要特征是分層按比例抽樣,主要用于總體中有明顯差異,它們的共同點:每個個體被抽到的概率都相等,體現(xiàn)了抽樣的客觀性和平等性。如(1)某社區(qū)有500個家庭,其中高收入家庭125戶,中等收入家庭280戶,低收入家庭95。為了調查社會購買力的某項指標,要從中抽取一個容量為100戶的樣本,把這種抽樣記為A;某中學高中一年級有12名女排運動員,要從中選取3人調查學習負擔的情況
2、,把這種抽樣記為B,那么完成上述兩項調查應分別采用的抽樣方法:A為_,B為_。(答:分層抽樣,簡單隨機抽樣);(3)某中學有高一學生400人,高二學生300人,高三學生300人,現(xiàn)通過分層抽樣抽取一個容量為n的樣本,已知每個學生被抽到的概率為0.2,則n= _(答:200);(4)容量為100的樣本拆分成10組,前7組的頻率之和為0.79,而剩下的三組的頻數(shù)組成等比數(shù)列,且其公比不為1,則剩下的三組中頻數(shù)最大的一組的頻率是_(答:0.16);(5)用簡單隨機抽樣的方法從含有10個個體的總體中,抽取一個容量為2的樣本,則某一個體“第一次被抽到的概率”,“第一次未被抽到,第二次被抽到的概率”,“在
3、整個抽樣過程中被抽到的概率”分別是_(答:);2.總體分布的估計:用樣本估計總體,是研究統(tǒng)計問題的一個基本思想方法,即用樣本平均數(shù)估計總體平均數(shù)(即總體期望值描述一個總體的平均水平);用樣本方差估計總體方差(方差和標準差是描述一個樣本和總體的波動大小的特征數(shù),方差或標準差越小,表示這個樣本或總體的波動越小,即越穩(wěn)定)。一般地,樣本容量越大,這種估計就越精確??傮w估計要掌握:(1)“表”(頻率分布表);(2)“圖”(頻率分布直方圖)。頻率分布直方圖的特征:(1)從頻率分布直方圖可以清楚的看出數(shù)據(jù)分布的總體趨勢。(2)從頻率分布直方圖得不出原始的數(shù)據(jù)內容,把數(shù)據(jù)表示成直方圖后,原有的具體數(shù)據(jù)信息就
4、被抹掉了。頻率直方圖的作法: (1)算數(shù)據(jù)極差 (2)決定組距和組數(shù); (3)決定分點; (4)列頻率分布表; (5)畫頻率直方圖。 提醒:直方圖的縱軸(小矩形的高)一般是頻率除以組距的商(而不是頻率),橫軸一般是數(shù)據(jù)的大小,小矩形的面積表示頻率。組數(shù)的決定方法是:設數(shù)據(jù)總數(shù)目為n,時,分為組;時,分為組.如(1)一個容量為20的樣本數(shù)據(jù),分組后組距與頻數(shù)如下: (10,20,2;(20,30,3;(30,40,4;(40,50,5;(50,60,4;(60,70,2;則樣本在區(qū)間上的頻率為A5% B25% C50% D70%(答:D);(2)已知樣本:10 8 6 10 13 8 10 12
5、 11 7 8 9 11 9 12 9 10 11 12 12 ,那么頻率為0.3的范圍是A5.57.5 B7.59.5 C9.511.5 D11.513.5(答:B);(3)觀察新生兒的體重,其頻率分布直方圖如圖所示,則新生兒的體重在2700,3000的頻率為_(答:0.3);O240027003600330030003900體重(g)0.001(4)如圖,是一次數(shù)學考試成績的樣本頻率分布直方圖(樣本容量n=200),若成績不低于60分為及格,則樣本中的及格人數(shù)是_(答:120); 分數(shù)頻率/組距0204060801000.0180.0120.0090.0060.005(5) 有同一型號的汽
6、車100輛,為了解這種汽車每蠔油1L所行路程的情況,現(xiàn)從中隨即抽出10輛在同一條件下進行蠔油1L所行路程實驗,得到如下樣本數(shù)據(jù)(單位:km):13.7,12.7,14.4,13.8,13.3,12.5,13.5,13.6,13.1,13.4,其分組如下:分組頻數(shù)頻率12.45,12.95)12.95,13.45)13.45,13.95)13.95,14.45)合計101.0(1)完成上面頻率分布表;(2)根據(jù)上表,在給定坐標系中畫出頻率分布直線圖,并根據(jù)樣本估計總體數(shù)據(jù)落在12.95,13.95)中的概率;(3)根據(jù)樣本,對總體的期望值進行估計解:(1)頻率分布表:分組頻數(shù)頻率12.45,12
7、.95)20.212.95,13.45)30.313.45,13.95)40.4:13.95,14.45)10.1合計101.0(2)頻率分布直方圖:估計總體數(shù)據(jù)落在12.95,13.95)中的概率為0.7(3)13.4因此,總體的期望值進行估計約為13.4.(6)為了了解高一學生的體能情況,某校抽取部分學生進行一分鐘跳繩次數(shù)次測試,將所得數(shù)據(jù)整理后,畫出頻率分布直方圖(如圖),圖中從左到右各小長方形面積之比為2:4:17:15:9:3,第二小組頻數(shù)為12.90100110120130140150次數(shù)o0.0040.0080.0120.0160.0200.0240.028頻率/組距0.0320
8、.036(1) 第二小組的頻率是多少?樣本容量是多少?(2) 若次數(shù)在110以上(含110次)為達標,試估計該學校全體高一學生的達標率是多少?(3) 在這次測試中,學生跳繩次數(shù)的中位數(shù)落在哪個小組內?請說明理由。分析:在頻率分布直方圖中,各小長方形的面積等于相應各組的頻率,小長方形的高與頻數(shù)成正比,各組頻數(shù)之和等于樣本容量,頻率之和等于1。解:(1)由于頻率分布直方圖以面積的形式反映了數(shù)據(jù)落在各小組內的頻率大小,因此第二小組的頻率為:又因為頻率=,所以 (2)由圖可估計該學校高一學生的達標率約為(3)由已知可得各小組的頻數(shù)依次為6,12,51,45,27,9,所以前三組的頻數(shù)之和為69,前四組
9、的頻數(shù)之和為114,所以跳繩次數(shù)的中位數(shù)落在第四小組內。3、樣本平均數(shù): 。如有一組數(shù)據(jù):x1,x2,xn(x1x2xn),它們的算術平均值為20,若去掉其中的xn,余下數(shù)據(jù)的算術平均值為18,則xn關于n的表達式為 (答:)。4、樣本方差:;樣本標準差:。如(1)甲、乙兩名射擊運動員參加某大型運動會的預選賽,他們分別射擊了5次,成績如下表(單位:環(huán))甲108999乙1010799如果甲、乙兩人中只有1人入選,則入選的應是 (答:甲);(2)已知實數(shù)的期望值為,方差為,若,則一定有 A B C D與無法比較大?。ù穑築);(3)某班40人隨機平均分成兩組,兩組學生一次考試的成績情況如下表: 則
10、全班的平均分為_,方差為_(答:85,51)提醒:若的平均數(shù)為,方差為,則的平均數(shù)為,方差為。如已知數(shù)據(jù)的平均數(shù),方差,則數(shù)據(jù)的平均數(shù)和標準差分別為 A15,36 B22,6 C15,6 D22,36 (答:B)5.莖葉圖(1) 莖葉圖的畫法:將每個數(shù)據(jù)分為莖(高位)與葉(低位)兩部分,將最大莖和最小莖之間的數(shù)按大小順序排成一列,將各數(shù)據(jù)的葉依先后次序寫在其莖的左(右)兩側. 統(tǒng)計量組別平均分方差第1組8016第2組9036 (2)莖葉圖的特征:()用莖葉圖表示數(shù)據(jù)有兩個優(yōu)點:一是從統(tǒng)計圖上沒有原始數(shù)據(jù)信息的損失,所有數(shù)據(jù)信息都可以從莖葉圖中得到;二是莖葉圖中的數(shù)據(jù)可以隨時記錄,隨時添加,方便
11、記錄與表示。()莖葉圖只便于表示兩位有效數(shù)字的數(shù)據(jù),而且莖葉圖只方便記錄兩組的數(shù)據(jù),兩個以上的數(shù)據(jù)雖然能夠記錄,但是沒有表示兩個記錄那么直觀,清晰。6. 獨立性檢驗獨立性檢驗是檢定兩個事件間是否獨立的統(tǒng)計方法,是卡方檢驗的一個應用. 卡方檢驗是對樣本的頻數(shù)分布所來自的總體分布是否服從某種理論分布或某種假設分布所作的假設檢驗.即根據(jù)樣本的頻數(shù)分布來推斷總體的分布,卡方獨立性檢驗的零假設是各事件之間相互獨立.卡方值永遠大于零. 2的兩個臨界值分別是3.841,與6.635.3.841時,接受假設即兩事件無關.相關系數(shù)是測定變量之間相關密切程度和相關方向的代表性指標。相關系數(shù)用符號“r ”表示,其特
12、點表現(xiàn)在:參與相關分析的兩個變量是對等的,不分自變量和因變量,改變兩變量的地位并不影響相關系數(shù)的數(shù)值,因此相關系數(shù)只有一個;相關系數(shù)有正負號反映相關系數(shù)的方向,正號反映正相關,負號反映負相關; 回歸和相關都是研究兩個變量相互關系的分析方法。相關分析研究兩個變量之間相關的方向和相關的密切程度。但是相關分析不能指出兩變量相互關系的具體形式,也無法從一個變量的變化來推測另一個變量的變化關系?;貧w方程則是通過一定的數(shù)學方程來反映變量之間相互關系的具體形式,以便從一個已知量來推測另一個未知量。為估算預測提供一個重要的方法。相關性檢驗的步驟是:(1)做統(tǒng)計假設:x與Y不具備線性相關關系.(2)根據(jù)小概率0
13、.05與查出r的一個臨界值.(3)根據(jù)樣本相關系數(shù)公式計算出r的值.(4)作統(tǒng)計推斷:如果表明95%的把握認為x與Y之間具備線性相關關系,如果接受假設.提醒:A與B有關并不意味著A的發(fā)生必然導致B的發(fā)生.7.回歸分析回歸分析是對具有相關關系的兩個或兩個以上變量之間數(shù)量變化的一般關系進行測定,確定一個相應的數(shù)學表達式,以便從一個已知量來推測另一個未知量,為估計預測提供一個重要的方法。在回歸分析中,由X推算Y與由Y推算X的回歸方程是不同的,不可混淆: .與相關分析相比,回歸分析的特點是:兩個變量是不對等的,只能用自變量來估計因變量,而不允許由因變量來推測自變量,必須區(qū)分自變量,一般說,事物的原因作
14、自變量X.回歸分析和相關分析是互相補充、密切聯(lián)系的。相關分析需要回歸分析來表明現(xiàn)象數(shù)量相關的具體形式,而回歸分析則應該建立在相關分析的基礎上。依靠相關分析表明現(xiàn)象的數(shù)量變化具有密切相關,進行回歸分析求其相關的具體形式才有意義。如(1)在研究色盲與性別的關系調查中,調查了男性480人,其中有38人患色盲,調查的520個女性中6人患色盲,(1)根據(jù)以上的數(shù)據(jù)建立一個2×2的列聯(lián)表;(2)若認為“性別與患色盲有關系”,則出錯的概率會是多少解:(1)患色盲不患色盲總計男38442480女6514520總計449561000 (2)假設H :“性別與患色盲沒有關系” 先算出K 的觀測值: 則有 即是H 成立的概率不超過0.001, 若認為“性別與患色盲有關系”,則出錯的概率為0.001(2)一
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 人物形象塑造與刻畫作文(7篇)
- ××超市薪酬管理細則
- ××中學保安巡邏記錄存檔制度
- 某商超資源教室規(guī)定
- 2025年電工(初級)職業(yè)技能鑒定實操試卷:電氣設備安全操作案例分析
- 物業(yè)智能服務外包協(xié)議
- 2025年勞動關系協(xié)調員(中級)考試試卷:勞動關系協(xié)調法律法規(guī)應用與案例分析
- 2025年電梯檢驗員資格考試試卷:電梯事故案例分析試題
- 廣告公司服務范圍及費用支付協(xié)議
- 2025年阿拉伯語水平測試經(jīng)典試題模擬試卷
- 人體解剖學章節(jié)練習題及復習資料(同步)
- 糖尿病老年人飲食護理
- 解憂雜貨鋪ppt讀書分享
- 銀行對公業(yè)務培訓課件
- 玻璃粉生產工藝
- 高處墜落及應急救援培訓考試試題及答案
- 金川公司社會招聘考試題
- 高中地理100個答題模板
- 信息安全、網(wǎng)絡安全和隱私保護-信息安全控制風險清單(雷澤佳編制2024A0)
- 農村財會培訓課件
- 社區(qū)超市食品安全管理培訓
評論
0/150
提交評論