版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第二章 統(tǒng)計(jì)簡(jiǎn)單隨機(jī)抽樣1. 總體和樣本總體:在統(tǒng)計(jì)學(xué)中,把研究對(duì)象的全體叫做總體.個(gè)體:把每個(gè)研究對(duì)象叫做個(gè)體.總體容量:把總體中個(gè)體的總數(shù)叫做總體容量.為了研究總體的有關(guān)性質(zhì),一般從總體中隨機(jī)抽取一局部:I ,=,''研究,我們稱(chēng)它為樣本其中個(gè)體的個(gè)數(shù)稱(chēng)為樣本容量。2簡(jiǎn)單隨機(jī)抽樣,也叫純隨機(jī)抽樣。就是從總體中不加任何分組、劃類(lèi)、排隊(duì)等,完全隨機(jī)地抽取調(diào)查單位。特點(diǎn):每個(gè)樣本單位被抽中的可能性相同概率相等,樣本的每個(gè)單位完全獨(dú)立,彼此間無(wú)一定的關(guān)聯(lián)性和排斥性。簡(jiǎn)單隨機(jī)抽樣是其它各種抽樣形式的根底。 通常只是在總體單位之間 差異程度較小 和數(shù)目較少時(shí),才采用這種方法。3簡(jiǎn)單隨機(jī)
2、抽樣常用的方法:1抽簽法;隨機(jī)數(shù)表法;電腦模擬法;使用統(tǒng)計(jì)軟件直接抽取。在簡(jiǎn)單隨機(jī)抽樣的樣本容量設(shè)計(jì)中,主要考慮:總體變異情況;允許誤差范圍;概率保證程度。4 .抽簽法:1給調(diào)查對(duì)象群體中的每一個(gè)對(duì)象編號(hào);2準(zhǔn)備抽簽的工具,實(shí)施抽簽3對(duì)樣本中的每一個(gè)個(gè)體進(jìn)行測(cè)量或調(diào)查例:請(qǐng)調(diào)查你所在的學(xué)校的學(xué)生做喜歡的體育活動(dòng)情況。5.隨機(jī)數(shù)表法:例:利用隨機(jī)數(shù)表在所在的班級(jí)中抽取10位同學(xué)參加某項(xiàng)活動(dòng)。系統(tǒng)抽樣1系統(tǒng)抽樣等距抽樣或機(jī)械抽樣:把總體的單位進(jìn)行排序,再計(jì)算出抽樣距離,然后按照這一固定的抽樣距離抽取樣本。第一個(gè)樣本采用簡(jiǎn)單隨機(jī)抽樣的方法抽取。K抽樣距離=N總體規(guī)模/n樣本規(guī)模前提條件:總體中個(gè)體的
3、排列對(duì)于研究的變量來(lái)說(shuō),應(yīng)是隨機(jī)的,即不存在某種與研究 變量相關(guān)的規(guī)那么分布??梢栽谡{(diào)查允許的條件下,從不同的樣本開(kāi)始抽樣,比照幾次樣本的 特點(diǎn)。 如果有明顯差異, 說(shuō)明樣本在總體中的分布承某種循環(huán)性規(guī)律, 且這種循環(huán)和抽樣距 離重合。2系統(tǒng)抽樣, 即等距抽樣是實(shí)際中最為常用的抽樣方法之一。因?yàn)樗鼘?duì)抽樣框的要求較低,實(shí)施也比擬簡(jiǎn)單。 更為重要的是, 如果有某種與調(diào)查指標(biāo)相關(guān)的輔助變量可供使用, 總體單 元按輔助變量的大小順序排隊(duì)的話(huà),使用系統(tǒng)抽樣可以大大提高估計(jì)精度。2.1.3 分層抽樣1分層抽樣類(lèi)型抽樣 :先將總體中的所有單位按照某種特征或標(biāo)志性別、年齡等劃分成假設(shè)干類(lèi)型或?qū)?次,然后再在各
4、個(gè)類(lèi)型或?qū)哟沃胁捎煤?jiǎn)單隨機(jī)抽樣或系用抽樣的方法抽取一個(gè)子樣本, 最后, 將這些子樣本合起來(lái)構(gòu)成總體的樣本。兩種方法:1先以分層變量將總體劃分為假設(shè)干層,再按照各層在總體中的比例從各層中抽取。2先以分層變量將總體劃分為假設(shè)干層,再將各層中的元素按分層的順序整齊排列, 最后用系統(tǒng)抽樣的方法抽取樣本。2分層抽樣是把異質(zhì)性較強(qiáng)的總體分成一個(gè)個(gè)同質(zhì)性較強(qiáng)的子總體,再抽取不同的子總體 中的樣本分別代表該子總體,所有的樣本進(jìn)而代表總體。分層標(biāo)準(zhǔn):1以調(diào)查所要分析和研究的主要變量或相關(guān)的變量作為分層的標(biāo)準(zhǔn)。2以保證各層內(nèi)部同質(zhì)性強(qiáng)、各層之間異質(zhì)性強(qiáng)、突出總體內(nèi)在結(jié)構(gòu)的變量作為分 層變量。3以那些有明顯分層區(qū)分
5、的變量作為分層變量。3分層的比例問(wèn)題: 1按比例分層抽樣:根據(jù)各種類(lèi)型或?qū)哟沃械膯挝粩?shù)目占總體單位數(shù)目的比重來(lái)抽取 子樣本的方法。 2不按比例分層抽樣:有的層次在總體中的比重太小,其樣本量就會(huì)非常少,此時(shí)采 用該方法, 主要是便于對(duì)不同層次的子總體進(jìn)行專(zhuān)門(mén)研究或進(jìn)行相互比擬。 如果要用樣本資 料推斷總體時(shí), 那么需要先對(duì)各層的數(shù)據(jù)資料進(jìn)行加權(quán)處理, 調(diào)整樣本中各層的比例, 使數(shù)據(jù) 恢復(fù)到總體中各層實(shí)際的比例結(jié)構(gòu)。三種抽樣方法的比擬類(lèi)另U共同點(diǎn)各自特點(diǎn)聯(lián)系適用范圍簡(jiǎn)單隨機(jī)抽樣1抽樣過(guò)程中每個(gè) 個(gè)體被抽到的可 能性相等2每次抽出個(gè)體后 不再將它放回,即 不放回抽樣從總體中逐個(gè)抽取總體個(gè)數(shù)較少將總體
6、均分成幾部 分,按預(yù)先制定的規(guī)那么 在各局部抽取在起始局部 樣時(shí)采用簡(jiǎn) 隨機(jī)抽樣總體個(gè)數(shù)較多系統(tǒng)抽樣將總體分成幾層,分層進(jìn)行抽取分層抽樣時(shí)采用簡(jiǎn)單隨機(jī)抽樣或系統(tǒng)抽樣總體由 差異明 顯的幾 局部組成分層抽樣頻率分布直方圖與莖葉圖1、我們把樣本抽取后,要對(duì)樣本進(jìn)行分析來(lái)研究總體的分布情況,對(duì)樣本進(jìn)行分析常采取兩種方式:列頻率分布表;頻率分布直方圖.頻率分布 是指一個(gè)樣本數(shù)據(jù)在各個(gè)小范圍內(nèi)所占比例的大小。一般用頻率分布直方圖反映樣本的頻率分布。畫(huà)頻率分布直方圖一般步驟為:求極差即樣本中的最大值與最小值的差;決定組距與組數(shù)組數(shù)極差組距將數(shù)據(jù)分組;列頻率分布表.5畫(huà)頻率分布直方圖根據(jù)頻率分布表做頻率分布
7、直方圖應(yīng)注意兩點(diǎn):縱軸的意義:頻率組距橫軸的意義:樣本內(nèi)容每個(gè)矩形下面是組距.頻率分布折線(xiàn)圖:連接頻率分布直方圖中各小長(zhǎng)方形上端的中點(diǎn),就得到頻率分布折線(xiàn)圖2. 莖葉圖:當(dāng)數(shù)據(jù)是兩位有效數(shù)字時(shí),用中間的數(shù)字表示十位數(shù),即第一個(gè)有效數(shù)字,兩邊的數(shù)字表示個(gè)位數(shù), 即第二個(gè)有效數(shù)字,它的中間局部像植物的莖,兩邊局部像植物莖上長(zhǎng)出來(lái)的葉子, 因此通常把這樣的圖叫做莖葉圖。見(jiàn)課本P61例子制作莖葉圖的方法是:先將數(shù)據(jù)按大小進(jìn)行排列,再將所有兩位數(shù)的十位數(shù)字作為“莖,個(gè)位數(shù)字作為“葉,莖相同者共用一個(gè)莖,莖按從小到大的順序從上向以下出,共莖的葉一般按從大到小或從小到大的順序同行列出注意:在制作莖葉圖時(shí),重
8、復(fù)出現(xiàn)的數(shù)據(jù)要重復(fù)記錄,不能遺漏,特別是“葉局部;同一數(shù)據(jù)出現(xiàn)幾次,就要在圖中表達(dá)幾次莖葉圖的特征:1用莖葉圖表示數(shù)據(jù)有兩個(gè)優(yōu)點(diǎn):一是從統(tǒng)計(jì)圖上沒(méi)有原始數(shù)據(jù)信息的損失,所有數(shù)據(jù)信息都可以從莖葉圖中得到;二是莖葉圖中的數(shù)據(jù)可以隨時(shí)記錄,隨時(shí)添加,方便記錄與表示。2莖葉圖只便于表示兩位有效數(shù)字的數(shù)據(jù),而且莖葉圖只方便記錄兩組的數(shù)據(jù),兩個(gè)以上的數(shù)據(jù)雖然能夠記錄,但是沒(méi)有表示兩個(gè)記錄那么直觀,清晰??傮w分布指的是總體取值的頻率分布規(guī)律,由于總體分布不易知道,因此我們往往用樣本的頻率分布去估計(jì)總體的分布。4總體的分布分兩種情況:當(dāng)總體中的個(gè)體取值很少時(shí),用莖葉圖估計(jì)總體的分布;當(dāng)總體 中的個(gè)體取值較多時(shí)
9、, 將樣本數(shù)據(jù)恰當(dāng)分組, 用各組的頻率分布描述總體的分布,方法是用頻率分布表或頻率分布直方圖。制作頻率分布表時(shí),假設(shè)容量是n,可按公式將數(shù)據(jù)分成大約K=1+lg n段。這類(lèi)的經(jīng)驗(yàn)公式只對(duì)分段起參考作用二、典例精析例1:下表給出了某校500名12歲男孩中用隨機(jī)抽樣得出的120人的身高(單位cm )區(qū)間界限122,126)126,130)130,134)134,138)138,142)142,146)人數(shù)5810P 223320區(qū)間界限146,150)150,154)154,158)人數(shù)1165(1) 列出樣本頻率分布表;(2) 一畫(huà)出頻率分布直方圖; 估計(jì)身高小于134cm的人數(shù)占總?cè)藬?shù)的百分比
10、。用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征1、眾數(shù)、中位數(shù)、平均數(shù):眾數(shù):在一組數(shù)據(jù)中,出現(xiàn)次數(shù)最多的數(shù)據(jù)。中位數(shù):將一組數(shù)據(jù)按大小依次排列,把處在中間位置的一個(gè)數(shù)據(jù)或中間兩個(gè)數(shù)據(jù)的平均數(shù)叫做這組數(shù)據(jù)的中位數(shù)。2、 樣本標(biāo)準(zhǔn)差:ss2(X1 x)2 (X22X)2(XnX)n3方差2 s-(X1nX)2(X2X)2(XnX)2在刻畫(huà)樣本數(shù)據(jù)的分散程度上,方差和標(biāo)準(zhǔn)差是-一樣的,但在解決實(shí)際問(wèn)題時(shí),平均數(shù):XX1X2nXn用標(biāo)準(zhǔn)差。用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征分兩類(lèi):a用樣本平均數(shù)估計(jì)總體平均數(shù)。b用樣本標(biāo)準(zhǔn)差估計(jì)總體標(biāo)準(zhǔn)差。樣本容量越大,估計(jì)就越精確。 特點(diǎn):1平均數(shù)對(duì)數(shù)據(jù)有“取齊的作用,代表
11、一組數(shù)據(jù)的平均水平。2標(biāo)準(zhǔn)差描述一組數(shù)據(jù)圍繞平均數(shù)波動(dòng)的大小,反映了一組數(shù)據(jù)變化的幅度。4 用樣本估計(jì)總體時(shí),如果抽樣的方法比擬合理,那么樣本可以反映總體的信息,但從樣 本得到的信息會(huì)有偏差。在隨機(jī)抽樣中,這種偏差是不可防止的。雖然我們用樣本數(shù)據(jù)得到的分布、均值和標(biāo)準(zhǔn)差并不是總體的真正的分布、均值和標(biāo)準(zhǔn)差,而只是一個(gè)估計(jì),但這種估計(jì)是合理的,特別是當(dāng)樣本量很大時(shí),它們確實(shí)反映了總體的信 息。4. 1如果把一組數(shù)據(jù)中的每一個(gè)數(shù)據(jù)都加上或減去同一個(gè)共同的常數(shù),標(biāo)準(zhǔn)差不變2如果把一組數(shù)據(jù)中的每一個(gè)數(shù)據(jù)乘以一個(gè)共同的常數(shù)k,標(biāo)準(zhǔn)差變?yōu)樵瓉?lái)的 k倍3一組數(shù)據(jù)中的最大值和最小值對(duì)標(biāo)準(zhǔn)差的影響,區(qū)間(x 3
12、s, x3s的應(yīng)用;“去掉一個(gè)最高分,去掉一個(gè)最低分中的科學(xué)道理兩個(gè)變量的線(xiàn)性相關(guān)1、概念:如果散點(diǎn)圖中點(diǎn)的分布從整體看大致分布在一條直線(xiàn)的附近 量之間具有線(xiàn)性相關(guān)關(guān)系,我們稱(chēng)這兩個(gè)變,這條直線(xiàn)叫回歸直線(xiàn).1回歸直線(xiàn)方程:? bx an(X x)(yii 1b n% X)y)nXy nxyi 12"2X nx , *i 1a y bx其中b是回歸方程的斜率,a是截距系數(shù)4.求線(xiàn)性回歸方程的步驟(i)計(jì)算平均數(shù)x, y ;計(jì)算人與y的積,求Xi yi ;2XiYii 1n2Xii 1n xy -y,求 b;2nx計(jì)算Xi ;(4)將結(jié)果代入公式b用a y bx ,求a;(6)寫(xiě)出回歸方程 +2. 取小二乘法3. 直線(xiàn)回歸方程的應(yīng)用1描述兩變量之間的依存關(guān)系;利用直線(xiàn)回歸方程即可定量描述兩個(gè)變量間依存的數(shù)量關(guān)系2利用回歸方程進(jìn)行預(yù)測(cè)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度光伏發(fā)電站投資建設(shè)與運(yùn)營(yíng)承包合同樣本3篇
- 2025年高校學(xué)生宿舍托管租賃服務(wù)合同范本3篇
- 二零二五年籃球運(yùn)動(dòng)場(chǎng)地照明節(jié)能改造合同2篇
- 四川省自貢市2024-2025學(xué)年八年級(jí)上學(xué)期期末考試道德與法治試題(含答案)
- 2025版圍擋安裝勞務(wù)分包合同范本(含氣候影響調(diào)整)2篇
- 《漿細(xì)胞白血病》課件
- 外幣存款利率的市場(chǎng)預(yù)測(cè)考核試卷
- 城市公共交通系統(tǒng)的創(chuàng)新與改進(jìn)考核試卷
- 《明代的政治與制度》課件
- 二零二五年度木雕工藝品出口退稅與稅收籌劃合同4篇
- 山東鐵投集團(tuán)招聘筆試沖刺題2025
- 真需求-打開(kāi)商業(yè)世界的萬(wàn)能鑰匙
- 2025年天津市政集團(tuán)公司招聘筆試參考題庫(kù)含答案解析
- GB/T 44953-2024雷電災(zāi)害調(diào)查技術(shù)規(guī)范
- 2024-2025學(xué)年度第一學(xué)期三年級(jí)語(yǔ)文寒假作業(yè)第三天
- 心律失常介入治療
- 6S精益實(shí)戰(zhàn)手冊(cè)
- 展會(huì)場(chǎng)館保潔管理服務(wù)方案
- 監(jiān)理從業(yè)水平培訓(xùn)課件
- 廣東省惠州市實(shí)驗(yàn)中學(xué)2025屆物理高二第一學(xué)期期末綜合測(cè)試試題含解析
- 獅子王電影欣賞
評(píng)論
0/150
提交評(píng)論