版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)的整理與抽樣1一、統(tǒng)計(jì)學(xué)中的基本概念(一)統(tǒng)計(jì)資料1.統(tǒng)計(jì)資料的定義、分類(lèi)與性質(zhì)可以推導(dǎo)出某項(xiàng)論斷的事實(shí)或數(shù)字都稱為統(tǒng)計(jì)資料。統(tǒng)計(jì)資料是統(tǒng)計(jì)分析、統(tǒng)計(jì)推斷和預(yù)測(cè)的基礎(chǔ)。統(tǒng)計(jì)資料分為原始(初級(jí))資料(未加工)與次級(jí)資料(加工過(guò))如:統(tǒng)計(jì)年鑒etc。統(tǒng)計(jì)數(shù)據(jù)可分:度量數(shù)據(jù)(如銷(xiāo)量等)和品質(zhì)數(shù)據(jù)(性別、民族e(cuò)tc)22.統(tǒng)計(jì)資料收集的方法間接引用或直接收集3.統(tǒng)計(jì)資料收集的途徑直接觀察、訪問(wèn)、問(wèn)卷調(diào)查4.統(tǒng)計(jì)資料收集的組織方式可分:專(zhuān)門(mén)調(diào)查(普查,重點(diǎn)調(diào)查,抽樣調(diào)查,典型調(diào)查)和統(tǒng)計(jì)報(bào)表(自上而下地逐級(jí)提供統(tǒng)計(jì)資料的一種調(diào)查方法)3
(二)總體與個(gè)體1.定義凡是客觀存在的、具有統(tǒng)一性質(zhì)的若干個(gè)別事物的集合體,就稱為統(tǒng)計(jì)總體。構(gòu)成總體的個(gè)別事物稱為個(gè)體(總體單位)考察一批10000件產(chǎn)品的質(zhì)量情況,10000件產(chǎn)品=總體,每一件產(chǎn)品=一個(gè)個(gè)體。42.總體和個(gè)體的必備條件(1)客觀性總體和個(gè)體必須是客觀存在的具體事物。如:工業(yè)企業(yè)是總體(客觀存在),自然數(shù)(集合體)但非總體,因1,2,3,……是抽象的“產(chǎn)品”,“糧食”非總體(2)大量性總體的個(gè)體須是大量的(足夠多)因?yàn)榻y(tǒng)計(jì)的目的是反映大量現(xiàn)象的規(guī)律和特點(diǎn)。5(3)同質(zhì)性總體的個(gè)體在性質(zhì)上須相同,因?yàn)榻y(tǒng)計(jì)研究的目的是反映總體的特性。例如,將機(jī)械零件與書(shū)本放在一起,就不會(huì)得出整個(gè)總體的任何結(jié)論。(4)差異性如10000件產(chǎn)品雖屬同一種產(chǎn)品,但在質(zhì)量、顏色、尺寸等方面不盡相同。若所有個(gè)體都完全相同的話,就無(wú)必要進(jìn)行統(tǒng)計(jì)研究了。如:同一種郵票800枚(同時(shí)出版)要研究這種郵票的面值、版面設(shè)計(jì)、圖案花紋etc,只需任取一枚郵票進(jìn)行鑒賞,就能通曉800枚郵票。這種研究方法不是統(tǒng)計(jì)方法。63.總體的分類(lèi)按其包含的個(gè)體數(shù)目可分:有限總體與無(wú)限總體。按其個(gè)體的時(shí)間分:空間總體(個(gè)體處于同一時(shí)間的不同空間),如人口普查,全國(guó)總?cè)丝诩礊榭臻g總體,時(shí)間總體(個(gè)體處于同一空間的不同時(shí)間),如某商店一年的銷(xiāo)售情況,即是時(shí)間總體??傮w與個(gè)體的概念是相對(duì)的!7(三)樣本1.定義樣本,是從總體中抽取出來(lái)進(jìn)行調(diào)查并據(jù)以推斷總體的那部分個(gè)體。樣本中包含的個(gè)體數(shù)目稱為樣本容量,用n表示,n>30,大樣本,反之,小樣本。樣本容量n與總體容量N的比,n/N稱為抽樣比,用f表示。82.樣本的類(lèi)型(1)代表性樣本樣本單位頻數(shù)是某種特征的樣本占總樣本數(shù)的比例??傮w的頻數(shù)是某種特征的個(gè)體占總體的比例若樣本單位頻數(shù)與總體的頻數(shù)成正比,則這種樣本稱之為代表性樣本。9(2)有偏樣本人為因素的影響,這種情況下的樣本稱為有偏樣本,是產(chǎn)生抽樣偏差的來(lái)源。(3)隨機(jī)樣本按隨機(jī)原則抽取的樣本。10(4)分層樣本(類(lèi)型樣本)
①將總體按某一標(biāo)志分成若干組。
②再?gòu)母鹘M中隨機(jī)抽樣??疾烊珖?guó)工商企業(yè)時(shí),先按行業(yè)分組,再抽樣,以避免所選出的樣本集中在某一行業(yè)。代表性高。11(5)整群樣本按群抽樣的樣本。如:考察某市小學(xué)生身體發(fā)育情況,隨機(jī)抽取若干小學(xué),對(duì)抽中小學(xué)的全體學(xué)生逐一考察。(省力省時(shí))(6)系統(tǒng)抽樣按某種規(guī)律(如固定的間隔)在總體中抽取樣本的方法。如:按身份證的編號(hào)抽取尾數(shù),為了進(jìn)行居民收入狀況調(diào)查。但當(dāng)總體呈現(xiàn)某種系統(tǒng)規(guī)律時(shí)(周期律)則不能采用,否則有系統(tǒng)誤差。12(四)標(biāo)志標(biāo)志是一種名稱,不是具體數(shù)字,是對(duì)個(gè)體某一特征質(zhì)的規(guī)定。標(biāo)志在個(gè)體的不同取值叫標(biāo)志值。其具體表現(xiàn)是文字值或數(shù)值。學(xué)習(xí)成績(jī)分別為80,98,91,86等成績(jī)=標(biāo)志分?jǐn)?shù)是標(biāo)志值13
標(biāo)志可分為:數(shù)量標(biāo)志:表明個(gè)體數(shù)量方面的特征(如成績(jī))品質(zhì)標(biāo)志:個(gè)體屬性方面的特征(性別)不變標(biāo)志(性別)可變標(biāo)志(成績(jī))14二、抽樣方法1.簡(jiǎn)單隨機(jī)抽樣(樣本同分布,抽樣相互獨(dú)立)每個(gè)個(gè)體被抽中的可能性相等。如:抽簽。2.分層隨機(jī)抽樣先分組,在分別從各組中簡(jiǎn)單隨機(jī)抽樣,可增大樣本代表性,推斷結(jié)果準(zhǔn)確性高,層內(nèi)差異小,層間差異大。153.整群抽樣將總體分成若干群,在隨機(jī)抽一部分群體做樣本,并對(duì)這些群體的所有個(gè)體全面調(diào)查,隨機(jī)抽組法與組內(nèi)普查法的結(jié)合。4.系統(tǒng)隨機(jī)抽樣法(等距抽樣或機(jī)械抽樣)基本思想:對(duì)于容量為N的總體,將個(gè)體編號(hào)從1到N。若要抽取容量為n的樣本,則應(yīng)先從編號(hào)為1到K(K=[N/n])的K個(gè)個(gè)體中,隨機(jī)抽取一個(gè),然后,按照一定的規(guī)律,抽取個(gè)體,順次得到容量為n的樣本。舉例(略)16三、數(shù)據(jù)的整理與圖形表示。(一)分組按一定的變異標(biāo)志,將總體分成若干部分,統(tǒng)計(jì)分組是分組整理的基礎(chǔ)??蓜澐稚鐣?huì)經(jīng)濟(jì)現(xiàn)象的類(lèi)型,研究現(xiàn)象的內(nèi)部結(jié)構(gòu)及分析現(xiàn)象之間的依存關(guān)系。統(tǒng)計(jì)分組的要求和基本原則(略)。(二)數(shù)據(jù)的圖形表示餅圖、直方圖、尋形圖、柱狀圖etc表示統(tǒng)計(jì)數(shù)據(jù),顯直觀。17四、數(shù)據(jù)的描述性指標(biāo)(一)集中趨勢(shì)
1.均值,是算術(shù)平均數(shù),是數(shù)據(jù)集中趨勢(shì)的最重要測(cè)度值。(1)原始數(shù)據(jù):
18(2)分組后的數(shù)據(jù):xi表示第i組的組中值,fi表示第i組數(shù)據(jù)的個(gè)數(shù)均值反映了數(shù)據(jù)的數(shù)量集中的特征,是數(shù)據(jù)偶然性、隨機(jī)性特征相互抵消后的穩(wěn)定數(shù)值,反映了一些數(shù)據(jù)必然的特點(diǎn)。
19(3)幾何平均數(shù)G=ai為第i期發(fā)展速度或各個(gè)比率。202.中位數(shù)(中數(shù))中位數(shù)是將數(shù)據(jù)按大小順序排隊(duì)后,位置處在最中間的那個(gè)數(shù)。不受極端值(大、?。┑挠绊?。如數(shù)據(jù)個(gè)數(shù)為偶數(shù),則最中間兩數(shù)的平均數(shù)為中位數(shù)。213.上四分位數(shù)(設(shè)為xi),則i=[]xi
表示約有1/4的數(shù)據(jù)比xi
大,3/4的數(shù)據(jù)比xi小4.下是分位數(shù)(設(shè)為x)其中j=[]
表示約有3/4的數(shù)據(jù)比xj
大,1/4的數(shù)據(jù)比xj小。225、眾數(shù),出現(xiàn)次數(shù)最多的數(shù)值(可能有多個(gè)),均值是計(jì)算的測(cè)度值,其它從位置考慮。例:某班30MBA學(xué)生的年齡按上升順序排序?yàn)椋?4、24、25、25、25、25、26、26、26、26、27、27、27、27、27、28、28、28、28、28、29、29、30、30、30、30、31、31、31、32
眾數(shù)為27和28(5次),中數(shù)==27.5
平均數(shù)為27.67,上四分位數(shù)為x23=30,下四分位數(shù)x8=26,23(二)離散趨勢(shì),1.極差(全距)R=max(Xi)-min(Xi)只利用了數(shù)據(jù)兩端的信息。242、方差和標(biāo)準(zhǔn)差:
標(biāo)準(zhǔn)差=σ2大反映均值的代表性差,反之,強(qiáng)。253.四分位差即上四分位數(shù)與下四分位數(shù)的差26五、統(tǒng)計(jì)量的分布(一)統(tǒng)計(jì)量的定義設(shè)X1、X2、……、Xn是來(lái)自總體X的一個(gè)樣本,g(X1、X2、……、Xn)是X1、X2、……、Xn的函數(shù),若g是連續(xù)函數(shù),且不含任何未知參數(shù),則g(X1、X2、……、Xn)是一個(gè)統(tǒng)計(jì)量。27(二)常用統(tǒng)計(jì)量
設(shè)X1、X2、……、Xn是來(lái)自總體X的一個(gè)樣本,x1、x2、……、xn是這一樣本的觀測(cè)值,則1.樣本平均值:2.樣本方差:283.樣本標(biāo)準(zhǔn)差:4.樣本k階(原點(diǎn))矩:,k=1,2,……5.樣本k階中心矩:,k=1,2,……用xi代替Xi,相應(yīng)得到觀察值,s2,s,ak,bk(名稱不變)29(三)幾種常用的分布1.χ2分布設(shè)x1,x2,……,xn是來(lái)自總體
N(0,1)的樣本,則稱隨機(jī)變量=x12+x22+……+xn230
服從自由度為n的χ2分布,記為χ2~χ2(n),χ2(n)分布的概率密度為:
31χ2分布的性質(zhì):
(1)可加性:設(shè)χ12
~χ2(n1),χ22
~χ2(n2),且χ12
與χ22相互獨(dú)立,則有:
χ12+χ22~χ2(n1+n2)
(2)若χ2~χ2(n),則有:
E(χ2)=n,D(χ2)=2n32(3)對(duì)于給定的正數(shù),0<<1,若則為χ2(n)分布的上分布點(diǎn)33如查表知χ0.012(10)=2.558當(dāng)n充分大時(shí),有其中是標(biāo)準(zhǔn)正態(tài)分布的上分位點(diǎn)。
34附:若Z~N(0,1),則Z為標(biāo)準(zhǔn)正態(tài)變量,其密度函數(shù)為:
35(1)若對(duì),有,則為N(0,1)分布的上點(diǎn)
36(2)若對(duì),有,則為N(0,1)的雙側(cè)分位點(diǎn)37(3)上點(diǎn)的求法∵,又∴φ()=1-,反查表,得382.t分布設(shè)χ~N(0,1),Y~χ2(n),且χ,Y相互獨(dú)立,則稱隨機(jī)變量
服從自由度為n的t-分布,記為t~t(n)39其密度函數(shù)為:40對(duì)給定,若則點(diǎn)為t(n)分布的上分位點(diǎn)41顯然(n)=-(n)(WHY)t0.95(8)=-t0.05(8)=-1.8595當(dāng)n充分大的時(shí)候,有(n)=423、F分布設(shè)U~2(n1),V~2(n2),且U,V相互獨(dú)立,則稱隨機(jī)變量服從自由度為(n1,n2)的F分布,記為F~F(n1,n2).43其密度函數(shù)為
:顯然,若F~F(n1,n2),則~F(n2,n1)(定義知)44對(duì)于結(jié)果0<α<1,若則稱F(n1,n2)為F(n1,n2)分布的上分位點(diǎn)。
45顯然有(n1,n2)=(定義知)F0.9(5,10)==0.3030464.正態(tài)總體的樣本均值和樣本方差的分布(1)設(shè)總體X的均值為μ,方差為σ2,x1,x2,……,xn是X的一個(gè)樣本,則有,(2)設(shè)x1,x2,……,xn為來(lái)自總體X~N(μ,σ2)的一個(gè)樣本,則,47(3)設(shè)x1,x2,……,xn為來(lái)自總體X~N(μ,σ2)的一個(gè)樣本,則有
①②與S2相互獨(dú)立
48(4)x1,x2,……,xn為來(lái)自總體X~N(μ,σ2)的一個(gè)樣本,與S2分別是樣本均值和樣本方差,則有:
49(5)設(shè)x1,x2,……,xn1與Y1,Y2,……,Yn2分別是具有相同方差的兩個(gè)正態(tài)總體N(μ1,σ2),N(μ2,σ2)的樣本,且這兩個(gè)樣本相互獨(dú)立。設(shè),,分別是這兩個(gè)樣本的均值
50
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 智慧解決方案:智能城市管理
- 消防應(yīng)急避險(xiǎn)
- 3.2.3離子反應(yīng) 課件 高一上學(xué)期化學(xué)蘇教版(2019)必修第一冊(cè)
- 糖尿病個(gè)人教育與護(hù)理
- 傳統(tǒng)毛筆課件教學(xué)課件
- 日常生活食品安全
- 生產(chǎn)安全事故案例培訓(xùn)教材
- 布谷鳥(niǎo)節(jié)奏游戲教案反思
- 弧度制說(shuō)課稿
- 海水的運(yùn)動(dòng)說(shuō)課稿
- 《家國(guó)情懷》的主題班會(huì)
- 《分香蕉》二年級(jí)數(shù)學(xué)
- QGIS軟件及其應(yīng)用教程
- 詩(shī)歌鑒賞之思想感情
- 幼兒營(yíng)養(yǎng)與膳食管理(嬰幼兒照護(hù))PPT完整全套教學(xué)課件
- 數(shù)學(xué)(基礎(chǔ)模塊)上下兩冊(cè)中職PPT完整全套教學(xué)課件
- 3-3 細(xì)胞核的結(jié)構(gòu)和功能(26張)
- 京東通天塔系統(tǒng)操作說(shuō)明
- 家庭照護(hù)員題庫(kù)
- 鐵道概論高職PPT完整全套教學(xué)課件
- 肩關(guān)節(jié)周?chē)椎闹委熍c護(hù)理
評(píng)論
0/150
提交評(píng)論