




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
數(shù)據(jù)的整理與抽樣1一、統(tǒng)計學(xué)中的基本概念(一)統(tǒng)計資料1.統(tǒng)計資料的定義、分類與性質(zhì)可以推導(dǎo)出某項論斷的事實或數(shù)字都稱為統(tǒng)計資料。統(tǒng)計資料是統(tǒng)計分析、統(tǒng)計推斷和預(yù)測的基礎(chǔ)。統(tǒng)計資料分為原始(初級)資料(未加工)與次級資料(加工過)如:統(tǒng)計年鑒etc。統(tǒng)計數(shù)據(jù)可分:度量數(shù)據(jù)(如銷量等)和品質(zhì)數(shù)據(jù)(性別、民族etc)22.統(tǒng)計資料收集的方法間接引用或直接收集3.統(tǒng)計資料收集的途徑直接觀察、訪問、問卷調(diào)查4.統(tǒng)計資料收集的組織方式可分:專門調(diào)查(普查,重點調(diào)查,抽樣調(diào)查,典型調(diào)查)和統(tǒng)計報表(自上而下地逐級提供統(tǒng)計資料的一種調(diào)查方法)3
(二)總體與個體1.定義凡是客觀存在的、具有統(tǒng)一性質(zhì)的若干個別事物的集合體,就稱為統(tǒng)計總體。構(gòu)成總體的個別事物稱為個體(總體單位)考察一批10000件產(chǎn)品的質(zhì)量情況,10000件產(chǎn)品=總體,每一件產(chǎn)品=一個個體。42.總體和個體的必備條件(1)客觀性總體和個體必須是客觀存在的具體事物。如:工業(yè)企業(yè)是總體(客觀存在),自然數(shù)(集合體)但非總體,因1,2,3,……是抽象的“產(chǎn)品”,“糧食”非總體(2)大量性總體的個體須是大量的(足夠多)因為統(tǒng)計的目的是反映大量現(xiàn)象的規(guī)律和特點。5(3)同質(zhì)性總體的個體在性質(zhì)上須相同,因為統(tǒng)計研究的目的是反映總體的特性。例如,將機(jī)械零件與書本放在一起,就不會得出整個總體的任何結(jié)論。(4)差異性如10000件產(chǎn)品雖屬同一種產(chǎn)品,但在質(zhì)量、顏色、尺寸等方面不盡相同。若所有個體都完全相同的話,就無必要進(jìn)行統(tǒng)計研究了。如:同一種郵票800枚(同時出版)要研究這種郵票的面值、版面設(shè)計、圖案花紋etc,只需任取一枚郵票進(jìn)行鑒賞,就能通曉800枚郵票。這種研究方法不是統(tǒng)計方法。63.總體的分類按其包含的個體數(shù)目可分:有限總體與無限總體。按其個體的時間分:空間總體(個體處于同一時間的不同空間),如人口普查,全國總?cè)丝诩礊榭臻g總體,時間總體(個體處于同一空間的不同時間),如某商店一年的銷售情況,即是時間總體。總體與個體的概念是相對的!7(三)樣本1.定義樣本,是從總體中抽取出來進(jìn)行調(diào)查并據(jù)以推斷總體的那部分個體。樣本中包含的個體數(shù)目稱為樣本容量,用n表示,n>30,大樣本,反之,小樣本。樣本容量n與總體容量N的比,n/N稱為抽樣比,用f表示。82.樣本的類型(1)代表性樣本樣本單位頻數(shù)是某種特征的樣本占總樣本數(shù)的比例??傮w的頻數(shù)是某種特征的個體占總體的比例若樣本單位頻數(shù)與總體的頻數(shù)成正比,則這種樣本稱之為代表性樣本。9(2)有偏樣本人為因素的影響,這種情況下的樣本稱為有偏樣本,是產(chǎn)生抽樣偏差的來源。(3)隨機(jī)樣本按隨機(jī)原則抽取的樣本。10(4)分層樣本(類型樣本)
①將總體按某一標(biāo)志分成若干組。
②再從各組中隨機(jī)抽樣。考察全國工商企業(yè)時,先按行業(yè)分組,再抽樣,以避免所選出的樣本集中在某一行業(yè)。代表性高。11(5)整群樣本按群抽樣的樣本。如:考察某市小學(xué)生身體發(fā)育情況,隨機(jī)抽取若干小學(xué),對抽中小學(xué)的全體學(xué)生逐一考察。(省力省時)(6)系統(tǒng)抽樣按某種規(guī)律(如固定的間隔)在總體中抽取樣本的方法。如:按身份證的編號抽取尾數(shù),為了進(jìn)行居民收入狀況調(diào)查。但當(dāng)總體呈現(xiàn)某種系統(tǒng)規(guī)律時(周期律)則不能采用,否則有系統(tǒng)誤差。12(四)標(biāo)志標(biāo)志是一種名稱,不是具體數(shù)字,是對個體某一特征質(zhì)的規(guī)定。標(biāo)志在個體的不同取值叫標(biāo)志值。其具體表現(xiàn)是文字值或數(shù)值。學(xué)習(xí)成績分別為80,98,91,86等成績=標(biāo)志分?jǐn)?shù)是標(biāo)志值13
標(biāo)志可分為:數(shù)量標(biāo)志:表明個體數(shù)量方面的特征(如成績)品質(zhì)標(biāo)志:個體屬性方面的特征(性別)不變標(biāo)志(性別)可變標(biāo)志(成績)14二、抽樣方法1.簡單隨機(jī)抽樣(樣本同分布,抽樣相互獨立)每個個體被抽中的可能性相等。如:抽簽。2.分層隨機(jī)抽樣先分組,在分別從各組中簡單隨機(jī)抽樣,可增大樣本代表性,推斷結(jié)果準(zhǔn)確性高,層內(nèi)差異小,層間差異大。153.整群抽樣將總體分成若干群,在隨機(jī)抽一部分群體做樣本,并對這些群體的所有個體全面調(diào)查,隨機(jī)抽組法與組內(nèi)普查法的結(jié)合。4.系統(tǒng)隨機(jī)抽樣法(等距抽樣或機(jī)械抽樣)基本思想:對于容量為N的總體,將個體編號從1到N。若要抽取容量為n的樣本,則應(yīng)先從編號為1到K(K=[N/n])的K個個體中,隨機(jī)抽取一個,然后,按照一定的規(guī)律,抽取個體,順次得到容量為n的樣本。舉例(略)16三、數(shù)據(jù)的整理與圖形表示。(一)分組按一定的變異標(biāo)志,將總體分成若干部分,統(tǒng)計分組是分組整理的基礎(chǔ)??蓜澐稚鐣?jīng)濟(jì)現(xiàn)象的類型,研究現(xiàn)象的內(nèi)部結(jié)構(gòu)及分析現(xiàn)象之間的依存關(guān)系。統(tǒng)計分組的要求和基本原則(略)。(二)數(shù)據(jù)的圖形表示餅圖、直方圖、尋形圖、柱狀圖etc表示統(tǒng)計數(shù)據(jù),顯直觀。17四、數(shù)據(jù)的描述性指標(biāo)(一)集中趨勢
1.均值,是算術(shù)平均數(shù),是數(shù)據(jù)集中趨勢的最重要測度值。(1)原始數(shù)據(jù):
18(2)分組后的數(shù)據(jù):xi表示第i組的組中值,fi表示第i組數(shù)據(jù)的個數(shù)均值反映了數(shù)據(jù)的數(shù)量集中的特征,是數(shù)據(jù)偶然性、隨機(jī)性特征相互抵消后的穩(wěn)定數(shù)值,反映了一些數(shù)據(jù)必然的特點。
19(3)幾何平均數(shù)G=ai為第i期發(fā)展速度或各個比率。202.中位數(shù)(中數(shù))中位數(shù)是將數(shù)據(jù)按大小順序排隊后,位置處在最中間的那個數(shù)。不受極端值(大、?。┑挠绊?。如數(shù)據(jù)個數(shù)為偶數(shù),則最中間兩數(shù)的平均數(shù)為中位數(shù)。213.上四分位數(shù)(設(shè)為xi),則i=[]xi
表示約有1/4的數(shù)據(jù)比xi
大,3/4的數(shù)據(jù)比xi小4.下是分位數(shù)(設(shè)為x)其中j=[]
表示約有3/4的數(shù)據(jù)比xj
大,1/4的數(shù)據(jù)比xj小。225、眾數(shù),出現(xiàn)次數(shù)最多的數(shù)值(可能有多個),均值是計算的測度值,其它從位置考慮。例:某班30MBA學(xué)生的年齡按上升順序排序為:24、24、25、25、25、25、26、26、26、26、27、27、27、27、27、28、28、28、28、28、29、29、30、30、30、30、31、31、31、32
眾數(shù)為27和28(5次),中數(shù)==27.5
平均數(shù)為27.67,上四分位數(shù)為x23=30,下四分位數(shù)x8=26,23(二)離散趨勢,1.極差(全距)R=max(Xi)-min(Xi)只利用了數(shù)據(jù)兩端的信息。242、方差和標(biāo)準(zhǔn)差:
標(biāo)準(zhǔn)差=σ2大反映均值的代表性差,反之,強(qiáng)。253.四分位差即上四分位數(shù)與下四分位數(shù)的差26五、統(tǒng)計量的分布(一)統(tǒng)計量的定義設(shè)X1、X2、……、Xn是來自總體X的一個樣本,g(X1、X2、……、Xn)是X1、X2、……、Xn的函數(shù),若g是連續(xù)函數(shù),且不含任何未知參數(shù),則g(X1、X2、……、Xn)是一個統(tǒng)計量。27(二)常用統(tǒng)計量
設(shè)X1、X2、……、Xn是來自總體X的一個樣本,x1、x2、……、xn是這一樣本的觀測值,則1.樣本平均值:2.樣本方差:283.樣本標(biāo)準(zhǔn)差:4.樣本k階(原點)矩:,k=1,2,……5.樣本k階中心矩:,k=1,2,……用xi代替Xi,相應(yīng)得到觀察值,s2,s,ak,bk(名稱不變)29(三)幾種常用的分布1.χ2分布設(shè)x1,x2,……,xn是來自總體
N(0,1)的樣本,則稱隨機(jī)變量=x12+x22+……+xn230
服從自由度為n的χ2分布,記為χ2~χ2(n),χ2(n)分布的概率密度為:
31χ2分布的性質(zhì):
(1)可加性:設(shè)χ12
~χ2(n1),χ22
~χ2(n2),且χ12
與χ22相互獨立,則有:
χ12+χ22~χ2(n1+n2)
(2)若χ2~χ2(n),則有:
E(χ2)=n,D(χ2)=2n32(3)對于給定的正數(shù),0<<1,若則為χ2(n)分布的上分布點33如查表知χ0.012(10)=2.558當(dāng)n充分大時,有其中是標(biāo)準(zhǔn)正態(tài)分布的上分位點。
34附:若Z~N(0,1),則Z為標(biāo)準(zhǔn)正態(tài)變量,其密度函數(shù)為:
35(1)若對,有,則為N(0,1)分布的上點
36(2)若對,有,則為N(0,1)的雙側(cè)分位點37(3)上點的求法∵,又∴φ()=1-,反查表,得382.t分布設(shè)χ~N(0,1),Y~χ2(n),且χ,Y相互獨立,則稱隨機(jī)變量
服從自由度為n的t-分布,記為t~t(n)39其密度函數(shù)為:40對給定,若則點為t(n)分布的上分位點41顯然(n)=-(n)(WHY)t0.95(8)=-t0.05(8)=-1.8595當(dāng)n充分大的時候,有(n)=423、F分布設(shè)U~2(n1),V~2(n2),且U,V相互獨立,則稱隨機(jī)變量服從自由度為(n1,n2)的F分布,記為F~F(n1,n2).43其密度函數(shù)為
:顯然,若F~F(n1,n2),則~F(n2,n1)(定義知)44對于結(jié)果0<α<1,若則稱F(n1,n2)為F(n1,n2)分布的上分位點。
45顯然有(n1,n2)=(定義知)F0.9(5,10)==0.3030464.正態(tài)總體的樣本均值和樣本方差的分布(1)設(shè)總體X的均值為μ,方差為σ2,x1,x2,……,xn是X的一個樣本,則有,(2)設(shè)x1,x2,……,xn為來自總體X~N(μ,σ2)的一個樣本,則,47(3)設(shè)x1,x2,……,xn為來自總體X~N(μ,σ2)的一個樣本,則有
①②與S2相互獨立
48(4)x1,x2,……,xn為來自總體X~N(μ,σ2)的一個樣本,與S2分別是樣本均值和樣本方差,則有:
49(5)設(shè)x1,x2,……,xn1與Y1,Y2,……,Yn2分別是具有相同方差的兩個正態(tài)總體N(μ1,σ2),N(μ2,σ2)的樣本,且這兩個樣本相互獨立。設(shè),,分別是這兩個樣本的均值
50
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年黑白系列偏光片項目合作計劃書
- 2025年糖、加工糖及制糖副產(chǎn)品合作協(xié)議書
- 語文命題設(shè)計培訓(xùn)
- 2025年LED超大屏幕顯示器合作協(xié)議書
- 民族服裝定制行業(yè)深度調(diào)研及發(fā)展戰(zhàn)略咨詢報告
- 秈米酒企業(yè)數(shù)字化轉(zhuǎn)型與智慧升級戰(zhàn)略研究報告
- 機(jī)器人電子控制系統(tǒng)行業(yè)深度調(diào)研及發(fā)展戰(zhàn)略咨詢報告
- 望遠(yuǎn)鏡百貨企業(yè)數(shù)字化轉(zhuǎn)型與智慧升級戰(zhàn)略研究報告
- 母嬰親子閱讀俱樂部行業(yè)跨境出海戰(zhàn)略研究報告
- 郵政代理服務(wù)企業(yè)ESG實踐與創(chuàng)新戰(zhàn)略研究報告
- 2025年中考百日誓師大會校長發(fā)言稿:激揚青春志 決勝中考時
- YY/T 1860.1-2024無源外科植入物植入物涂層第1部分:通用要求
- 中央2025年全國婦聯(lián)所屬在京事業(yè)單位招聘93人筆試歷年參考題庫附帶答案詳解
- 人教版高中物理選擇性必修第二冊電磁波的發(fā)射與接收課件
- 《建筑冷熱源》全冊配套最完整課件1
- 廣州2025年廣東廣州市番禺區(qū)小谷圍街道辦事處下屬事業(yè)單位招聘5人筆試歷年參考題庫附帶答案詳解
- 2025年春新人教版生物七年級下冊全冊教學(xué)課件
- 【物理】《跨學(xué)科實踐:制作微型密度計》(教學(xué)設(shè)計)-2024-2025學(xué)年人教版(2024)初中物理八年級下冊
- 2024年湖南高速鐵路職業(yè)技術(shù)學(xué)院高職單招數(shù)學(xué)歷年參考題庫含答案解析
- 學(xué)校食堂餐廳管理者食堂安全考試題附答案
- 2025廣西中煙工業(yè)限責(zé)任公司招聘126人高頻重點提升(共500題)附帶答案詳解
評論
0/150
提交評論