幾種統(tǒng)計(jì)分析模型介紹_第1頁
幾種統(tǒng)計(jì)分析模型介紹_第2頁
幾種統(tǒng)計(jì)分析模型介紹_第3頁
幾種統(tǒng)計(jì)分析模型介紹_第4頁
幾種統(tǒng)計(jì)分析模型介紹_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

幾種統(tǒng)計(jì)分析模型介紹福建省國家調(diào)查隊(duì)系統(tǒng)統(tǒng)計(jì)建模培訓(xùn)主講人:張業(yè)圳2009年6月8日張業(yè)圳福建師范大學(xué)經(jīng)濟(jì)學(xué)院副教授、博士、財(cái)金系副主任主要教學(xué)研究方向:數(shù)量經(jīng)濟(jì)學(xué)與金融實(shí)證分析聯(lián)系電話:8736908713609525129Email:zhangyz1971@126.comQQ:107345901地址:福建師范大學(xué)經(jīng)濟(jì)學(xué)院郵編:350108經(jīng)濟(jì)統(tǒng)計(jì)分析統(tǒng)計(jì)學(xué)研究如何測定、收集、整理、歸納和分析反映客觀現(xiàn)象總體數(shù)量的數(shù)據(jù),以便給出正確認(rèn)識的方法論科學(xué)。

經(jīng)濟(jì)統(tǒng)計(jì)分析就是用統(tǒng)計(jì)方法來分析經(jīng)濟(jì)現(xiàn)象數(shù)量特征和經(jīng)濟(jì)變量之間的關(guān)系。主要的工作有:1)分析經(jīng)濟(jì)現(xiàn)象中變量之間相互關(guān)系2)經(jīng)濟(jì)預(yù)測3)政策評價什么是經(jīng)濟(jì)統(tǒng)計(jì)分析模型模型對現(xiàn)實(shí)的描述和模擬。用不同方法對現(xiàn)實(shí)進(jìn)行描述和模擬,就構(gòu)成不同的模型。語義模型、物理模型、幾何模型、數(shù)學(xué)模型和計(jì)算機(jī)模擬模型。經(jīng)濟(jì)數(shù)學(xué)模型:用數(shù)學(xué)方法描述經(jīng)濟(jì)活動。采用的數(shù)學(xué)方法不同,對經(jīng)濟(jì)活動提示的程度不同,構(gòu)成各類不同的經(jīng)濟(jì)數(shù)學(xué)模型。數(shù)理經(jīng)濟(jì)模型計(jì)量經(jīng)濟(jì)學(xué)模型

本次培訓(xùn)主要模型1、聚類分析2、回歸分析3)因子分析和主成分分析4)時間序列分析第一部分:預(yù)備知識樣本與統(tǒng)計(jì)量總體與樣本

在數(shù)理統(tǒng)計(jì)中,把研究對象的全體稱為總體(population)或母體,而把組成總體的每個單元稱為個體。抽樣

要了解總體的分布規(guī)律,在統(tǒng)計(jì)分析工作中,往往是從總體中抽取一部分個體進(jìn)行觀測,這個過程稱為抽樣。樣本與統(tǒng)計(jì)量子樣

子樣是n個隨機(jī)變量,抽取之后的觀測數(shù)據(jù)稱為樣本值或子樣觀察值。在抽取過程中,每抽取一個個體,就是對總體X進(jìn)行一次隨機(jī)試驗(yàn),每次抽取的n個個體,稱為總體X的一個容量為n的樣本(sample)或子樣;其中樣本中所包含的個體數(shù)量稱為樣本容量。隨機(jī)抽樣方法的基本要求獨(dú)立性——即每次抽樣的結(jié)果既不影響其余各次抽樣的結(jié)果,也不受其它各次抽樣結(jié)果的影響。滿足上述兩點(diǎn)要求的子樣稱為簡單隨機(jī)子樣.獲得簡單隨機(jī)子樣的抽樣方法叫簡單隨機(jī)抽樣.代表性——即子樣()的每個分量與總體具有相同的概率分布。從簡單隨機(jī)子樣的含義可知,樣本是來自總體、與總體具有相同分布的隨機(jī)變量.簡單隨機(jī)抽樣

例如:要通過隨機(jī)抽樣了解一批產(chǎn)品的次品率,如果每次抽取一件產(chǎn)品觀測后放回原來的總量中,則這是一個簡單隨機(jī)抽樣。但實(shí)際抽樣中,往往是不再放回產(chǎn)品,則這不是一個簡單隨機(jī)抽樣。但當(dāng)總量N很大時,可近似看成是簡單隨機(jī)抽樣。

例如:為了分析福建省居民家庭收入狀況,對福建省居民家庭收入進(jìn)行調(diào)查。統(tǒng)計(jì)量

定義設(shè)()為總體X的一個樣本,為不含任何未知參數(shù)的連續(xù)函數(shù),則稱為樣本()的一個統(tǒng)計(jì)量。則例如:設(shè)是從正態(tài)總體中抽取的一個樣本,其中為已知參數(shù),為未知參數(shù),是統(tǒng)計(jì)量不是統(tǒng)計(jì)量幾個常用的統(tǒng)計(jì)量樣本均值(samplemean)設(shè)是總體的一個樣本,樣本方差(samplevariance)樣本均方差或標(biāo)準(zhǔn)差它們的觀測值用相應(yīng)的小寫字母表示.反映總體X取值的平均,或反映總體X取值的離散程度。幾個常用的統(tǒng)計(jì)量設(shè)是總體的一個樣本,子樣的K階(原點(diǎn))矩幾個常用的統(tǒng)計(jì)量設(shè)是總體的一個樣本,子樣的K階中心矩它包括兩個方面——數(shù)據(jù)整理計(jì)算樣本特征數(shù)數(shù)據(jù)的簡單處理為了研究隨機(jī)現(xiàn)象,首要的工作是收集原始數(shù)據(jù).一般通過抽樣調(diào)查或試驗(yàn)得到的數(shù)據(jù)往往是雜亂無章的,需要通過整理后才能顯示出它們的分布狀況。數(shù)據(jù)的簡單處理是以一種直觀明了方式加工數(shù)據(jù)。計(jì)算樣本特征數(shù):數(shù)據(jù)的簡單處理數(shù)據(jù)整理:將數(shù)據(jù)分組計(jì)算各組頻數(shù)作頻率分布表作頻率直方圖(1)反映趨勢的特征數(shù)樣本均值中位數(shù):數(shù)據(jù)按大小順序排列后,位置居中的那個數(shù)或居中的兩個數(shù)的平均數(shù)。眾數(shù):樣本中出現(xiàn)最多的那個數(shù)。數(shù)據(jù)的簡單處理(2)反映分散程度的特征數(shù):極差、四分位差極差——樣本數(shù)據(jù)中最大值與最小值之差,四分位數(shù)——將樣本數(shù)據(jù)依概率分為四等份的3個數(shù)椐,依次稱為第一、第二、第三四分位數(shù)。第一四分位數(shù)Q1:第二四分位數(shù)Q2:第三四分位數(shù)Q3:第二部分:參數(shù)估計(jì)第一節(jié)參數(shù)的點(diǎn)估計(jì)

一、點(diǎn)估計(jì)問題設(shè)總體X的分布函數(shù)的形式為已知的F(

x,θ

),其中x是自變量,θ為未知參數(shù)(它可以是一個數(shù),也可以是一個向量).借助于總體X的一個樣本(X

1,X

2,…,X

n),來估計(jì)未知參數(shù)θ的值的問題,稱為參數(shù)的點(diǎn)估計(jì)問題.點(diǎn)估計(jì)的問題就是要構(gòu)造一個適當(dāng)?shù)慕y(tǒng)計(jì)量(X1,X2,…,Xn),用樣本的一組觀察值(x1,x2,…,xn),得到的觀察值(x1,x2,…,xn),以此來估計(jì)未知參數(shù)θ.稱統(tǒng)計(jì)量(X

1,X

2,…,X

n)為θ的估計(jì)量,稱(x1,x2,…,xn)為θ的估計(jì)值.二、矩估計(jì)法的函數(shù),記作μl=μl()即,l=1,2,…,k.設(shè)總體X的分布函數(shù)為,其中為k個未知參數(shù).

假設(shè)總體X的各階原點(diǎn)矩存在,則E(Xl)是對于總體X的樣本(X1,X2,…,Xn),樣本的l階原點(diǎn)矩為,l=1,

2,…,k.令μl=

Al,l=1,2,…,k,即從上述方程組中解出,分別記作以此作為未知參數(shù)的估計(jì)量,稱為矩估計(jì)量.如果樣本觀察值為(x1,x2,…,xn),則得未知參數(shù)的矩估計(jì)值為上述估計(jì)未知參數(shù)的方法就叫做矩估計(jì)法.解此方程組得到與的矩估計(jì)量為令即解

例1設(shè)總體X的均值為μ,方差為,且,但μ與均未知,又設(shè)總體X的一個樣本為(X1,

X2,

,

Xn),求μ與的矩估計(jì)量.解由例4可得例2某廠生產(chǎn)一批鉚釘,現(xiàn)要檢驗(yàn)鉚釘頭部直徑,從這批產(chǎn)品中隨機(jī)抽取12只,測得頭部直徑(單位:mm)如下:13.30 13.38 13.40 13.43 13.32 13.4813.54 13.31 13.34 13.47 13.44 13.50設(shè)鉚釘頭部直徑這一總體X服從正態(tài)分布,試求與的矩估計(jì)值.注此例說明,無論總體X服從什么分布,樣本均值都是總體均值的矩估計(jì)量,樣本二階中心矩就是總體方差的矩估計(jì)量.三、極大似然估計(jì)法1.設(shè)總體X為離散型隨機(jī)變量,其分布律為其中θ為未知參數(shù),取值范圍為.設(shè)X1,X2,,Xn為來自X的樣本,則X1,X2,,Xn的聯(lián)合分布律為.又設(shè)x1,x2,,xn為一組樣本值,令

稱L(θ)為樣本的似然函數(shù).(1)若有,使得對一切,有成立,則稱為θ的極大(或最大)似然估計(jì)值,相應(yīng)的統(tǒng)計(jì)量稱為θ的極大(或最大)似然估計(jì)量.我們規(guī)定,使得的就是θ的極大似然估計(jì)值.由于lnx是單增函數(shù),所以

與有相同的駐點(diǎn),因此只需從

中解出就是θ的極大似然估計(jì)值,稱方程(2)(2)為極大似然方程.

例3設(shè)總體,與未知,(X1,X2,…,Xn)為總體X的樣本,求與的極大似然估計(jì)量.解

X的概率密度為設(shè)x1,x2,…,xn為樣本值,似然函數(shù)為令解得與的極大似然估計(jì)值為因此,與的極大似然估計(jì)量為四、估計(jì)量的評選標(biāo)準(zhǔn)1.無偏性估計(jì)量是樣本的函數(shù),它是一個隨機(jī)變量,由不同的方法得到的估計(jì)量可能相同也可能不同.而對同一估計(jì)量,由不同的樣本觀察值得到參數(shù)的估計(jì)值也可能不同.我們很自然地要求估計(jì)量的期望等于參數(shù)的真值,即無偏性.定義設(shè)是未知參數(shù)θ的估計(jì)量,若,則稱為θ的無偏估計(jì)(量).例4設(shè)總體X的均值為,(X1,X2,X3)是總體X的樣本,證明下列兩個估計(jì)量都是的無偏估計(jì).

證由于所以與都是的無編估計(jì).(只需k1+

k2++

kn

=1,則=k1X1+

k2X2++

knXn就是的無偏估計(jì))設(shè)為參數(shù)θ的估計(jì)量,若當(dāng)時,按概率收斂于θ,即對于任意正數(shù)ε,有,則稱為θ的一致估計(jì)(量).3.一致性根據(jù)大數(shù)定律可知,樣本均值是總體均值的一致估計(jì)量.設(shè)與是參數(shù)θ的兩個無偏估計(jì)量,若,則稱比有效.2.有效性第二節(jié)參數(shù)的區(qū)間估計(jì)點(diǎn)估計(jì)是通過構(gòu)造統(tǒng)計(jì)量(X1,X2,…,

Xn)來對總體X中的未知參數(shù)θ進(jìn)行估計(jì),由一個樣本值(x1,x2,…,

xn)可得到θ的估計(jì)值(x1,x2,…,

xn).這種估計(jì)值是無法知道誤差的.我們要定出一個范圍,并要求以一定的概率保證這個范圍包含著θ的真值.這個范圍通常以區(qū)間的形式給出,我們把這個區(qū)間稱為置信區(qū)間.定義設(shè)總體X的分布中含有一個未知參數(shù)θ,(X1,X2,…,

Xn)是來自總體X的一個樣本.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論