[數(shù)學(xué)]統(tǒng)計方法_第1頁
[數(shù)學(xué)]統(tǒng)計方法_第2頁
[數(shù)學(xué)]統(tǒng)計方法_第3頁
[數(shù)學(xué)]統(tǒng)計方法_第4頁
[數(shù)學(xué)]統(tǒng)計方法_第5頁
已閱讀5頁,還剩29頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、統(tǒng)計方法第一章統(tǒng)計和數(shù)據(jù)第一節(jié) 統(tǒng)計學(xué)的含義一.什么是統(tǒng)計學(xué)統(tǒng)計學(xué)是一門研究數(shù)據(jù)的科學(xué),按大百科全書的定義:統(tǒng)計學(xué)是用以收集數(shù)據(jù),分析數(shù)據(jù)和由數(shù)據(jù)得出結(jié)論的一組概念、原則和方法。統(tǒng)計分析數(shù)據(jù)分兩種:描述統(tǒng)計和推斷統(tǒng)計描述統(tǒng)計是研究數(shù)據(jù)搜集、處理和描述的統(tǒng)計學(xué)方法。其內(nèi)容包括如何取得研究所需要的數(shù)據(jù),如何用圖表形式對數(shù)據(jù)進行處理和展示,如何通過對數(shù)據(jù)的綜合、概括與分析,得出所關(guān)心的數(shù)據(jù)特征。統(tǒng)計描述是指對由實驗或調(diào)查而得到的數(shù)據(jù)進行登記、審核、整理、歸類、計算出各種能反映總體數(shù)量特征的綜合指標(biāo),并加以分析,從中抽出有用的信息,用表格或圖像把它表示出來。是統(tǒng)計研究的基礎(chǔ)。它通過對分散無序的原始資料

2、的整理歸納,運用分組法和綜合指標(biāo)法得到現(xiàn)象總體的數(shù)量特征,揭露客觀事物內(nèi)在數(shù)量規(guī)律性,達到認識的目的。分組法是研究總體內(nèi)部差異的重要方法,通過分組可以研究總體中不同類型的性質(zhì)以及它們的分布情況綜合指標(biāo)法是指運用各種統(tǒng)計指標(biāo)來反映和研究客觀總體現(xiàn)象的一般數(shù)量特征和數(shù)量關(guān)系的方法統(tǒng)計模型法是綜合指標(biāo)法的擴展。它是根據(jù)一定的理論和假定條件,用數(shù)學(xué)方程去模擬現(xiàn)實客觀現(xiàn)象相互關(guān)系的一種研究方法。推斷統(tǒng)計則是研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計學(xué)方法,內(nèi)容包括參數(shù)估計和假設(shè)檢驗兩大類。所謂統(tǒng)計推斷就是以一定的置信標(biāo)準(zhǔn)要求,根據(jù)樣本數(shù)據(jù)來判斷總體數(shù)量特征的歸納推理的方法。統(tǒng)計推斷是邏輯歸納法在統(tǒng)計推理的

3、應(yīng)用,所以稱為歸納推理的方法。(1)參數(shù)估計法:當(dāng)總體的界限已劃定,總體某一數(shù)量特征(如總體平均數(shù)、方差等)的數(shù)值就是唯一確定的,所以把總體的數(shù)量特征稱為總體參數(shù)。但是總體參數(shù)通常不知道,這就需要通過樣本數(shù)據(jù)計算樣本統(tǒng)計量,并以此作為總體參數(shù)的估計量來估計總體參數(shù)的取值或取值區(qū)間,這種方法稱之為參數(shù)估計法。(2)假設(shè)檢驗法:假設(shè)檢驗的特點是,由于對總體的變化情況不了解,不妨先對總體的狀況作某種假設(shè),然后根據(jù)樣本實際觀察的資料對所作假設(shè)進行檢驗,來判斷這種假設(shè)的真?zhèn)危詻Q定行動的取舍。假設(shè)檢驗的方法是統(tǒng)計推斷常用的方法。二統(tǒng)計的應(yīng)用(一)統(tǒng)計的應(yīng)用領(lǐng)域統(tǒng)計是適用于所有學(xué)科領(lǐng)域的通用數(shù)據(jù)分析方法,

4、是一種通用的數(shù)據(jù)分析語言。(二)統(tǒng)計的誤用與濫用統(tǒng)計常常被人們有意或無意地濫用。如,錯誤的統(tǒng)計定義、錯誤的圖表提示、一個不合理的樣本、數(shù)據(jù)的遺漏或邏輯錯誤等。這些誤用有些是常識性的,有些是技術(shù)性的,有些則是故意的。作為從數(shù)據(jù)中尋找事實的統(tǒng)計,卻被有人變成了歪曲事實的工具。第二節(jié) 數(shù)據(jù)類型統(tǒng)計數(shù)據(jù)是對客觀現(xiàn)象特征的反映,而由于客觀現(xiàn)象的復(fù)雜性,在反映這些現(xiàn)象特征時,可以從不同的角度進行采集,從而得到不同類型的數(shù)據(jù)。一變量與數(shù)據(jù)變數(shù)或變量,是指沒有固定的值,可以改變的數(shù)。變量的具體數(shù)值稱為變量值,即數(shù)據(jù)。統(tǒng)計數(shù)據(jù)就是統(tǒng)計變量的具體表現(xiàn)。二數(shù)據(jù)類型(一)定性變量(數(shù)據(jù))與定量變量(數(shù)據(jù))1.定性變量

5、:反映“職業(yè)”、“教育程度”等現(xiàn)象的屬性特點的變量,不能說明具體量的大小和差異。分類變量:沒有量的特征,只有分類特征。這種只反映現(xiàn)象分類特征的變量又稱分類變量。分類變量的觀測結(jié)果就是分類數(shù)據(jù)。說明事物類別的一個名稱。如“性別”就是一個分類變量。順序變量:如果類別具有一定的順序,如,“教育類別”,這樣的變量稱為順序變量,相應(yīng)的觀察結(jié)果就是順序數(shù)據(jù)。說明事物有序類別的一個名稱,這類變量的具體表現(xiàn)就是順序數(shù)據(jù)。2.數(shù)值(定量)變量:反映“天氣溫度”、“月收入”等變量可以用數(shù)值表示其觀察結(jié)果,而且這些數(shù)值具有明確的數(shù)值含義,不僅能分類而且能測量出來具體大小和差異。這些變量就是定量變量也稱數(shù)值變量,定量

6、變量的觀察結(jié)果成為定量數(shù)據(jù)。說明事物數(shù)字特征的一個名稱。分類變量沒有數(shù)值特征,所以不能對其數(shù)據(jù)進行數(shù)學(xué)運算。分類數(shù)據(jù)只能用來區(qū)分事物,而不能用來表明實物之間的大小、優(yōu)劣關(guān)系。順序變量比分類變量向前進一步,它不僅能用來區(qū)分客觀現(xiàn)象的不同類別,而且還可以表明現(xiàn)象之間的大小、高低、優(yōu)劣關(guān)系。顯然,順序數(shù)據(jù)的功能比分類數(shù)據(jù)要強一些,對事物的劃分也更精細一些。但順序數(shù)據(jù)的數(shù)據(jù)之間雖然可以比較大小,卻無法計算相互之間的大小、高低或優(yōu)劣的距離。只是反映事物在性質(zhì)上的差異,而不能用來反映事物在數(shù)量上的差異。因此,從本質(zhì)上,順序數(shù)據(jù)仍然是定性數(shù)據(jù)中的一種。數(shù)值型數(shù)據(jù)作為統(tǒng)計研究的主要資料,其特征在于它們都是以數(shù)

7、值的形式出現(xiàn)的,有些數(shù)值型數(shù)據(jù)只可以計算數(shù)據(jù)之間的絕對差,而有些數(shù)值型數(shù)據(jù)不僅可以計算數(shù)據(jù)之間的絕對差,還可以計算數(shù)據(jù)之間的相對差。其計量精度遠遠高于定性數(shù)據(jù)。在統(tǒng)計學(xué)研究中,對數(shù)值型數(shù)據(jù)的研究是定量分析的主要內(nèi)容。從上述三種數(shù)據(jù)的基本特點可以看出,這三類數(shù)據(jù)對事物的描述是由定性到定量、由低級到高級,從粗略到精細。在統(tǒng)計研究中,需要明確各種數(shù)據(jù)所適用的統(tǒng)計方法,正確的選擇和應(yīng)用,這是正確進行統(tǒng)計研究的基本要求。(二)觀測數(shù)據(jù)和實驗數(shù)據(jù)按獲取數(shù)據(jù)的方法不同,可分為觀測數(shù)據(jù)和實驗數(shù)據(jù)。觀測數(shù)據(jù)可能是全面數(shù)據(jù)也可能是樣本數(shù)據(jù)(局部),實驗數(shù)據(jù)一般都是樣本數(shù)據(jù)。1. 觀測數(shù)據(jù)。觀測數(shù)據(jù)是對客觀現(xiàn)象進行

8、實地觀測所取得的數(shù)據(jù),在數(shù)據(jù)取得的過程中一般沒有認為的控制和條件約束。在社會經(jīng)濟問題研究中,觀測是取得數(shù)據(jù)最主要的方法。2. 實驗數(shù)據(jù)。實驗數(shù)據(jù)一般是在科學(xué)實驗環(huán)境下取得的數(shù)據(jù)。在實驗中,實驗環(huán)境是受到嚴格控制的,數(shù)據(jù)的產(chǎn)生一定是某一約束條件下的結(jié)果。在自然科學(xué)研究中實驗的方法應(yīng)用非常普遍。 第三節(jié) 數(shù)據(jù)來源與搜集數(shù)據(jù)的方法一數(shù)據(jù)的來源從使用者的角度看,統(tǒng)計數(shù)據(jù)資料的來源主要有兩種渠道:一種是通過直接的調(diào)查或?qū)嶒灚@得的原始數(shù)據(jù),這是統(tǒng)計數(shù)據(jù)的直接來源,一般稱為原始或第一手統(tǒng)計數(shù)據(jù);另一種是別人調(diào)查的數(shù)據(jù),并將這些數(shù)據(jù)進行加工和匯總后公布的數(shù)據(jù),通常稱為次級數(shù)據(jù)或第二手間接的統(tǒng)計數(shù)據(jù)。一切間接的

9、統(tǒng)計數(shù)據(jù)都是從原始的、第一手數(shù)據(jù)過渡而來的。(一) 數(shù)據(jù)的直接來源原始數(shù)據(jù)搜集數(shù)據(jù)最基本的形式就是進行統(tǒng)計調(diào)查或進行實驗活動,統(tǒng)計調(diào)查或進行實驗就是統(tǒng)計數(shù)據(jù)的直接來源。1. 統(tǒng)計調(diào)查統(tǒng)計調(diào)查是指根據(jù)統(tǒng)計研究預(yù)定的目的、要求和任務(wù),運用科學(xué)的方法,有計劃、有組織地向客觀實際搜集資料的過程。通過統(tǒng)計調(diào)查得到的數(shù)據(jù),一般稱為觀測數(shù)據(jù)。2. 實驗法實驗法是直接獲得統(tǒng)計數(shù)據(jù)的又一重要來源。通過實驗法得到的數(shù)據(jù)就是實驗數(shù)據(jù)。實驗法不僅是一種搜集數(shù)據(jù)的方式,也是一種重要的研究方式。它是通過有意識地改變或控制某些輸入變量,觀察其他輸出變量的變化,從而達到對事物本質(zhì)或相互聯(lián)系的認識。未來觀察對輸入變量的控制是否

10、導(dǎo)致了輸出變量的改變,在實驗中,往往需要將研究對象分為兩個組,一個是實驗組,一個是對照組,對實驗組的輸入變量加以控制或改變,而對照組則不加控制,根據(jù)兩組的輸出結(jié)果,可以看到輸入變量對輸出變量的影響。運用實驗法要注意的是:首先,實驗組和對照組的產(chǎn)生應(yīng)當(dāng)是隨機的,研究對象的不同單位應(yīng)當(dāng)被隨機地分配到實驗組或?qū)φ战M,而不應(yīng)是經(jīng)過有意識的挑選的。其次,實驗組和對照組還應(yīng)當(dāng)匹配的,也就是研究對象的背景資料應(yīng)當(dāng)是大體相同的,至少不要差異太大。不論是統(tǒng)計調(diào)查還是實驗,所搜集的數(shù)據(jù)都是原始數(shù)據(jù),這是統(tǒng)計數(shù)據(jù)最基本的來源。(二)數(shù)據(jù)的間接來源次級數(shù)據(jù)雖然統(tǒng)計數(shù)據(jù)的搜集主要是指對原始數(shù)據(jù)的搜集,后面介紹的統(tǒng)計調(diào)查

11、的方法也是圍繞搜集原始資料展開的,但數(shù)據(jù)的收集實際上不僅包括對原始數(shù)據(jù)的收集也包括對次級數(shù)據(jù)(第二手收據(jù))的收集,在很多情況下,統(tǒng)計研究都是在掌握次級數(shù)據(jù)的基礎(chǔ)上進行的。次級數(shù)據(jù)是指由其他人搜集和整理得到的統(tǒng)計數(shù)據(jù)。這種來自他人調(diào)查整理基礎(chǔ)上的數(shù)據(jù)我們把它稱為數(shù)據(jù)的間接來源。數(shù)據(jù)的間接來源有:(1)公開出版的統(tǒng)計數(shù)據(jù),主要來自官方的統(tǒng)計部門和政府、組織、學(xué)校、科研機構(gòu)。(2)尚未公開發(fā)表的統(tǒng)計數(shù)據(jù),如各企業(yè)的經(jīng)營報表數(shù)據(jù)、專業(yè)調(diào)查咨詢機構(gòu)為公開發(fā)布的調(diào)查結(jié)果數(shù)據(jù)。需注意的是,如果公開引用未公開發(fā)表的數(shù)據(jù)需要征得數(shù)據(jù)所有者的同意,同時要為自己發(fā)布的數(shù)據(jù)負責(zé)。恰當(dāng)?shù)剡\用間接數(shù)據(jù)在實際中往往能夠節(jié)約

12、時間和費用,取得較好的成果和效益,因此,成為許多統(tǒng)計研究人員在進行實證分析時的首選數(shù)據(jù)來源。但在應(yīng)用時要注意:(1)是否了解并正確理解了間接數(shù)據(jù)中變量的含義、計算口徑、計算方法,以防止誤用、錯用他人的數(shù)據(jù)。(2)引用間接數(shù)據(jù)時要注明數(shù)據(jù)來源,尊重他人的勞動成果和知識產(chǎn)權(quán)。二搜集數(shù)據(jù)的方法統(tǒng)計調(diào)查是根據(jù)調(diào)查的目的與要求,運用科學(xué)的調(diào)查方法,有計劃、有組織第搜集統(tǒng)計數(shù)據(jù)資料的過程。常用的統(tǒng)計調(diào)查種類有:(一) 普查普查:普查是專門組織一次性的全面調(diào)查,用來調(diào)查屬于一定時點或時期內(nèi)的社會經(jīng)濟現(xiàn)象的總量。它適用于搜集某些不能或不適宜于定期的全面統(tǒng)計報表搜集的統(tǒng)計資料,以摸清重大的國情、國力。如,人口普

13、查、農(nóng)業(yè)普查、經(jīng)濟普查、全國第三產(chǎn)業(yè)普查等。普查的特點:它是一種全面調(diào)查,具有資料包括范圍全面、詳盡、系統(tǒng)的優(yōu)點;它是一次性的專門調(diào)查,因為普查的工作量大,耗資也多,時間周期較長,一般不宜經(jīng)常舉行。普查要遵循以下幾點:a確定普查的標(biāo)準(zhǔn)時間:普查的標(biāo)準(zhǔn)時間是指登記調(diào)查單位項目所依據(jù)的統(tǒng)計時點。所有的調(diào)查資料都必須是反映這一時點上的情況。例如,我國第四人口普查,1990年7月1日零時為普查登記的標(biāo)準(zhǔn)時點。凡是在這個時點以前死亡和這個時點以后出生的,都不能計入這次普查的人口數(shù)內(nèi)。這樣才可避免所登記重復(fù)或遺漏。b普查的登記工作應(yīng)在整個普查范圍內(nèi)同時進行,以保證普查資料的實效性、準(zhǔn)確性,避免資料的搜集工

14、作拖的太久c同類普查的內(nèi)容和時間在歷次普查中應(yīng)盡可能保持連貫性。普查的組織形式有兩種:一種是組織專門的普查機構(gòu),派專門的調(diào)查人員對被調(diào)查單位直接進行登記;另一種是利用一定的組織系統(tǒng),由被調(diào)查單位根據(jù)本單位的原始記錄和實際情況,填寫調(diào)查表,然后上報。(二) 抽樣調(diào)查抽樣調(diào)查:抽樣調(diào)查是按隨機原則,從總體中抽取一部分單位作為樣本來進行觀察,并根據(jù)其觀察的結(jié)果來推斷總體數(shù)量特征的一種非全面調(diào)查方法。抽樣調(diào)查具有的特點:第一,樣本單位按隨機原則抽取,排除了主觀因素對選取樣本單位的影響。第二,能夠根據(jù)部分調(diào)查的實際資料對調(diào)查對象的總體的數(shù)量特征進行推斷,從而達到對調(diào)查總體的認識。第三,在抽樣調(diào)查中會存在

15、抽樣誤差,但是這個誤差可以事先計算并加以控制。隨機抽樣一般是指每個總體單位都有同等被抽中的機會,但是在實際調(diào)查中,并不完全是這種情況。通常采用的抽樣組織形式主要有以下幾種:a.簡單隨機抽樣:又稱純隨機抽樣,它是指對總體不作任何處理,不進行分類也不進行排除,而是完全按隨機的原則,直接從總體中抽取樣本單位加以觀察。從理論上說,是最符合抽樣調(diào)查的隨機原則,是抽樣調(diào)查的最基本形式。具體方法有:直接抽選法、抽簽法和隨機數(shù)表法。b分層抽樣:又稱類型抽樣或分類抽樣。是先將總體各單位按主要標(biāo)志加以分層,而后在各層中按隨機的原則抽取若干樣本單位,由各層的樣本單位組成一個樣本。c等距抽樣:又稱機械抽樣或系統(tǒng)抽樣。

16、它是將總體全部單位按某一標(biāo)志排隊,而后按固定的順序和相等間隔在總體中抽取若干樣本單位,構(gòu)成一個容量為n的樣本。d整群抽樣:是將總體各單位劃分為若干群,然后以群為單元,從總體中隨機抽取一部分群,對被抽中的群內(nèi)所有單位進行全面調(diào)查。整群抽樣對總體劃分群的基本要求是:第一,群與群之間不重疊,即總體中的任一單位只能屬于某個群;第二,全部總體單位毫無遺漏,即總體中的任一單位必須屬于某個群。e多階段抽樣:當(dāng)總體很大時,可把抽樣過程分成幾個過渡階段,到最后才具體抽到樣本單位。(三) 統(tǒng)計報表統(tǒng)計報表制度:它是按照國家統(tǒng)一規(guī)定的調(diào)查要求與文件(指標(biāo)、表格形式、計算方法等)自下而上的提供統(tǒng)計資料的一種報表制度。

17、在官方統(tǒng)計的經(jīng)常調(diào)查中目前依然發(fā)揮著一定的作用。按照報送范圍,統(tǒng)計報表分為全面報表和非全面報表。按報送周期,統(tǒng)計報表主要有月報、季報、年報組成,月報內(nèi)容簡單,時效性強,年報則內(nèi)容比較全面。統(tǒng)計報表的內(nèi)容包括表式和填表說明。對于大型、國有企業(yè)來說,利用統(tǒng)計報表搜集數(shù)據(jù),具有時間快、成本低的優(yōu)點,但對于大量的小型、非國有經(jīng)濟單位,則難以全面采用統(tǒng)計報表調(diào)查。(四) 重點調(diào)查重點調(diào)查:是一種非全面調(diào)查,它是在調(diào)查對象中選擇一部分對全局具有決定性作用的重點單位進行調(diào)查。適用于調(diào)查任務(wù)只要求掌握調(diào)查總體的基本情況,調(diào)查標(biāo)志比較單一,調(diào)查標(biāo)志表現(xiàn)在數(shù)量上集中于少數(shù)單位,而這些少數(shù)單位的標(biāo)志值之和在總體中又

18、占絕對優(yōu)勢的情況。重點調(diào)查組織方式有兩種:一是專門組織的一次性調(diào)查;另一種是利用定期統(tǒng)計報表經(jīng)常性地對一些重點單位進行調(diào)查。其優(yōu)點是花費較少人力、物力,在較少時間內(nèi)及時取得有關(guān)的基本情況。(五) 典型調(diào)查典型調(diào)查:根據(jù)調(diào)查的目的與要求,在對被調(diào)查對象進行全面分析的基礎(chǔ)上,有意識地選擇若干具有典型意義的或有代表性的單位進行調(diào)查,主要作用是:第一,補充全面調(diào)查的不足;第二,在一定條件下可以驗證全面調(diào)查數(shù)據(jù)的真實性。其優(yōu)點是靈活機動、通過少數(shù)典型即可取得深入詳實的統(tǒng)計資料,缺點是受“有意識地選出若干有代表性”的限制,易受人們主觀認識上的影響,必須同其他調(diào)查結(jié)合起來使用,才能避免出現(xiàn)片面性。表一 各類

19、統(tǒng)計調(diào)查方法的特點調(diào)查范圍調(diào)查時間收集資料的方法普查全面一次采訪、報告或空間遙感抽樣調(diào)查非全面經(jīng)?;蛞淮沃苯佑^察或采訪統(tǒng)計報表全面或非全面經(jīng)常報告重點調(diào)查非全面經(jīng)?;蛞淮螆蟾娴湫驼{(diào)查非全面一次采訪統(tǒng)計方法 第二章數(shù)據(jù)描述第一節(jié) 用圖表展示定性數(shù)據(jù)本節(jié)主要介紹定性數(shù)據(jù)的圖表展示方法。定性數(shù)據(jù)包括分類數(shù)據(jù)和順序數(shù)據(jù),它們的圖表展示方法基本相同。通??梢杂妙l數(shù)分布表和圖形來描述。一.生成頻數(shù)分布表定性數(shù)據(jù)本身是對事物的一種分類,因此,只要先把所有的類別都列出來,然后統(tǒng)計出每一類別的頻數(shù),就是一張頻數(shù)分布表。頻數(shù)分布表中落在某一特定類別的數(shù)據(jù)個數(shù)稱為頻數(shù)。頻數(shù)分布包含了很多有用的信息,通過它可以觀察不

20、同類型數(shù)據(jù)的分別情況。二定性數(shù)據(jù)的圖形表示定性數(shù)據(jù)(分類數(shù)據(jù)和順序數(shù)據(jù))可以描繪出它們各類的比例,常用餅圖和條形圖表示。(一) 餅圖餅圖又稱圓餅圖、圓形圖等,它是利用圓形及圓內(nèi)扇形面積來表示數(shù)值大小的圖形。餅圖主要用于總體中各組成部分所占比重的研究。(二) 條形圖條形圖是用寬度相同的條形的高度或長度來表述數(shù)據(jù)多少的圖形,用于觀察不同類別數(shù)據(jù)的多少或分布情況。繪制時,各類別可以放在縱軸,也可以放在橫軸。(三) 環(huán)形圖餅圖只能顯示一個變量(如年齡變量)各部分所占的比重。如果我們想比較不同變量之間的結(jié)構(gòu)差異,就可以通過環(huán)形圖來實現(xiàn)。首先,利用產(chǎn)生頻數(shù)表的方法先做出分性別的年齡分布表然后,根據(jù)上表再繪

21、制出環(huán)形圖。 第二節(jié) 用圖表展示定量數(shù)據(jù)定性數(shù)據(jù)的圖示表示方法,也都適用于定量數(shù)據(jù)。但定量數(shù)據(jù)還有一些特定的圖示方法,它們并不適用于定性數(shù)據(jù)。一生成頻數(shù)分別表生成定量數(shù)據(jù)的頻數(shù)分布表時,首先是將數(shù)據(jù)進行分組,然后再統(tǒng)計出各組別的數(shù)據(jù)頻數(shù)即可。首先,要對數(shù)據(jù)進行分組,一般的分組個數(shù)在515之間。其次,要確定組距。所謂組距是指每個組變量值中的最大值與最小值之差。每組最大值稱為該組上限,最小值稱為該組下限。則組距等于上限與下限之差,即組距=上限-下限在確定組距是,一般應(yīng)掌握的原則:一是要考慮各組的劃分是否能區(qū)分總體內(nèi)部各個組成部分的性質(zhì)差別。如果不能正確反映各部分質(zhì)的差異,必須重新分組。二是要能準(zhǔn)確

22、地清晰地反映總體單位的分布特征。在確定組距時,在研究的現(xiàn)象變動比較均勻的情況下,可以采用等距分組;而當(dāng)研究的現(xiàn)象變動很不均勻時,例如急劇的增長或急劇的下降,波動的幅度很大時,則一般采用不等距分組。在實際工作中,要結(jié)合實際情況確定各組的組距。最后,統(tǒng)計出各組的頻數(shù)及頻數(shù)分布表。在統(tǒng)計各組頻數(shù)時,恰好等于某一組的組限時,則采取上限不在內(nèi)的原則,即將該頻數(shù)計算在與下限相同的組內(nèi)。二定量數(shù)據(jù)的圖形表示常用來表述定量數(shù)據(jù)統(tǒng)計圖形有:直方圖、折線圖和散點圖。(一) 直方圖對于一個定量數(shù)據(jù),直方圖是一個常見的而且非常重要的圖形。它的橫坐標(biāo)代表變量分組,縱指標(biāo)代表各變量值出現(xiàn)的頻數(shù),這樣,各組與相應(yīng)的頻數(shù)就形

23、成了一個矩形,即直方圖。(二) 折線圖折線圖是利用線段的升降來說明現(xiàn)象變動的一種統(tǒng)計圖,它主要用于表示現(xiàn)象的分配情況、現(xiàn)象在時間上的變化和兩個現(xiàn)象之間的依存關(guān)系等。(三) 散點圖散點圖能反映兩個變量的關(guān)系,判斷其變化的方向是否相同應(yīng)特別注意各種圖表的生成方式和運用。第三節(jié) 用統(tǒng)計表來表示數(shù)據(jù)統(tǒng)計表和統(tǒng)計圖是顯示統(tǒng)計數(shù)據(jù)的兩種方式。在現(xiàn)實生活中,統(tǒng)計表和統(tǒng)計圖形一樣充斥在我們的生活總。它通過對枯燥數(shù)據(jù)的整理,利用一些簡單的表格,讓我們一目了然地了解某些事物的現(xiàn)象。統(tǒng)計表是一種用密集的形式歸納數(shù)據(jù)的方法,它主要利用行和列中的數(shù)據(jù)來表述現(xiàn)象特征。人們利用統(tǒng)計表的主要目的有:一是在文章中使用它以支持自

24、己的觀點;二是利用它組織數(shù)據(jù)。把整理匯總得出的統(tǒng)計數(shù)據(jù)資料,按照一定的結(jié)構(gòu)和順序,有系統(tǒng)地排列在一定的表格內(nèi),就形成一張統(tǒng)計表。統(tǒng)計表的主要優(yōu)點是:能使統(tǒng)計資料條理化、系統(tǒng)化,能清晰的表達統(tǒng)計資料的內(nèi)容,且簡明易懂、節(jié)省篇幅,便于對表中資料進行對比,并易于檢查數(shù)字的完整性和正確性。(1) 統(tǒng)計表的結(jié)構(gòu)統(tǒng)計表一般由五個部分組成,即表頭、行標(biāo)題、列標(biāo)題、數(shù)字資料和表外附加構(gòu)成??倶?biāo)題:統(tǒng)計表的名稱。簡明扼要,一般放在表格上方中間位置橫行標(biāo)題和縱欄標(biāo)題:縱欄:表明標(biāo)志和指標(biāo)的名稱,一般置于表格上方;橫行標(biāo)題:表明調(diào)查單位和分組的名稱,一般置于表格左邊。統(tǒng)計數(shù)字(指標(biāo)數(shù)值)。主詞欄:表中資料所說明的對

25、象,位于表的左邊;賓詞欄:各種指標(biāo),位于表的右側(cè)。(2)統(tǒng)計表的種類按用途不同分類a. 調(diào)查表:用來搜集統(tǒng)計資料的表格;b. 整理表:用于匯總或整理調(diào)查資料,以及表現(xiàn)統(tǒng)計匯總或整理結(jié)果的表格;c. 分析表:用于對整理所得的統(tǒng)計資料進行定量分析的表格。按總體分組不同分類a. 簡單表:對總體未經(jīng)任何分組,僅是簡單地列出統(tǒng)計資料所屬時間或單位的表格。b. 簡單分組表:對總體僅按一個標(biāo)志進行分組的統(tǒng)計表。c. 復(fù)合分組表:對總體按兩個或兩個以上標(biāo)志進行層疊分組。按統(tǒng)計資料的時間和空間分類a. 空間數(shù)列表:指同一時間條件下,不同空間范圍的統(tǒng)計表。它說明在靜態(tài)條件下,客觀社會經(jīng)濟現(xiàn)象在不同空間范圍的分布狀

26、況。b. 時間數(shù)列表:指同一空間條件下,不同時間范圍的統(tǒng)計表。它說明在動態(tài)條件下,客觀社會經(jīng)濟現(xiàn)象發(fā)展變動狀況。c. 時空結(jié)合表:是同時反映社會經(jīng)濟現(xiàn)象在不同空間和不同時間內(nèi)的數(shù)量分布的統(tǒng)計表。(3)統(tǒng)計表的設(shè)計總的要求:簡練、明確、實用、美觀,便于比較。統(tǒng)計表設(shè)計應(yīng)注意事項a. 統(tǒng)計表應(yīng)設(shè)計成由縱橫交叉線條組成的長方形表格,長與寬之間保持適當(dāng)?shù)谋壤?。b. 線條繪制。表的上下端應(yīng)以粗線繪制,表內(nèi)縱橫線以細線繪制。表格左右兩端一般不劃線,采用“開口式”。c. 合計欄的設(shè)置。統(tǒng)計表各縱列若須合計時,一般應(yīng)將合計列在最后一行,各橫行若須要合計時,可將合計列在最前一欄或最后一欄。d. 欄數(shù)的編號。如果

27、欄數(shù)較多,應(yīng)當(dāng)按順序編號,習(xí)慣上主詞欄以“甲、乙、丙、丁”為序號,賓詞欄編以(1)、(2)、(3)、(4)為序號。統(tǒng)計表內(nèi)容設(shè)計應(yīng)注意事項a. 標(biāo)題設(shè)計:標(biāo)題簡明扼要。b. 指標(biāo)數(shù)值:數(shù)字填寫整齊,對準(zhǔn)位數(shù)。當(dāng)數(shù)字因小可略而不計時,可寫上“0”;當(dāng)缺某項數(shù)字資料時,可用“”表示;不應(yīng)有數(shù)字時用符號“”表示。c. 計量單位:當(dāng)全表只有一種計量單位時,可以把它寫在表頭的右上方。如果表中各欄的指標(biāo)數(shù)值計量單位不同,可以橫行標(biāo)題后添一列計量單位。d. 注解或資料來源。 第四節(jié) 用數(shù)字來概括數(shù)據(jù)針對一組數(shù)據(jù)的分布特征,我們可以從兩個方面來考查它:一是該組數(shù)據(jù)的集中趨勢,即該組數(shù)據(jù)的數(shù)值向其中心值的靠攏程

28、度。二是該組數(shù)據(jù)的離散程度,它反映的是該組數(shù)據(jù)的各個數(shù)值遠離其中心的趨勢和程度。一定性數(shù)據(jù)的數(shù)字特征由于定性數(shù)據(jù)主要是計數(shù),比較簡單,對定性數(shù)據(jù)的集中趨勢常用的方法就是計算比例、百分比、中位數(shù)和眾數(shù)。中位數(shù)是將總體各單位標(biāo)志值按大小順序排列,處于中間位置的那個數(shù)(如果樣本量為奇數(shù)),或者中間兩個數(shù)目的平均(如果樣本量為偶數(shù))。眾數(shù)就是數(shù)據(jù)中出現(xiàn)次數(shù)或出現(xiàn)頻率最多的數(shù)值。在定性數(shù)據(jù)中,由于記錄的是頻數(shù),因此眾數(shù)用得多些。二定量數(shù)據(jù)的數(shù)字特征反映定量數(shù)據(jù)特征的統(tǒng)計量常用的有:反映數(shù)據(jù)集中趨勢的水平度量:平均數(shù)、中位數(shù)、眾數(shù)和分位數(shù)等反映數(shù)據(jù)離散程度的差異度量:極差、四分位差、標(biāo)準(zhǔn)差和方差(一) 水

29、平的度量1. 平均數(shù)平均數(shù)也稱為均值,是把某一組數(shù)據(jù)進行算術(shù)平均,用以表述某一事物的平均水平,它在統(tǒng)計中叫做均值。簡單平均數(shù):把一個變量的所有觀測值相加再除以觀測值的數(shù)目加權(quán)平均數(shù):如果原始數(shù)據(jù)為分組數(shù)據(jù),則采用加權(quán)平均數(shù)公式計算,其中的權(quán)數(shù)f為各組的頻數(shù)。2. 中位數(shù)數(shù)字按順序排列后,處于中間位置的數(shù)即是。如總位數(shù)為奇數(shù),中間數(shù)即是;若為偶數(shù),則是中間兩位數(shù)的平均值。3. 眾數(shù)數(shù)組中出現(xiàn)次數(shù)最多的數(shù)。4. 用哪個值代表一組數(shù)據(jù)平均數(shù)、中位數(shù)和眾數(shù)是描述數(shù)據(jù)水平的三個主要統(tǒng)計量,要合理使用則需要了解它們的不同特點和應(yīng)用場合。平均數(shù)易為多數(shù)人理解和接受,實際中用的也較多,但主要缺點是更容易受少數(shù)

30、極端數(shù)值的影響,對于嚴重偏態(tài)分布的數(shù)據(jù),平均數(shù)的代表性較差。中位數(shù)和眾數(shù)提供的信息不像平均數(shù)那樣多,但它們也有優(yōu)點,比如不受極端值的影響,具有統(tǒng)計上的穩(wěn)健性,當(dāng)數(shù)據(jù)為偏態(tài)分布,特別是偏斜程度較大時,可以考慮選擇中位數(shù)和眾數(shù),這時它們的代表性要比平均數(shù)好。(二) 差異的度量對社會經(jīng)濟現(xiàn)象不僅需要對現(xiàn)象的集中趨勢進行分析(平均數(shù)、中位數(shù)、眾數(shù)),而且還需要進行差異程度分析即離散程度分析。研究事物現(xiàn)象的差異性,從差異性的事物現(xiàn)象中,尋求解決差異性的一些方法。1. 極差( Range)極差又稱全距,是最簡單的離散指標(biāo),它是一組數(shù)據(jù)中的最大值和最小值之差。計算極差非常簡單,含義也很直觀。但是,它僅僅受最

31、大值和最小值的影響,不能反映一組數(shù)據(jù)分布的情況,而且它非常容易受數(shù)據(jù)中極端值的影響。因此,它不能準(zhǔn)確地描述數(shù)據(jù)的分散程度。2. 方差和標(biāo)準(zhǔn)差為了反映數(shù)據(jù)中的每一個觀察值與平均水平的差異程度就必須引入方程和標(biāo)準(zhǔn)差的概念。方差:將各個變量值和其均值離差平方的平均數(shù),作為樣本數(shù)據(jù),它反映了樣本中各個觀測值到其均值的平均離散程度。其計算公式為:標(biāo)準(zhǔn)差是方差的平方根,它與方差相比更具量綱性,而且與變量值的計量單位相同,使用的范圍比方差更廣泛。其計算公式為:式中是總體標(biāo)準(zhǔn)差,s為樣本標(biāo)準(zhǔn)差??傮w自由度為n,樣本自由度為n-1,兩種有差異,是因為,自由度是指一組數(shù)據(jù)中可以自由取值的個數(shù),當(dāng)樣本數(shù)據(jù)的個數(shù)為

32、n時,其樣本均值 是確定的,只有n-1個數(shù)據(jù)可以自由取值,其中必有一個數(shù)據(jù)不能自由取值。所以,樣本的標(biāo)準(zhǔn)差只能除以n-1 ,而不能除以n .在一個統(tǒng)計樣本中,其標(biāo)準(zhǔn)差越大,說明它的各個觀測值分布的越分散,它的趨中程度就越差。反之,其標(biāo)準(zhǔn)差越小,說明它的各個觀測值分布的越集中,它的趨中程度就越好。3. 離散系數(shù)離散系數(shù)也稱變異系數(shù)、標(biāo)準(zhǔn)差系數(shù),它是將一組數(shù)據(jù)的標(biāo)準(zhǔn)差除以其均值,用來測度數(shù)據(jù)離散程度的相對數(shù)。其計算公式為:4. 標(biāo)準(zhǔn)分數(shù)標(biāo)準(zhǔn)分數(shù)也稱標(biāo)準(zhǔn)化值或Z分數(shù),它是變量值與其平均數(shù)的離差除以標(biāo)準(zhǔn)差后的值,用以測定某一個數(shù)據(jù)在該組數(shù)據(jù)中的相對位置。其計算公式為:標(biāo)準(zhǔn)分數(shù)最大的用途是可以把兩組數(shù)據(jù)

33、中的兩個不同均值,不同標(biāo)準(zhǔn)差的數(shù)據(jù)進行對比,以判定它們在各組中的位置。見課本P271例題.標(biāo)準(zhǔn)分數(shù)對比的兩個數(shù)據(jù)在各自數(shù)組中的相對位置。統(tǒng)計方法第三章參數(shù)估計第一節(jié) 抽樣分布一.總體分布與總體參數(shù)總體分布是總體中所有觀測值所形成的分布。總體參數(shù)是對總體特征的某個概括性的度量。通常有總體平均數(shù)( )、總體方差( )、總體比例()等。二.統(tǒng)計量和抽樣分布總體參數(shù)是未知的,但可以利用樣本信息來推斷。統(tǒng)計量是根據(jù)樣本數(shù)據(jù)計算的用于推斷總體的某些量,是對樣本特征的某個概括性度量。統(tǒng)計量是樣本的函數(shù),如樣本均值( )、樣本方差(s2 )、樣本比例(p)等。構(gòu)成統(tǒng)計量的函數(shù)中不能包括未知因素。由于樣本是從總

34、體中隨機抽取的,樣本具有隨機性,由樣本數(shù)據(jù)計算出的統(tǒng)計量也就是隨機的。抽樣分布是樣本統(tǒng)計量所形成的概率分布,如樣本均值的分布、樣本比例的分布等。在現(xiàn)實中,一個樣本的統(tǒng)計量我們可以觀察到,但不能觀察到所有可能的統(tǒng)計量值,抽樣分布是一種理論分布。統(tǒng)計量的取值是依據(jù)樣本而變化的,不同的樣本可以計算出不同的統(tǒng)計量值。那么,根據(jù)統(tǒng)計量來推斷總體參數(shù)就必然具有某種不確定性。但我們可以給出這種推斷的可靠性,而度量這種可靠性的依據(jù)是統(tǒng)計量的概率分布,并且我們確知這種分布的某些性質(zhì)。因此,統(tǒng)計量的概率分布提供了該統(tǒng)計量長遠而穩(wěn)定的信息,它構(gòu)成了推斷總體參數(shù)的理論基礎(chǔ)。(一)樣本均值的抽樣分布設(shè)總體共有N個元素,

35、從中隨機抽取一個容量為n的樣本,在重置抽樣時,共有Nn 種抽法,即可以組成Nn不同的樣本,在不重復(fù)抽樣時,共有 個可能的樣本。每一個樣本都可以計算出一個均值,這些所有可能的抽樣均值形成的分布就是樣本均值的分布。但現(xiàn)實中不可能將所有的樣本都抽取出來,因此,樣本均值的概率分布實際上是一種理論分布。數(shù)理統(tǒng)計學(xué)的相關(guān)定理已經(jīng)證明:即樣本均值的均值就是總體均值。在重置抽樣時,樣本均值的方差為總體方 的1/n,即 在不重置抽樣時,樣本均值的方差為其中, 為修正系數(shù),對于無限總體進行不重置抽樣時,可以按照重置抽樣計算,當(dāng)總體為有限總體,N比較大而n/N5% 時,修正系數(shù)可以簡化為1-n/N,當(dāng)N比較大,而n

36、/N5%時,修正系數(shù)可以近似為1,即可以按重置抽樣計算。當(dāng)總體服從正態(tài)分布時,樣本均值一定服從正態(tài)分布,即有XN( , )時, 若總體為未知的非正態(tài)分布時,只要樣本容量 n足夠大(通常要求n 30),樣本均值仍會接近正態(tài)分布。樣本分布的期望值為總體均值,樣本方差為總體方差的1/n 。這就是統(tǒng)計上著名的中心極限定理。該定理可以表述為:從均值為 ,方差為 的總體中,抽取樣本量為n的隨機樣本,當(dāng)n充分大時(通常要求n 30),樣本均值的分布近似服從均值為 ,方差為 的正態(tài)分布。如果總體不是正態(tài)分布,當(dāng)n為小樣本時(通常n30),樣本均值的分布則不服從正態(tài)分布。(二)樣本比例的抽樣分布比例是指具有某種

37、屬性的單位占全部單位數(shù)的比重??傮w比例(通常用表示)是總體中具有某種屬性的單位數(shù)占全部總體單位數(shù)的比例,是一個參數(shù),通常是未知的,也是我們想通過抽樣得到的說明總體特征的數(shù)據(jù)。樣本比例(通常用p表示)是隨機抽取的樣本中具有某種屬性的單位數(shù)占樣本全部單位數(shù)的比例,是一個樣本統(tǒng)計量,是隨機變量,對于一個已經(jīng)抽取出來的樣本來講,是可以觀察到的。描述所有可能樣本比例的概率分布就是樣本比例的抽樣分布。當(dāng)樣本容量比較大時,樣本比例p近似服從正態(tài)分布,且有p的數(shù)學(xué)期望就是總體比率 ,即 ;而P的方差與抽樣方法有關(guān),在重置抽樣下為 ,在不重置抽樣下為 ;即在重置抽樣時, p的分布為pN;在不重置抽樣時, p的分

38、布為pN一般講,當(dāng) np5,并n(1-p) 5時,就可以認為樣本容量足夠大。對于無限總體進行不重置抽樣時,可以按照重置抽樣計算,當(dāng)總體為有限總體,當(dāng)N比較大,而n/N 5%時,修正系數(shù)可以近似為1,這時也可以按重置抽樣計算。從上述分析可以看出,隨著樣本容量的增大,樣本比例的方差愈來愈小,說明樣本比例隨樣本容量增大,圍繞總體比例分布的峰度愈來愈高。三.統(tǒng)計量的標(biāo)準(zhǔn)誤差統(tǒng)計量的標(biāo)準(zhǔn)誤差也稱為標(biāo)準(zhǔn)誤,是指樣本統(tǒng)計量分布的標(biāo)準(zhǔn)差??捎糜诤饬繕颖窘y(tǒng)計量的離散程度。在參數(shù)估計中,它是用于衡量樣本統(tǒng)計量與總體參數(shù)之間差距的一個重要尺度。樣本均值的標(biāo)準(zhǔn)誤差計算公式為:當(dāng)總體標(biāo)準(zhǔn)差 未知時,可用樣本標(biāo)準(zhǔn)差s代替

39、計算,這時計算的標(biāo)準(zhǔn)誤差稱為估計標(biāo)準(zhǔn)誤差。相應(yīng)地,樣本比例的標(biāo)準(zhǔn)誤計算公式為同樣,當(dāng)總體比例的方差 (1-)未知時,可用樣本比例的方差p(1-p)代替。第二節(jié) 參數(shù)估計參數(shù)估計是用樣本統(tǒng)計量去估計總體的參數(shù)。用樣本統(tǒng)計量來估計總體參數(shù)有兩種方法:點估計和區(qū)間估計一點估計與區(qū)間估計點估計,是用樣本統(tǒng)計量的實現(xiàn)值來近似相應(yīng)的總體參數(shù)。區(qū)間估計,是根據(jù)估計可靠程度的要求,利用隨機抽取的樣本的統(tǒng)計量確定能夠覆蓋總體參數(shù)的可能區(qū)間的一種估計方法。區(qū)間估計是包括樣本統(tǒng)計量在內(nèi)(有時是以統(tǒng)計量為中心)的一個區(qū)間,該區(qū)間通常是由樣本統(tǒng)計量加減估計標(biāo)準(zhǔn)誤差得到的。與點估計不同,進行區(qū)間估計時,根據(jù)樣本統(tǒng)計量的抽

40、樣分布,可以對統(tǒng)計量與總體參數(shù)的接近程度給出一個概率度量。標(biāo)準(zhǔn)正態(tài)分布為N(0,1)分布,將概率分布標(biāo)準(zhǔn)化的公式為: 將z所對應(yīng)的概率稱為置信度或置信水平,將 表示的范圍稱為置信區(qū)間。以68.73%的置信水平推斷總體參數(shù)推斷總體參數(shù) 的置信區(qū)間為(z=1)以95.45%的置信水平推斷總體參數(shù)推斷總體參數(shù) 的置信區(qū)間為(z=2) 以99.73%的置信水平推斷總體參數(shù)推斷總體參數(shù) 的置信區(qū)間為(z=3)二評價估計量的標(biāo)準(zhǔn)用于估計總體參數(shù)的估計量可以有很多,如何選擇估計效果最好的那種估計量,評價估計量的好壞的標(biāo)準(zhǔn)具體有:1.無偏性,是指估計量抽樣分布的期望值等于被估計的總體參數(shù)。2.有效性,是指估計

41、量的方差盡可能小。有效性是指估計量的方差盡可能小。對同一個總體參數(shù)的兩個無偏估計量,有更小方差的估計量更有效。3.一致性,是指隨著樣本量的增大,點估計量的值越來越接近被估計總體的參數(shù)。即大樣本給出的估計量要比一個小樣本給出的估計量更接近總體的參數(shù)。從這個意義上說,樣本均值是總體均值的一個一致估計量。三一個總體均值的區(qū)間估計在對總體均值進行區(qū)間估計時,需要考慮總體是否為正態(tài)分布、總體方差是否已知,用于估計的樣本是大樣本還是小樣本等情況。但不管哪種情況,總體均值的置信區(qū)間都是由樣本均值加減估計誤差得到的。一般將置信水平表示為1- ,統(tǒng)計量分布兩側(cè)面積各為 /2的分為數(shù)值,它取決于事先所要求的置信度

42、(或可靠程度)。因此總體均值在1- 置信水平下的置信區(qū)間可一般性地表達為:( -分為數(shù)值* 的標(biāo)準(zhǔn)誤差, +分為數(shù)值* 的標(biāo)準(zhǔn)誤差)(一)大樣本的估計(二)小樣本的估計小樣本(n30)情況下,對總體均值的估計都是建立在總體服從正態(tài)分布的假定前提下。當(dāng)總體方差 已知時,樣本均值經(jīng)過標(biāo)準(zhǔn)化后仍服從標(biāo)準(zhǔn)正態(tài)分布,此時總體均值 在1- 置信水平下的置信總體比例的置信區(qū)間是由樣本比例和估計誤差兩部分組成的。第三節(jié) 樣本量的確定在進行參數(shù)估計時,樣本量要適當(dāng)。樣本量過大會增加調(diào)查費用,花費更多的人力;樣本量過小,樣本沒有足夠的代表性,統(tǒng)計量的標(biāo)準(zhǔn)誤差會增大,對總體參數(shù)的估計會不準(zhǔn)確。一估計總體均值時,樣本

43、量的確定在重置抽樣條件下,設(shè)E代表允許的估計誤差,則樣本量計算公式為:如果總體比例 的值不知道,可以用樣本比例s來代替,或者取 =0.5,使得 (1- )達到最大。統(tǒng)計方法第四章假設(shè)檢驗統(tǒng)計方法第五章相關(guān)分析與回歸分析相關(guān)分析是研究兩個或兩個以上變量之間相關(guān)關(guān)系的方法論,而回歸分析是研究變量之間相關(guān)關(guān)系類型,進而掌握其發(fā)展變化規(guī)律,預(yù)測未來的方法論。第一節(jié) 相關(guān)關(guān)系一相關(guān)關(guān)系在現(xiàn)實世界中,任何事物或現(xiàn)象都不是孤立存在的,而是相互聯(lián)系、相互制約、相互依存的。當(dāng)某些現(xiàn)象發(fā)生變化時,另一現(xiàn)象也會隨之發(fā)生變化。如商品價格的變化會刺激或抑制商品銷售量的變化;勞動力素質(zhì)的高低會影響企業(yè)的效益;直接材料、直

44、接人工的價格變化會對產(chǎn)品銷售成本有直接的影響;居民收入的高低會影響對該企業(yè)產(chǎn)品的需求量等等。研究這些現(xiàn)象之間的依存關(guān)系,找出它們之間的變化規(guī)律,是對經(jīng)搜集、整理過的統(tǒng)計數(shù)據(jù)進行數(shù)據(jù)分析,為客觀、科學(xué)地統(tǒng)計提供依據(jù)?,F(xiàn)象間的依存關(guān)系大致可以分成兩種類型: 一類是函數(shù)關(guān)系,另一類是相關(guān)關(guān)系。(1)函數(shù)關(guān)系。函數(shù)是指現(xiàn)象之間有一種嚴格的確定性的依存關(guān)系。表現(xiàn)為某一現(xiàn)象發(fā)生變化另一現(xiàn)象也隨之發(fā)生變化,而且有確定的值與之相對應(yīng)。例如,銀行的1年期存款利率為年息1.98,存入的本金用x表示,到期本息用y表示,則y=x+1.98%x(不考慮利息稅);(2)相關(guān)關(guān)系。相關(guān)關(guān)系是指客觀現(xiàn)象之間確實存在的,但數(shù)量

45、上不是嚴格對應(yīng)的依存關(guān)系。在這種關(guān)系中,對于某一現(xiàn)象的每一數(shù)值,可以有另一現(xiàn)象的若干數(shù)值與之相對應(yīng)。例如成本的高低與利潤的多少有密切關(guān)系,但某一確定的成本與相對應(yīng)的利潤的數(shù)量關(guān)系卻是不確定的。這是因為影響利潤的因素除了成本外,還有價格、供求平衡、消費嗜好等因素以及其他偶然因素的影響相關(guān)關(guān)系和函數(shù)關(guān)系既有區(qū)別,又有聯(lián)系。有些函數(shù)關(guān)系往往因為有觀察或測量誤差以及各種隨機因素的干擾等原因,在實際中常常通過相關(guān)關(guān)系表現(xiàn)出來;而在研究相關(guān)關(guān)系時,當(dāng)對其數(shù)量間的規(guī)律性了解得越深刻的時候,其相關(guān)關(guān)系就越有可能轉(zhuǎn)化為函數(shù)關(guān)系或借助函數(shù)關(guān)系來表現(xiàn)。(3)相關(guān)關(guān)系的兩個特點現(xiàn)象之間確實存在著數(shù)量上的依存關(guān)系。就是

46、說,一個現(xiàn)象發(fā)生數(shù)量上的變化,另一個現(xiàn)象也會相應(yīng)地發(fā)生數(shù)量上的變化?,F(xiàn)象間的數(shù)量依存關(guān)系值是不確定的。就是說,一個現(xiàn)象發(fā)生數(shù)量上的變化,另一個現(xiàn)象會有幾個可能值與之對應(yīng),而不是唯一確定的值。相關(guān)分析的主要內(nèi)容:(1)確定現(xiàn)象之間有無關(guān)系。(2)確定相關(guān)關(guān)系的表現(xiàn)形式,運用相應(yīng)的回歸分析方法進一步分析現(xiàn)象之間的數(shù)量依存關(guān)系。用一個數(shù)學(xué)表達式,來反映有相關(guān)關(guān)系的變量之間的數(shù)值變化關(guān)系,據(jù)此由一個或若干個自變量的數(shù)值推斷出因變量的可能值,這種分析稱為回歸分析。相關(guān)分析與回歸分析既有區(qū)別又有聯(lián)系,兩種分析構(gòu)成了相關(guān)關(guān)系分析的基本內(nèi)容。(3)測定相關(guān)關(guān)系的密切程度。二相關(guān)關(guān)系的描述-散點圖對于兩個變量x

47、和y,通過觀察或?qū)嶒灒覀兛梢缘玫饺舾山M數(shù)據(jù),記為(xi,yi)(i=1,2,n)將這些數(shù)據(jù)按x值由大到?。ɑ蛴尚〉酱螅┮孕蛄斜肀硎?,即構(gòu)成相關(guān)表。將一一對應(yīng)的(xi,yi)描點于坐標(biāo)軸上,即構(gòu)成散點圖,又稱相關(guān)圖。通過散點圖所反映出的坐標(biāo)點的分布狀況可以直觀地判斷變量之間是否存在相關(guān)關(guān)系,以及相關(guān)的形態(tài)、方向。例如:散點圖是相關(guān)關(guān)系的一種描述方法,它直觀、形象,通過散點圖可以觀察到現(xiàn)象的關(guān)系類型以及相關(guān)方向、程度。1. 相關(guān)的形態(tài)按照相關(guān)形式不同分為:線性相關(guān)和非線性相關(guān)。線性相關(guān)又稱直線相關(guān),是指當(dāng)一個變量變動時,另一變量隨之發(fā)生大致均等的變動,從圖形上看,其觀察點的分布近似地表現(xiàn)為一條直

48、線;例如,人均消費水平與人均收入水平通常呈線性關(guān)系。非線性相關(guān)一個變量變動時,另一變量也隨之發(fā)生變動,但這種變動不是均等的,從圖形上看,其觀察點的分布近似地表現(xiàn)為一條曲線,如拋物線、指數(shù)曲線等,因此也稱為曲線相關(guān)。例如,工人加班加點在一定數(shù)量界限內(nèi),產(chǎn)量增加,但一旦超過一定限度,產(chǎn)量反而可能下降,這就是一種非線性關(guān)系。2. 相關(guān)的方向按照相關(guān)的方向不同分為:正相關(guān)和負相關(guān)。正相關(guān)當(dāng)一個變量的值增加或減少,另一個變量的值也隨之增加或減少。如工人勞動生產(chǎn)率提高,產(chǎn)品產(chǎn)量也隨之增加;居民的消費水平隨個人所支配收入的增加而增加。負相關(guān)當(dāng)一個變量的值增加或減少時,另一變量的值反而減少或增加。如商品流轉(zhuǎn)額

49、越大,商品流通費用越低;利潤隨單位成本的降低而增加。三相關(guān)程度的測定:在直線相關(guān)的類型中,人們使用相關(guān)系數(shù)測定變量之間的相關(guān)關(guān)系。第六章時間序列分析時間序列是指經(jīng)濟現(xiàn)象按時間順序排列形成的數(shù)列。時間序列分析就是根據(jù)這樣的數(shù)列分析經(jīng)濟現(xiàn)象的發(fā)展規(guī)律,進而預(yù)測其未來水平。第一節(jié)時間序列的分析指標(biāo)時間數(shù)列是統(tǒng)計學(xué)中一種非常重要的數(shù)據(jù)類型,是一種以時間為坐標(biāo)軸的動態(tài)數(shù)列。一.時間數(shù)列的概念時間數(shù)列是一種統(tǒng)計數(shù)列,它是將反映某一現(xiàn)象的統(tǒng)計指標(biāo)在不同時間上的數(shù)值按時間先后順序排列所形成的數(shù)列。表現(xiàn)了現(xiàn)象在時間上的動態(tài)變化,故又稱為動態(tài)數(shù)列。從上表看出,一個完整的時間數(shù)列包含兩個基本要素:一是被研究現(xiàn)象或指

50、標(biāo)所屬的時間;另一個是該現(xiàn)象或指標(biāo)在此時間坐標(biāo)下的指標(biāo)值。同一時間數(shù)列中,通常要求各指標(biāo)值的時間單位和時間間隔相等,如無法保證相等,在計算某些指標(biāo)時就涉及到“權(quán)”的概念。研究時間數(shù)列的意義:了解與預(yù)測。二增長量分析(水平分析)1.水平指標(biāo)水平指標(biāo)是用來反映社會經(jīng)濟現(xiàn)象在某一時期或時點上發(fā)展變化的水平,它包括發(fā)展水平、平均發(fā)展水平、增長量等指標(biāo)。(1)發(fā)展水平發(fā)展水平是指客觀現(xiàn)象在一定時期內(nèi)(或時點上)發(fā)展所達到的規(guī)模、水平。在絕對數(shù)時間數(shù)列中,發(fā)展水平就是絕對數(shù);在相對數(shù)時間數(shù)列中,發(fā)展水平就是相對數(shù)或平均數(shù)。幾個概念:期初水平a0,期末水平an,期間水平(a1,a2,.an-1);報告期水平

51、(研究時期水平),基期水平(作為對比基礎(chǔ)的水平)(2)增長量增長量是報告期發(fā)展水平與基期發(fā)展水平之差,增長量的指標(biāo)數(shù)值可正可負,它反映的是報告期相對基期增加或減少的絕對數(shù)量,用公式表示為:增長量報告期水平基期水平根據(jù)基期的不同確定方法,增長量可分為逐期增長量和累計增長量。固定的、系統(tǒng)性的因素造成的。代表著研究對象的總發(fā)展方向,它既可以是線性的,也可以是曲線的。季節(jié)波動:時間數(shù)列在一年內(nèi)重復(fù)出現(xiàn)的周期性波動稱為季節(jié)波動。季節(jié)波動中“季節(jié)”一詞不僅僅是指一年中的四季,其實它是廣義的指任何一種周期性的變化。循環(huán)變動:時間數(shù)列呈現(xiàn)出來的圍繞長期趨勢的一種波浪形或震蕩式變動稱為循環(huán)變動,也稱作周期變動。

52、周期性變動沒有固定規(guī)律,其循環(huán)的幅度和周期的波動性很強,而且其周期短的一般也要3-5年,長的可達幾十年。不規(guī)則變動:由各種偶然的、突發(fā)的或不可預(yù)見的因素引起的,稱為不規(guī)則變動或隨機變動。(二)時間數(shù)列的分解模型時間數(shù)列分析的一項主要內(nèi)容就是把這幾個影響因素從時間數(shù)列中有目的的分離出來,或者說對數(shù)據(jù)進行分解、清理,并將他們的關(guān)系用一定的數(shù)學(xué)關(guān)系式予以表達。加法模型:假定四種變動因素相互獨立,時間數(shù)列各時期發(fā)展水平是各個構(gòu)成因素的總和。用數(shù)學(xué)表達為:YT+S+C+I乘法模型:假定四種變動因素彼此間存在著交互作用,時間數(shù)列各時期發(fā)展水平是各個構(gòu)成因素的乘積,其數(shù)學(xué)表達式:YTSCIT代表長期趨,S代

53、表季節(jié)變動,C代表循環(huán)變動,I代表不規(guī)則變動。需要說明:加法模型中,各個因素都是絕對數(shù),乘法模型中,除了長期趨勢是絕對數(shù)外,其他因素都是以相對數(shù)或指數(shù)的形式出現(xiàn)的。二、長期趨勢分析方法(一)回歸方程法回歸方程法就是利用回歸分析方法,將時間作為解釋變量,建立現(xiàn)象隨時間變化的趨勢方程。建立趨勢性方程之前,首先要確定趨勢的形態(tài),最常用的方法是先畫散點圖。若散點圖屬直線趨勢形態(tài),可擬合直線方程;若為曲線形態(tài),則擬合曲線方程。線性趨勢是指現(xiàn)象隨著時間的推移,時間數(shù)列的逐期增減量大致相等,從而呈現(xiàn)出穩(wěn)定增長或下降的線性變化規(guī)律。數(shù)移動,首尾要各少(k-1)/2項數(shù)值,按偶數(shù)時期項數(shù)移動,首尾要各少(k/2)項數(shù)值。因此,用移動平均法只便于求時間數(shù)列各期的趨勢值和觀察長期趨勢,而不便直接根據(jù)派生數(shù)列進行預(yù)測。(三)指數(shù)平滑法是對移動平均法做的一次改進。第三節(jié) 季節(jié)變動分析季節(jié)變動即經(jīng)濟現(xiàn)象在一年內(nèi)隨季節(jié)的轉(zhuǎn)變而呈現(xiàn)出周期性變動。季節(jié)變動有三個特點:一是季節(jié)變動每年重復(fù)進行;二是季節(jié)變動按一定的周期進行;三是每個周期變化強度大體相同。一、不考慮長期趨勢的季節(jié)指數(shù)法:季節(jié)指數(shù)法:是一種通過計算各月(或季)的季節(jié)指數(shù)(又稱季節(jié)比率),來反映季節(jié)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論