版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第一章緒論目錄什么是統(tǒng)計 1統(tǒng)計學(xué)的產(chǎn)生與發(fā)展2統(tǒng)計學(xué)的基本概念3第一節(jié)什么是統(tǒng)計一、統(tǒng)計的涵義所謂統(tǒng)計,它是人們認(rèn)識客觀世界總體數(shù)量變動關(guān)系和變動規(guī)律的活動的總稱,是人們認(rèn)識客觀世界的一種有力工具。統(tǒng)計的研究對象具有以下特點(diǎn):(一)數(shù)量性(二)總體性(三)變異性第一節(jié)什么是統(tǒng)計二、統(tǒng)計研究的基本環(huán)節(jié)(一)統(tǒng)計設(shè)計(二)收集數(shù)據(jù)(三)整理與分析(四)統(tǒng)計資料的積累、開發(fā)與應(yīng)用圖1-1統(tǒng)計研究的全過程第二節(jié)統(tǒng)計學(xué)的產(chǎn)生與發(fā)展一、統(tǒng)計學(xué)的主要流派(一)政治算術(shù)學(xué)派(二)國勢學(xué)派(三)社會統(tǒng)計學(xué)派(四)數(shù)理統(tǒng)計學(xué)派第二節(jié)統(tǒng)計學(xué)的產(chǎn)生與發(fā)展二、統(tǒng)計學(xué)發(fā)展的新動向首先,作為方法論科學(xué)的統(tǒng)計學(xué)與各實(shí)質(zhì)性學(xué)
2、科的結(jié)合越來越緊密。其次,國際統(tǒng)計學(xué)界的主流也從原來的偏重數(shù)理統(tǒng)計學(xué)的研究向更加重視應(yīng)用統(tǒng)計研究轉(zhuǎn)變。再次,統(tǒng)計學(xué)與計算機(jī)科學(xué)和信息科學(xué)的結(jié)合越來越緊密。第二節(jié)統(tǒng)計學(xué)的產(chǎn)生與發(fā)展三、理論統(tǒng)計學(xué)和應(yīng)用統(tǒng)計學(xué)現(xiàn)代統(tǒng)計學(xué)可以分為兩大類:一類是以抽象的數(shù)量為研究對象,研究一般的收集數(shù)據(jù)、整理數(shù)據(jù)和分析數(shù)據(jù)方法的理論統(tǒng)計學(xué);另一類是以各個不同領(lǐng)域的具體數(shù)量為研究對象的應(yīng)用統(tǒng)計學(xué)。理論統(tǒng)計學(xué)把研究對象一般化、抽象化,以數(shù)學(xué)中的概率論為基礎(chǔ),從純理論的角度對統(tǒng)計方法加以推導(dǎo)論證,其中心內(nèi)容是以歸納方法研究隨機(jī)變量的一般規(guī)律。應(yīng)用統(tǒng)計學(xué)則與各不同領(lǐng)域的實(shí)質(zhì)性學(xué)科有著非常密切的聯(lián)系,是有具體對象的方法論。第二節(jié)
3、統(tǒng)計學(xué)的產(chǎn)生與發(fā)展四、統(tǒng)計學(xué)與有關(guān)學(xué)科的聯(lián)系與區(qū)別數(shù)學(xué)是與統(tǒng)計學(xué)關(guān)系非常密切的一門科學(xué)。數(shù)學(xué)與統(tǒng)計學(xué)都是研究數(shù)量規(guī)律的,都要利用各種公式進(jìn)行運(yùn)算?,F(xiàn)代統(tǒng)計學(xué)中運(yùn)用了大量的數(shù)學(xué)理論與數(shù)學(xué)方法。統(tǒng)計學(xué)雖然與數(shù)學(xué)有密切的聯(lián)系,但兩者之間也存在本質(zhì)的區(qū)別。統(tǒng)計學(xué)中的應(yīng)用統(tǒng)計學(xué)與相關(guān)的實(shí)質(zhì)性學(xué)科如經(jīng)濟(jì)學(xué)等,有十分密切的聯(lián)系。數(shù)學(xué)、經(jīng)濟(jì)學(xué)和統(tǒng)計學(xué)是三門不同的學(xué)科,但其相互之間也有所交叉和重疊。第三節(jié)統(tǒng)計學(xué)的基本概念一、總體與總體單位所謂統(tǒng)計總體,就是根據(jù)一定目的確定的所要研究的事物的全體,它是由客觀存在的、具有某種共同性質(zhì)的許多個別事物構(gòu)成的整體??傮w單位(簡稱單位)是組成總體的各個個體。根據(jù)研究目的不同
4、,單位可以是人、物、機(jī)構(gòu)等實(shí)物單位,也可以是一種現(xiàn)象或活動過程等非實(shí)物單位??傮w和單位的概念是相對而言的,隨著研究目的不同、總體范圍不同而變化。同一個研究對象,在一種情況下為總體,但在另一種情況下又可能變成單位。第三節(jié)統(tǒng)計學(xué)的基本概念二、樣本統(tǒng)計研究的目的是要確定總體的數(shù)量特征。但是,當(dāng)總體單位數(shù)量很多甚至無限時,不必要或不可能對構(gòu)成總體的所有單位都進(jìn)行調(diào)查。這時,需要采用一定的方式,從由作為研究對象的事物全體構(gòu)成的總體(又稱母體)中,抽取一部分單位,作為總體的代表加以研究。這種由總體的部分單位組成的集合,稱為樣本(又稱子樣)。樣本也是由一定數(shù)量的單位構(gòu)成的,樣本所包含的總體單位數(shù)稱為樣本容量
5、。第三節(jié)統(tǒng)計學(xué)的基本概念三、標(biāo)志總體各單位普遍具有的屬性或特征稱為標(biāo)志。標(biāo)志分為品質(zhì)標(biāo)志和數(shù)量標(biāo)志兩種。盡管標(biāo)志是總體各單位都具有的普遍屬性,但各單位有關(guān)標(biāo)志的具體表現(xiàn)卻未必相同。第三節(jié)統(tǒng)計學(xué)的基本概念四、統(tǒng)計指標(biāo)與指標(biāo)體系統(tǒng)計指標(biāo)是反映統(tǒng)計總體數(shù)量特征的概念和數(shù)值。統(tǒng)計指標(biāo)是由兩項基本要素構(gòu)成的,即指標(biāo)的概念(名稱)和指標(biāo)的取值。統(tǒng)計指標(biāo)體系是由一系列相互聯(lián)系的統(tǒng)計指標(biāo)所組成的有機(jī)整體,用以反映所研究現(xiàn)象各方面相互依存、相互制約的關(guān)系。第二章 數(shù)據(jù)的收集、整理 與顯示目錄數(shù)據(jù)的收集1數(shù)據(jù)的整理2數(shù)據(jù)的顯示3第一節(jié)數(shù)據(jù)的收集一、數(shù)據(jù)概述(一)數(shù)據(jù)的基本概念我們身邊隨時都存在各種各樣的數(shù)據(jù):社會
6、數(shù)據(jù)、商務(wù)與經(jīng)濟(jì)統(tǒng)計數(shù)據(jù)、自然統(tǒng)計數(shù)據(jù)、醫(yī)學(xué)研究數(shù)據(jù)、衛(wèi)生統(tǒng)計數(shù)據(jù)、體育統(tǒng)計數(shù)據(jù),以及網(wǎng)絡(luò)統(tǒng)計數(shù)據(jù)等。數(shù)據(jù)時時存在、處處存在。我們可以做出如下定義:在統(tǒng)計中,說明某種客觀現(xiàn)象的數(shù)量特征的數(shù)字叫統(tǒng)計數(shù)據(jù)。第一節(jié)數(shù)據(jù)的收集(二)數(shù)據(jù)的計量尺度1.定類尺度2.定序尺度3.定距尺度4.定比尺度(三)數(shù)據(jù)的類型1.品質(zhì)數(shù)據(jù)和數(shù)量數(shù)據(jù)2.橫截面數(shù)據(jù)、時間序列數(shù)據(jù)和面板數(shù)據(jù)。3.調(diào)查數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù)4.直接數(shù)據(jù)和間接數(shù)據(jù)第一節(jié)數(shù)據(jù)的收集二、數(shù)據(jù)收集的方法及形式(一)直接觀察法(二)報告法(三)采訪法(四)登記法(五)實(shí)驗(yàn)設(shè)計法第一節(jié)數(shù)據(jù)的收集三、統(tǒng)計調(diào)查體系及方案設(shè)計(一)統(tǒng)計調(diào)查形式1.普查2.統(tǒng)計報表制度
7、3.抽樣調(diào)查4.重點(diǎn)調(diào)查5.典型調(diào)查(二)統(tǒng)計調(diào)查體系統(tǒng)計調(diào)查體系是指若干相互聯(lián)系的統(tǒng)計調(diào)查方法所構(gòu)成的整體。對于復(fù)雜的經(jīng)濟(jì)、社會現(xiàn)象,要了解其數(shù)量變化情況,客觀上需要區(qū)別不同的研究對象和研究目的,采取不同的調(diào)查方法。第一節(jié)數(shù)據(jù)的收集(三)數(shù)據(jù)收集方案設(shè)計1.明確調(diào)查目的why2.確定調(diào)查對象和調(diào)查單位who3.確定調(diào)查項目what4.調(diào)查表格和問卷的設(shè)計5.確定調(diào)查時間when6.確定調(diào)查的組織實(shí)施計劃第一節(jié)數(shù)據(jù)的收集四、間接統(tǒng)計數(shù)據(jù)的主要來源統(tǒng)計數(shù)據(jù)的主要來源包括直接來源和間接來源兩個渠道。對于應(yīng)用統(tǒng)計數(shù)據(jù)進(jìn)行分析的人員而言,有可供利用的間接數(shù)據(jù)是最經(jīng)濟(jì)的,只有缺乏間接數(shù)據(jù)或因?yàn)楦鞣N原因間
8、接數(shù)據(jù)不可采用時,才去獲取直接數(shù)據(jù)。來源于系統(tǒng)內(nèi)部的間接數(shù)據(jù)包括系統(tǒng)內(nèi)的業(yè)務(wù)數(shù)據(jù)。來源于系統(tǒng)外部的間接數(shù)據(jù)包括統(tǒng)計部門和政府部門公布的有關(guān)資料。第二節(jié)數(shù)據(jù)的整理一、數(shù)據(jù)整理概述(一)統(tǒng)計數(shù)據(jù)整理的內(nèi)容(1)根據(jù)研究目的設(shè)計整理匯總方案。(2)根據(jù)匯總方案,對各個調(diào)查項目的資料進(jìn)行匯總,通過匯總計算各項指標(biāo)。(3)通過統(tǒng)計表或統(tǒng)計圖的形式,描述整理的結(jié)果。(二)數(shù)據(jù)整理的程序(1)統(tǒng)計數(shù)據(jù)的審核與檢驗(yàn)。(2)數(shù)據(jù)的分組和匯總。(3)數(shù)據(jù)的表示與描述。(4)統(tǒng)計資料的積累、保管和公布。第二節(jié)數(shù)據(jù)的整理二、統(tǒng)計分組(一)統(tǒng)計分組的概念與種類1.統(tǒng)計分組的概念根據(jù)統(tǒng)計研究的目的和客觀現(xiàn)象的內(nèi)在特點(diǎn),按
9、某個標(biāo)志(或幾個標(biāo)志)把被研究的總體劃分為若干個不同性質(zhì)的組,稱為統(tǒng)計分組。統(tǒng)計分組的對象是總體。統(tǒng)計分組標(biāo)志可以是品質(zhì)標(biāo)志,也可以是數(shù)量標(biāo)志。2.統(tǒng)計分組的作用(1)劃分社會經(jīng)濟(jì)現(xiàn)象的類型。(2)反映現(xiàn)象的內(nèi)部結(jié)構(gòu)及其比例關(guān)系。(3)分析現(xiàn)象之間的依存關(guān)系。第二節(jié)數(shù)據(jù)的整理3.統(tǒng)計分組的原則所謂窮盡原則,就是使總體中的每一個單位都應(yīng)有組可歸,或者說各分組的空間足以容納總體所有的單位。所謂互斥原則,就是在特定的分組標(biāo)志下,總體中的任何一個單位只能歸屬于某一組,而不能同時或可能歸屬于幾個組。4.統(tǒng)計分組的種類(1)按某一分組的標(biāo)志的多少和組合情況,分為簡單分組和復(fù)合分組。(2)按分組的標(biāo)志的性質(zhì)
10、不同,分為品質(zhì)分組(或稱屬性分組)和數(shù)量分組(或稱變量分組)。(3)按分組的作用和任務(wù)不同,分為類型分組、結(jié)構(gòu)分組和分析分組。第二節(jié)數(shù)據(jù)的整理(二)統(tǒng)計分組的方法1.正確選擇分組標(biāo)志2.按照品質(zhì)標(biāo)志分組3.按照數(shù)量標(biāo)志分組(1)單項式分組與組距式分組。(2)間斷組距式分組和連續(xù)組距式分組。(3)等距分組與異距分組。第二節(jié)數(shù)據(jù)的整理(三)組距式分組中相關(guān)指標(biāo)的計算1.組距2.組數(shù)3.組中值4.開口組的組距與組中值第二節(jié)數(shù)據(jù)的整理三、頻數(shù)分布(一)頻數(shù)分布的基本概念與要素在統(tǒng)計分組的基礎(chǔ)上,將總體所有的單位按某一標(biāo)志進(jìn)行歸類排列,稱為頻數(shù)分布。根據(jù)分組標(biāo)志特征的不同,分布數(shù)列可分為兩類:按品質(zhì)標(biāo)志
11、分組所形成的數(shù)列即品質(zhì)分布數(shù)列,亦稱品質(zhì)數(shù)列;按數(shù)量標(biāo)志分組所形成的數(shù)列叫變量分布數(shù)列,亦稱變量數(shù)列。(二)變量數(shù)列的編制統(tǒng)計調(diào)查所收集的原始資料,是比較分散、零亂的,無法顯示現(xiàn)象總體的本質(zhì)特征。一般來說,對所收集的資料按標(biāo)志值大小進(jìn)行排序,再觀察各標(biāo)志值分布是否均勻,決定是否采用等距分組。第二節(jié)數(shù)據(jù)的整理(三)累計頻數(shù)與累計頻率累計頻數(shù)(或頻率)可以是向上累計頻數(shù)(或頻率),也可以是向下累計頻數(shù)(或頻率)。向上累計頻數(shù)(或頻率)分布,其方法是先列出各組的上限,然后由標(biāo)志值低的組向標(biāo)志值高的組依次累計。向下累計頻數(shù)(或頻率)分布,其方法是先列出各組的下限,然后由標(biāo)志值高的組向標(biāo)志值低的組依次累
12、計。(四)頻數(shù)分布的類型1.鐘形分布2.U形分布3.J形分布第三節(jié)數(shù)據(jù)的顯示一、統(tǒng)計表(一)統(tǒng)計表的定義和結(jié)構(gòu)統(tǒng)計表有廣義和狹義之分。廣義的統(tǒng)計表包括調(diào)查表、登記表、過渡表及表達(dá)最后結(jié)果的分析表。狹義的統(tǒng)計表是指分析表。下面簡述狹義統(tǒng)計表的結(jié)構(gòu)和編制。從形式上看,統(tǒng)計表由總標(biāo)題,橫行標(biāo)題、縱欄標(biāo)題和指標(biāo)數(shù)值四部分組成;從內(nèi)容上看,統(tǒng)計是由主詞和賓詞兩部分構(gòu)成。主詞是統(tǒng)計表要說明的總體或總體分成的多個組,賓詞是說明主詞的統(tǒng)計指標(biāo)。第三節(jié)數(shù)據(jù)的顯示(二)統(tǒng)計表的種類1.按照主詞是否分組及分組的情況,統(tǒng)計表可分為簡單表、簡單分組表和復(fù)合分組表。2.根據(jù)賓詞分類,統(tǒng)計表可分為簡單排列、平行排列和重疊排
13、列3.按照用途,廣義統(tǒng)計表可分為調(diào)查表、整理表和分析表第三節(jié)數(shù)據(jù)的顯示(三)統(tǒng)計表的設(shè)計(1)統(tǒng)計表的各種標(biāo)題應(yīng)簡明、確切地表達(dá)其內(nèi)容,特別是總標(biāo)題,應(yīng)十分簡要地概括出統(tǒng)計表的基本內(nèi)容和表中資料所屬的時間、地點(diǎn)。(2)表中主欄各行和賓欄各列,一般是按先局部后整體的原則排列。(3)如欄次較多,通常要加以編號。(4)表中數(shù)字應(yīng)對準(zhǔn)位數(shù)、填寫整齊。(5)統(tǒng)計表中必須注明計量單位。(6)統(tǒng)計表的表式通常是左右開口的,即左右兩端不畫縱線。(7)必要時,應(yīng)在統(tǒng)計表下方注明表中某些資料的來源或?qū)δ承?shù)據(jù)的計算方法、計算口徑作出說明。第三節(jié)數(shù)據(jù)的顯示二、統(tǒng)計圖(一)幾何圖1.條形圖2.圓形圖3.直方圖4.折線
14、圖5.曲線圖第三節(jié)數(shù)據(jù)的顯示(二)象形圖象形圖是以統(tǒng)計資料所反映的實(shí)物的形象來表明數(shù)據(jù)內(nèi)容,以圖形的大小、多少來表明數(shù)據(jù)的統(tǒng)計圖形,常見的有臉譜圖、樹譜圖等。(三)統(tǒng)計地圖統(tǒng)計地圖是指在地圖上標(biāo)明各種線、色、點(diǎn)、形來表明數(shù)據(jù)在空間的分布狀況的圖形。第三節(jié)數(shù)據(jù)的顯示三、統(tǒng)計分析報告統(tǒng)計分析報告是指對統(tǒng)計資料經(jīng)過系統(tǒng)整理并進(jìn)行了深入分析之后,將所得的分析研究結(jié)果用文字報告(結(jié)合相應(yīng)圖表及模型)的形式表達(dá),以供有關(guān)方面參考或使用。可以分為如下四部分:(1)基本情況。(2)成績和經(jīng)驗(yàn)。(3)問題和原因。(4)建議與措施。第三章 數(shù)據(jù)分布特征描述目錄統(tǒng)計變量集中趨勢的測定1統(tǒng)計變量離散程度的測定2變量分
15、布的特征描述3第一節(jié)統(tǒng)計變量集中趨勢的測定一、測定集中趨勢的意義(一)反映總體各單位標(biāo)志值的一般水平和集中趨勢(二)比較各個同質(zhì)總體在同一時期的發(fā)展水平(三)比較同一總體在不同時期的發(fā)展水平及變化趨勢第一節(jié)統(tǒng)計變量集中趨勢的測定二、位置代表值(一)中位數(shù)的計算如果將總體中各單位的標(biāo)志值按大小順序排列,則處于數(shù)列中點(diǎn)位置的標(biāo)志值就是中位數(shù)。用中位數(shù)來代表總體的一般水平可以避免受總體中極端標(biāo)志值的影響,有時更有代表性。1.下限公式Me=LMe+dMe2.上限公式Me=uMe-dMe式中:Me為中位數(shù);LMe和uMe分別為中位數(shù)組的下限和上限;dMe為中位數(shù)組的組距;SMe-1和SMe+1分別為向上
16、(和向下)累計至中位數(shù)組的前(和后)一組止的次數(shù);fMe為中位數(shù)組的次數(shù)。第一節(jié)統(tǒng)計變量集中趨勢的測定(二)眾數(shù)的計算眾數(shù)是總體分布數(shù)列中出現(xiàn)次數(shù)最多的標(biāo)志值,表示社會經(jīng)濟(jì)現(xiàn)象總體中最經(jīng)常出現(xiàn)的標(biāo)志值。利用眾數(shù)作為現(xiàn)象一般水平的代表,有其獨(dú)到的地方。1.下限公式Mo=LMo+dMo2.上限公式Mo=UMo-dMo式中:Mo為眾數(shù);LMo和UMo分別為眾數(shù)組的下限和上限;dMo為眾數(shù)組的組距;1=fMo-fMo-1為眾數(shù)組與前一組次數(shù)之差;2=fMo-fMo+1為眾數(shù)組與后一組次數(shù)之差。第一節(jié)統(tǒng)計變量集中趨勢的測定三、數(shù)值平均數(shù)平均指標(biāo)是反映社會經(jīng)濟(jì)總體各單位數(shù)量標(biāo)志表現(xiàn)一般水平的綜合指標(biāo)。(一
17、)算術(shù)平均數(shù)1.簡單算術(shù)平均數(shù)2.加權(quán)算術(shù)平均數(shù)3.中位數(shù)、眾數(shù)和算術(shù)平均數(shù)的關(guān)系4.是非標(biāo)志平均數(shù)第一節(jié)統(tǒng)計變量集中趨勢的測定(二)調(diào)和平均數(shù)1.調(diào)和平均數(shù)的計算方法(1)簡單調(diào)和平均數(shù)。(2)加權(quán)調(diào)和平均數(shù)。2.比值平均數(shù)(1)計算相對數(shù)的平均水平。(2)計算平均數(shù)的平均數(shù)。(三)幾何平均數(shù)1.簡單幾何平均數(shù)2.加權(quán)幾何平均數(shù)第一節(jié)統(tǒng)計變量集中趨勢的測定(四)幾何平均數(shù)、算術(shù)平均數(shù)、調(diào)和平均數(shù)之間的關(guān)系幾何平均數(shù)、算術(shù)平均數(shù)、調(diào)和平均數(shù)都有自己的應(yīng)用條件,應(yīng)用時必須認(rèn)真考慮研究的要求,選用適當(dāng)?shù)钠骄鶖?shù)和計算形式。但就數(shù)量關(guān)系而言,對同一變量值計算幾何平均數(shù)、算術(shù)平均數(shù)、調(diào)和平均數(shù),會發(fā)現(xiàn)它
18、們的大小順序是固定不變的,即幾何平均數(shù)大于調(diào)和平均數(shù),而算術(shù)平均數(shù)又大于幾何平均數(shù)。(五)平均指標(biāo)的應(yīng)用1.把平均指標(biāo)和總量指標(biāo)結(jié)合起來運(yùn)用2.以組平均數(shù)補(bǔ)充總平均數(shù)3.把平均指標(biāo)和分布數(shù)列分析結(jié)合起來4.把平均指標(biāo)和具體情況分析結(jié)合起來第二節(jié)統(tǒng)計變量離散程度的測定一、測定離散程度的意義在社會經(jīng)濟(jì)統(tǒng)計研究中,變異(離散)指標(biāo)有它的重要作用。首先,利用變異(離散)指標(biāo)可以說明現(xiàn)象變動的均勻性或穩(wěn)定性程度。其次,在投資決策中,通常利用變異(離散)指標(biāo)來估算投資風(fēng)險程度,人們總是希望投資的收益愈多愈好,同時風(fēng)險愈小愈好,但實(shí)際上收益與風(fēng)險是一對矛盾,一般不可能風(fēng)險小而收益大。再次,變異(離散)指標(biāo)可
19、以說明平均指標(biāo)的代表性程度。最后,變異(離散)指標(biāo)可以用來研究總體單位變量值的分布偏離正態(tài)的情況。第二節(jié)統(tǒng)計變量離散程度的測定二、極差、四分位差和平均差(一)極差極差(也稱全距)是指總體各單位標(biāo)志值中最大值和最小值之差,用來表示標(biāo)志值的變動范圍。通常用R表示,即:R=max-min 極差系數(shù)=極差算術(shù)平均數(shù)(二)四分位差如果將總體中各單位的標(biāo)志值按從小到大順序排列,則處于數(shù)列3/4位次的標(biāo)志值減去處于1/4位次的標(biāo)志值之差再除以2而得的值就是四分位差。(三)平均差因?yàn)楦鳂?biāo)志值對算術(shù)平均數(shù)離差總和等于零,因而離差平均數(shù)也一定等于零,不能反映離差的平均程度。用離差絕對值求平均數(shù),可以消除正負(fù)號的影
20、響,反映各標(biāo)志值與算術(shù)平均數(shù)絕對離差大小的平均程度。第二節(jié)統(tǒng)計變量離散程度的測定三、方差與標(biāo)準(zhǔn)差(一)方差和標(biāo)準(zhǔn)差的計算方法方差和標(biāo)準(zhǔn)差是測度標(biāo)志變異最重要、最常用的指標(biāo)。方差是總體中各單位標(biāo)志值對算術(shù)平均數(shù)離差平方的平均數(shù);即先求各單位標(biāo)志值與算術(shù)平均數(shù)之差,并將離差加以逐項平方,然后求總和再除以項數(shù)便得到方差,以2表示。方差是由離差平方計算平均數(shù),所以其計量單位是原來單位的平方。標(biāo)準(zhǔn)差則是方差開方的結(jié)果,它恢復(fù)了原來的計量單位,可以反映標(biāo)志值與算術(shù)平均數(shù)離差的平均水平,所以也稱為均方差。第二節(jié)統(tǒng)計變量離散程度的測定(二)總方差、組間方差和組內(nèi)方差在資料分組的情況下,利用組平均數(shù)所求的方差和
21、利用標(biāo)志值直接求得的方差是不同的,這一點(diǎn)和利用組平均數(shù)求總體平均數(shù)的結(jié)果完全不同?,F(xiàn)在把各單位標(biāo)志值對平均數(shù)所計算的方差稱為總方差,用2表示。把各組平均數(shù)對總平均數(shù)所計算的方差稱為組間方差,用2表示。第i組標(biāo)志值和組平均數(shù)所計算的方差稱為第i組的組內(nèi)方差,用表示。第二節(jié)統(tǒng)計變量離散程度的測定(三)方差的數(shù)學(xué)性質(zhì)(1)變量的方差等于變量平方的平均數(shù)減平均數(shù)的平方。(2)變量與算術(shù)平均數(shù)離差平方和具有最小的性質(zhì),即變量與算術(shù)平均數(shù)計算的方差小于變量與任何其他常數(shù)計算的方差。(3)變量線性變換的方差等于變量的方差乘以變量系數(shù)的平方。(4)n個獨(dú)立總體各變量代數(shù)和的方差等于各變量方差的代數(shù)和。(5)n
22、個獨(dú)立總體各變量代數(shù)和的標(biāo)準(zhǔn)差不大于各變量標(biāo)準(zhǔn)差的代數(shù)和。(四)是非標(biāo)志的標(biāo)準(zhǔn)差上一節(jié)介紹了是非標(biāo)志平均數(shù)的計算,本節(jié)進(jìn)一步介紹其標(biāo)準(zhǔn)差的計算方法。仍以0表示總體中不具有某種性質(zhì)的單位標(biāo)志值,以1表示總體中具有某種性質(zhì)的單位標(biāo)志值。第二節(jié)統(tǒng)計變量離散程度的測定四、離散系數(shù)與異眾比率(一)離散系數(shù)(變異系數(shù))變異(離散)指標(biāo)的大小不僅取決于總體的變異程度,還與標(biāo)志值絕對水平高低有關(guān),所以不同總體的單位如果標(biāo)志值絕對水平相差大,是不宜直接用變異(離散)指標(biāo)來比較它們的變異程度的。此時,適用的是離散系數(shù)(也稱變異系數(shù)),它為標(biāo)志值的變異(離散)指標(biāo)與標(biāo)志值的算術(shù)平均數(shù)的比值,其中最常用的離散系數(shù)是標(biāo)
23、準(zhǔn)差系數(shù)。(二)異眾比率異眾比率(Variation ratio)又稱離異比率或變差比,指的是非眾數(shù)(組)的次數(shù)(頻數(shù))與全部變量值總次數(shù)的比率,即眾數(shù)不能代表的那一部分變量值在總體中的比重。第三節(jié)變量分布的特征描述一、矩的概念矩也稱為動差,是源自物理學(xué)的一個概念。二、偏度偏度(系數(shù))是度量總體標(biāo)志值頻率分布不對稱程度或偏斜程度的指標(biāo)。它是利用K階中心矩中變量值對平均數(shù)正負(fù)離差相互抵消的原理。第三節(jié)變量分布的特征描述三、峰度峰度(系數(shù))是度量頻率分布中鄰近平均數(shù)的標(biāo)志值集中程度,亦即分布曲線的尖峭程度的指標(biāo)。它是以四階中心矩除以標(biāo)準(zhǔn)差的4次方,再將結(jié)果減3計算出的。圖3-6不同峰度的分布曲線圖
24、第四章 概率基礎(chǔ)目錄概率的基本概念1隨機(jī)變量及其分布2幾種常見的概率分布3大數(shù)定律與中心極限定理4第一節(jié)概率的基本概念一、隨機(jī)試驗(yàn)與隨機(jī)事件在概率論和統(tǒng)計學(xué)中,我們把要研究的一個隨機(jī)現(xiàn)象稱之為一個隨機(jī)試驗(yàn)。一個隨機(jī)試驗(yàn)的所有可能結(jié)果的集合叫做該隨機(jī)試驗(yàn)的樣本空間,可用大寫的希臘字母表示。而樣本空間的任一子集合就稱為一個(隨機(jī))事件 從數(shù)學(xué)角度看,這一說法不嚴(yán)密;但從實(shí)用角度來說,還是可行的。如果事件是由樣本空間的單一元素所組成,則稱為簡單事件,也就是不可以再分解的事件,又稱為基本事件或樣本點(diǎn)。復(fù)雜事件則是樣本空間的兩個元素以上的子集,或者說由簡單事件組合而成的事件。第一節(jié)概率的基本概念二、概率
25、如果一個隨機(jī)試驗(yàn)在相同的條件下重復(fù)進(jìn)行n次,那么,當(dāng)隨機(jī)事件A發(fā)生的次數(shù)是m時,就定義它發(fā)生的頻率為fn(m)=m/n。(一)古典(等可能)概型(二)概率的性質(zhì)(1)0P(A)1,P()=1。(2)記=-A(稱為A的對立事件),那么P()=1-P(A),特別地,P()=0。(3)P(AB)=P(A)+P(B)-P(AB),特別地,如果事件A與事件B互不相容,則P(AB)=P(A)+P(B)。(4)如果事件A與事件B滿足AB,那么P(B-A)=P(B)-P(A),從而P(B)P(A)。第一節(jié)概率的基本概念(三)條件概率與事件的獨(dú)立性在某些情況下,我們可能已經(jīng)知道有關(guān)事件的一些信息,比如,已知某一
26、事件已經(jīng)發(fā)生,另一一般來說,假設(shè)A、B為兩事件,P(A)0,則稱P(AB)/P(A)為事件A已知條件下事件B發(fā)生的條件概率。對事件A與B,若P(AB)=P(A)P(B),則稱它們是統(tǒng)計獨(dú)立的,簡稱相互獨(dú)立。第二節(jié)隨機(jī)變量及其分布一、隨機(jī)變量與概率分布的概念一般來說,隨機(jī)變量X是定義在樣本空間=上的一個函數(shù),這個函數(shù)的取值隨著試驗(yàn)的結(jié)果不同而變化,并且為了能計算隨機(jī)事件的概率,還要求它滿足條件:對任意的實(shí)數(shù)x,Xx是隨機(jī)事件,即XxF。如果隨機(jī)變量所有可能的取值是有限的,或可以排成一列,這種隨機(jī)變量稱為離散型隨機(jī)變量,如投骰子試驗(yàn)中出現(xiàn)的點(diǎn)數(shù)。另一種情況是隨機(jī)變量的取值范圍是一個區(qū)間或整個數(shù)軸,
27、這種隨機(jī)變量稱為連續(xù)型隨機(jī)變量 這一說法不太嚴(yán)密,因?yàn)檫€存在奇異型隨機(jī)變量。這里之所以這么說,是為了簡單起見。第二節(jié)隨機(jī)變量及其分布二、概率分布的類型(一)離散型隨機(jī)變量的概率分布設(shè)離散型隨機(jī)變量X的所有可能取值為x1,x2,xn,相應(yīng)的概率為P(x1),P(x2),P(xn),。該概率分布也可簡單記為:P(X=xi)=P(xi)(i=1,2,)第二節(jié)隨機(jī)變量及其分布(二)連續(xù)型隨機(jī)變量的概率分布設(shè)X是一個隨機(jī)變量,若存在一個非負(fù)可積函數(shù)f(x),使得X的概率分布函數(shù)F(x)=P(Xx),可以表示為:F(x)=f(t)dt,-x+則稱X是連續(xù)型隨機(jī)變量,f(x)是它的(概率)密度函數(shù)。連續(xù)型隨
28、機(jī)變量的密度函數(shù)有以下性質(zhì):(1)f(x)0;(2)f(x)dx=1;(3)P(aXb)=f(x)dx;(4)在f(x)的連續(xù)點(diǎn)處,f(x)=F(x)。第二節(jié)隨機(jī)變量及其分布三、隨機(jī)變量的數(shù)字特征(一)隨機(jī)變量的(數(shù)學(xué))期望1.離散型隨機(jī)變量X的數(shù)學(xué)期望值定義 E(X)=xiP(xi)2.連續(xù)型隨機(jī)變量X的(數(shù)學(xué))期望值定義 E(X)=xf(x)dx更一般地,如果g(x)是可積函數(shù),則隨機(jī)變量X的函數(shù)Y=g(X)也是隨機(jī)變量,并且其數(shù)學(xué)期望值定義為:E(Y)=Eg(X)=g(x)f(x)dx3.隨機(jī)變量數(shù)學(xué)期望的性質(zhì) E(X1+X2)=E(X1)+E(X2)其中X1,X2是隨機(jī)變量,是任意常數(shù)
29、。也就是說,隨機(jī)變量的期望具有線性性質(zhì),并且這個性質(zhì)可推廣到多個隨機(jī)變量的情形。第二節(jié)隨機(jī)變量及其分布(二)隨機(jī)變量的方差與標(biāo)準(zhǔn)差方差的正平方根稱為標(biāo)準(zhǔn)差。1.離散型隨機(jī)變量X的方差Var(X)=P(xi)2.連續(xù)型隨機(jī)變量X的方差Var(X)=x-E(X)2f(x)dx3.隨機(jī)變量的方差的性質(zhì)(1)對于任意的常數(shù),Var(aX)=a2Var(X)(2)Var(X)=E(X2)-E(X)2第二節(jié)隨機(jī)變量及其分布四、隨機(jī)向量與獨(dú)立性(一)二元(維)隨機(jī)向量我們以二元(維)隨機(jī)向量為例來說明隨機(jī)向量的相關(guān)概念和性質(zhì)。設(shè)X,Y是隨機(jī)變量,記XxYy=Xx,Yy,則F(x,y)=P(Xx,Yy)稱為二
30、元(維)隨機(jī)向量(X,Y)的(聯(lián)合)概率分布函數(shù),而FX(x)=P(Xx)和FY(y)=P(Yy)分別稱為X和Y的邊際(邊緣)分布。如果F(x,y)=FX(x)FY(y)始終成立,則稱X和Y相互(統(tǒng)計)獨(dú)立。第二節(jié)隨機(jī)變量及其分布(二)離散型隨機(jī)向量的概率分布設(shè)離散型隨機(jī)向量(X,Y)的所有可能取值為(xi,yj);i,j= 1,2,則隨機(jī)向量(X,Y)的(聯(lián)合)概率分布(列)為:pij=P(X=xi,Y=yj)(i,j= 1,2,)(4.13)而pi.=P(X=xi,Y=yj)=P(X=xi)p.j=P(X=xi,Y=yj)=P(Y=yj)分別是X,Y的邊際(邊緣)分布。第二節(jié)隨機(jī)變量及其分
31、布(三)連續(xù)型隨機(jī)向量的概率分布設(shè)(X,Y)是隨機(jī)向量,若存在一個非負(fù)可積函數(shù)f(x,y),使得(X,Y)的概率分布函數(shù)F(x,y)=P(Xx,Yy)可以表示為:F(x,y)=f(s,t)dtds-x,y 1,X1,X2,Xn相互獨(dú)立)且服從同一分布,該分布存在有限的期望和方差E(Xi)=,Var(Xi)=2, (i=1,2,)。令Yn=(Xk-n)/,則:P(Yn5,n(P-1)5,則可以把二項分布問題轉(zhuǎn)化為正態(tài)分布問題近似地去求解,根據(jù)(5.3)式和(5.4)式,有PN 即樣本成數(shù)P服從期望值為、方差為(1-)的正態(tài)分布。因此,可以用Z統(tǒng)計量來構(gòu)造總體成數(shù)的置信區(qū)間:Z=N(0,1)第三節(jié)
32、簡單隨機(jī)抽樣的區(qū)間估計三、兩個總體均值及兩個總體成數(shù)之差的置信區(qū)間(一)兩個總體均值之差的置信區(qū)間1.兩個總體的方差、已知情況下的估計2.兩個總體的方差、未知情況下的估計(二)兩個總體成數(shù)之差的置信區(qū)間可以證明,當(dāng)n1和n2都很大,而且總體成數(shù)不太接近0或1時,P1-P2的抽樣分布近似服從正態(tài)分布,且:=1-2從而1-2的置信度為(1-a)的置信區(qū)間為:(P1-P2)Z/2但由于1、2均未知,故上述區(qū)間中的1和2需要用P1和P2代替,此時,1和2的置信度為(1-a)的近似置信區(qū)間為:(P1-P2)Z/2第三節(jié)簡單隨機(jī)抽樣的區(qū)間估計四、樣本容量的確定(一)估計總體均值時樣本容量的確定在一定的置信
33、水平下,用樣本均值估計總體均值時所允許的最大絕對誤差,稱為允許誤差,用表示。必要樣本容量n與允許誤差、可靠性系數(shù)、總體標(biāo)準(zhǔn)差有以下關(guān)系:(1)總體方差越大,必要的樣本容量n越大。(2)必要的樣本容量n反比例于允許誤差2。(3)必要的樣本容量n與可靠性系數(shù)成正比。第三節(jié)簡單隨機(jī)抽樣的區(qū)間估計(二)估計總體成數(shù)時樣本容量的確定估計總體成數(shù)時,允許誤差為: =Z/2與估計總體均值時的唯一不同的是用(1-)代替2。由(5.42)式可得出估計總體成數(shù)時,確定必要樣本容量的公式。第四節(jié)復(fù)雜隨機(jī)抽樣的區(qū)間估計一、分層抽樣的估計分層抽樣也稱為類型抽樣,它是按一定標(biāo)志對總體各單位進(jìn)行分類,然后分別從每一類中按隨
34、機(jī)原則抽取一定的單位構(gòu)成樣本。分層抽樣的前提是對總體的結(jié)構(gòu)有一定的了解,為了充分利用這些信息、提高估計的精確度,應(yīng)對總體按確定標(biāo)準(zhǔn)進(jìn)行分類,保證抽出的樣本與總體盡可能保持相似的結(jié)構(gòu)。第四節(jié)復(fù)雜隨機(jī)抽樣的區(qū)間估計二、等距抽樣的估計等距抽樣又稱為機(jī)械抽樣或系統(tǒng)抽樣,它是將總體各單位按某標(biāo)志進(jìn)行排序,然后按固定的間隔來抽取樣本單位的抽樣組織形式。總體排序標(biāo)志是由總體的有關(guān)輔助信息確定,與調(diào)查標(biāo)志兩者間可以有關(guān)也可以無關(guān)。等距抽樣的間隔,應(yīng)避免與現(xiàn)象本身的節(jié)奏性或循環(huán)周期相重合。用等距抽樣方式抽取一個樣本后,就可以計算樣本平均數(shù)。因此,直接計算等距抽樣的平均誤差是有困難的,只能以間接方式計算其近似值。
35、第四節(jié)復(fù)雜隨機(jī)抽樣的區(qū)間估計三、整群抽樣的估計整群抽樣就是將總體各單位分成若干群,然后從其中隨機(jī)抽取部分群,對中選的群進(jìn)行全面調(diào)查的抽樣組織方式。在總體單位數(shù)很大時,如果直接從總體中抽取總體單位,有時是很困難的,比如從一個大城市中的所有大學(xué)生中抽取了解大學(xué)生的基本情況,這個城市的大學(xué)生人數(shù)有幾十萬之多,直接抽取樣本單位有許多困難,如抽樣框的編制等。第四節(jié)復(fù)雜隨機(jī)抽樣的區(qū)間估計四、多階段抽樣的估計所謂多階段抽樣,就是先從總體中抽出較大范圍的單位,再從選的大單位中抽較小范圍的單位,以此類推,最后從更小的范圍抽出樣本單位。這種抽樣方式在我國的農(nóng)產(chǎn)量調(diào)查、職工家計調(diào)查中常被采用,我們可以先從全國抽出各
36、個省,再從抽中的省中抽出縣、市,最后抽出樣本的基本單位。第六章 假設(shè)檢驗(yàn)?zāi)夸浖僭O(shè)檢驗(yàn)的基本原理1總體參數(shù)假設(shè)檢驗(yàn)2非參數(shù)檢驗(yàn)3第一節(jié)假設(shè)檢驗(yàn)的基本原理一、假設(shè)檢驗(yàn)的基本原理假設(shè)檢驗(yàn)所遵循的推斷依據(jù)是統(tǒng)計中的“小概率原理”:小概率事件在一次試驗(yàn)中幾乎是不會發(fā)生的。一般來說,取0.05(5%),對于一些比較嚴(yán)格的情況,如在一些高精密質(zhì)量檢驗(yàn)的假設(shè)檢驗(yàn)中,它可以取0.01或者更小。越小,所做出的拒絕原假設(shè)的判斷的說服力就越強(qiáng)。當(dāng)然,不管有多么小,也不能代表小概率事件沒有發(fā)生的可能,這也正是假設(shè)檢驗(yàn)與數(shù)學(xué)上“反證法”的不同之處。假設(shè)檢驗(yàn)按照所檢驗(yàn)內(nèi)容的不同,可以分為參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)。對已知總體分布
37、的某個未知參數(shù)進(jìn)行的檢驗(yàn),稱為參數(shù)檢驗(yàn);對總體的分布形式進(jìn)行的檢驗(yàn),則稱為非參數(shù)檢驗(yàn)。本章將分別對這兩類檢驗(yàn)進(jìn)行介紹。第一節(jié)假設(shè)檢驗(yàn)的基本原理二、假設(shè)檢驗(yàn)的規(guī)則與兩類錯誤(一)假設(shè)檢驗(yàn)的規(guī)則(1)根據(jù)實(shí)際應(yīng)用問題確定合適的原假設(shè)H0和備選假設(shè)H1;(2)確定檢驗(yàn)統(tǒng)計量,通過數(shù)理統(tǒng)計分析確定該統(tǒng)計量的抽樣分布;(3)給定檢驗(yàn)的顯著性水平,在原假設(shè)成立的條件下,結(jié)合備選假設(shè)的定義,由檢驗(yàn)統(tǒng)計量的抽樣分布情況求出相應(yīng)的臨界值,該臨界值為原假設(shè)的接受域與拒絕域的分界值;(4)從樣本資料計算檢驗(yàn)的樣本統(tǒng)計量,并將其與臨界值進(jìn)行比較,判斷是否接受或拒絕原假設(shè)。第一節(jié)假設(shè)檢驗(yàn)的基本原理(二)p值檢驗(yàn)p值檢驗(yàn)
38、的原理:建立原假設(shè)后,在假定原假設(shè)成立的情況下,參照備選假設(shè),可以計算出檢驗(yàn)統(tǒng)計量超過或者小于由樣本所計算出的檢驗(yàn)統(tǒng)計量的數(shù)值的概率,這便是p值;而后將此p值與事先給出的顯著性水平進(jìn)行比較,如果p值小于,也就是說,原假設(shè)對應(yīng)的為小概率事件,根據(jù)上述的“小概率原理”,我們就可以否定原假設(shè),而接受對應(yīng)的備選假設(shè)。如果p值大于,我們就不能否定原假設(shè)。(三)兩類錯誤實(shí)際上依據(jù)真實(shí)總體情況,我們應(yīng)該接受原假設(shè)H0,但根據(jù)樣本信息,卻做出拒絕H0的錯誤結(jié)論,這是“棄真”錯誤;此外,我們也可能犯這樣的錯誤:實(shí)際的總體情況是應(yīng)該拒絕原假設(shè),而我們卻接受了它,這便是“納偽”錯誤。第一節(jié)假設(shè)檢驗(yàn)的基本原理三、檢驗(yàn)
39、功效由于為犯“納偽”錯誤的可能性大小,或者說表示出現(xiàn)接受不真實(shí)的原假設(shè)的結(jié)論的概率,那么1-就是指出現(xiàn)拒絕不真實(shí)的原假設(shè)的概率。若1-的數(shù)值越接近于1,表明不真實(shí)的原假設(shè)幾乎都能夠被拒絕。誠然,如果1-的數(shù)值接近于0,表明犯“納偽”錯誤的可能性很大。因此,1-可以用來表明所做假設(shè)檢驗(yàn)工作好壞的一個指標(biāo),我們稱為檢驗(yàn)功效。它的數(shù)值表明我們做出正確決策的概率為1-。一個好的檢驗(yàn)法則總是希望犯兩類錯誤的可能性與都很小,但是這在一般場合下是很難實(shí)現(xiàn)的。要使得小,必然導(dǎo)致大;若要使小,必導(dǎo)致增大。第二節(jié)總體參數(shù)假設(shè)檢驗(yàn)一、總體均值的假設(shè)檢驗(yàn)(一)總體方差2已知對于雙側(cè)檢驗(yàn),建立的假設(shè)為:H0=0,H10
40、其中,0為一個給定已知的常數(shù)。對于左(右)單側(cè)檢驗(yàn)來說,建立的假設(shè)為:H0=0,H1)0根據(jù)樣本資料及假設(shè),計算出樣本統(tǒng)計量的值z。這樣,我們便可以得出原假設(shè)的拒絕域?yàn)? |z|(對雙側(cè)檢驗(yàn)而言)zz1-(對于右單側(cè)檢驗(yàn)而言)當(dāng)z值處于拒絕域中時,我們就可拒絕原假設(shè),否則不能拒絕原假設(shè)。第二節(jié)總體參數(shù)假設(shè)檢驗(yàn)(二)總體方差2未知對于雙側(cè)檢驗(yàn),建立的假設(shè)為:H0=0,H10對于左(右)單側(cè)檢驗(yàn)來說,建立的假設(shè)為:H0=0,H1)0只是在構(gòu)造檢驗(yàn)統(tǒng)計量時,不是利用z檢驗(yàn)法。而是在原假設(shè)成立的條件下,利用t檢驗(yàn)法,構(gòu)造檢驗(yàn)統(tǒng)計量:t=t(n-1)根據(jù)樣本資料及假設(shè),計算出樣本統(tǒng)計量的值t。這樣,可以
41、得出對原假設(shè)的拒絕域?yàn)?|t|(n-1)(雙側(cè)檢驗(yàn))tt1-(n-1)(右單側(cè)檢驗(yàn))當(dāng)t值落入拒絕域時,就拒絕原假設(shè),否則不能拒絕原假設(shè)。第二節(jié)總體參數(shù)假設(shè)檢驗(yàn)二、兩個總體均值之差的檢驗(yàn)(一)兩總體方差、已知(1)雙側(cè)檢驗(yàn)。(2)左單側(cè)檢驗(yàn)。(3)右單側(cè)檢驗(yàn)。(二)兩總體方差、未知但相等對于雙、單側(cè)檢驗(yàn),原假設(shè)都是相同的,均為H0 x=y。只是在雙側(cè)檢驗(yàn)時,備選假設(shè)H1xy;在左單側(cè)檢驗(yàn)時,備選假設(shè)為H1xy。在原假設(shè)成立的情況下,根據(jù)上面的公式,可以構(gòu)造如下的檢驗(yàn)統(tǒng)計量:t=t(n1+n2-2)可以根據(jù)樣本資料的數(shù)據(jù),計算樣本檢驗(yàn)統(tǒng)計量的數(shù)值。第二節(jié)總體參數(shù)假設(shè)檢驗(yàn)三、總體成數(shù)的假設(shè)檢驗(yàn)(一
42、)單樣本成數(shù)檢驗(yàn)建立假設(shè):H0=0,H10構(gòu)建檢驗(yàn)統(tǒng)計量,服從標(biāo)準(zhǔn)正態(tài)分布,即zN(0,1)。其中,P代表樣本的成數(shù),代表總體的成數(shù)。對于顯著性水平,可以通過查標(biāo)準(zhǔn)正態(tài)分布表得到臨界值。第二節(jié)總體參數(shù)假設(shè)檢驗(yàn)四、正態(tài)總體方差的假設(shè)檢驗(yàn)方差是反映現(xiàn)象在數(shù)量上變異程度的指標(biāo),反映變化的均衡程度。對于正態(tài)總體方差的檢驗(yàn)主要有兩種:一是檢驗(yàn)總體方差是否顯著等于某一給定的確定值,二是檢驗(yàn)總體方差是否顯著性地在某個給定的范圍內(nèi)。五、兩個正態(tài)總體方差比的檢驗(yàn)(一)兩總體均值x、y已知(二)兩總體均值x、y未知第三節(jié)非參數(shù)檢驗(yàn)一、非參數(shù)檢驗(yàn)概述前面介紹的各種假設(shè)檢驗(yàn)都是在總體分布形式已知或者假定總體分布的前提
43、下做出判斷。但在實(shí)際問題中,可能無法獲知或者不一定了解總體的分布類型,而只能通過樣本來檢驗(yàn)關(guān)于總體分布的假設(shè)。這種檢驗(yàn)方法稱為非參數(shù)檢驗(yàn)。第三節(jié)非參數(shù)檢驗(yàn)二、2檢驗(yàn)(一)分布擬合檢驗(yàn)該檢驗(yàn)的假設(shè)為: H0F(x)=F0(x),H1F(x)F0(x)其中,F(x)為總體的分布函數(shù),F0(x)是某個事先假定的總體分布函數(shù)。2檢驗(yàn)的步驟為:(1)建立假設(shè)。(2)將樣本資料數(shù)據(jù)值按區(qū)間進(jìn)行適當(dāng)?shù)膭澐帧?3)計算在各個樣本區(qū)間內(nèi)的實(shí)際頻數(shù)fi(1im)。(4)調(diào)整區(qū)間。(5)構(gòu)造并計算統(tǒng)計量。(6)計算臨界值。(7)進(jìn)行判斷。第三節(jié)非參數(shù)檢驗(yàn)(二)獨(dú)立性檢驗(yàn)顧名思義,該檢驗(yàn)主要是考察多個變量之間是否有關(guān)
44、聯(lián),如果變量之間沒有關(guān)聯(lián)性,那么就說變量之間是相互獨(dú)立的。這里的變量主要是指定類、定序資料。為了分析變量之間的關(guān)聯(lián)性,需要將資料整理成列聯(lián)表的形式。列聯(lián)表是多行多列縱橫交錯所形成的一個表體。我們以例子說明列聯(lián)表的形式以及如何將獨(dú)立性檢驗(yàn)化為列聯(lián)表并進(jìn)行檢驗(yàn)分析的程序。第三節(jié)非參數(shù)檢驗(yàn)三、符號檢驗(yàn)(一)單樣本的符號檢驗(yàn)(二)配對樣本的符號檢驗(yàn)(三)非配對樣本的符號檢驗(yàn)第三節(jié)非參數(shù)檢驗(yàn)四、秩和檢驗(yàn)秩和檢驗(yàn)是一種用樣本秩代替樣本值的檢驗(yàn)方法,用該法可以檢驗(yàn)兩個總體的分布函數(shù)是否相等的問題。所謂秩,就是樣本觀測值在序列中的排序號。具體的檢驗(yàn)步驟為:(1)建立假設(shè)。H0F1(X)=F2(X),H1F1(
45、X)F2(X)(2)從這兩個總體X、Y中分別抽取樣本容量為n1、n2的兩個樣本,n1+n2=n。(3)計算取自總體X的樣本的秩和T,即將該樣本的所有樣本單位的秩加總。第三節(jié)非參數(shù)檢驗(yàn)五、游程檢驗(yàn)游程檢驗(yàn)用來檢驗(yàn)樣本是否隨機(jī)地取自于總體。樣本所具有的某個特征的分布越無序,越無規(guī)律性,就越能說明樣本的隨機(jī)性。所謂游程,是指依時間或其他順序排列的有序數(shù)列中,具有相同的事件或符號的連續(xù)部分。對應(yīng)地,同類游程出現(xiàn)的次數(shù)則稱為該類的游程數(shù),通俗地講,就是連成一片的事件或字符的片數(shù)。不同類游程數(shù)的總和,稱為總游程數(shù),記為R。第三節(jié)非參數(shù)檢驗(yàn)六、等級相關(guān)對于樣本值,使用的是定距或定比的測量尺度,然而在實(shí)際應(yīng)用
46、中,我們可能會碰到要分析的是定序尺度描述的數(shù)據(jù)類型的情況。對于該類型數(shù)據(jù)的兩個配對序列之間的相關(guān)關(guān)系,可以應(yīng)用斯皮爾曼提出的公式來計量。此關(guān)系系數(shù)稱為斯皮爾曼秩相關(guān)系數(shù)(rs)。第七章 方差分析目錄方差分析方法引導(dǎo)1單因素方差分析2雙因素方差分析3第一節(jié)方差分析方法引導(dǎo)一、方差分析問題的提出方差分析(analysis of variance,ANOVA),就是利用試驗(yàn)觀測值總偏差的可分解性,將不同條件所引起的偏差與試驗(yàn)誤差分解開來,按照一定的規(guī)則進(jìn)行比較,以確定條件偏差的影響程度以及相對大小。當(dāng)已經(jīng)確認(rèn)某幾種因素對試驗(yàn)結(jié)果有顯著影響時,可使用方差分析檢驗(yàn)確定哪種因素對試驗(yàn)結(jié)果的影響最為顯著并估
47、計影響程度。第一節(jié)方差分析方法引導(dǎo)二、方差分析的基本原理(一)方差分解原理一般來說,試驗(yàn)結(jié)果的差異性可由離差平方和表示,離差平方和又可分解為組間方差與組內(nèi)方差。其中,組間方差為因素對試驗(yàn)結(jié)果的影響的加總;組內(nèi)方差則是各組內(nèi)的隨機(jī)影響的加總。如果組間方差明顯高于組內(nèi)方差,說明樣本數(shù)據(jù)波動的主要來源是組間方差,因素是引起波動的主要原因,則認(rèn)為因素對試驗(yàn)的結(jié)果存在顯著的影響;否則認(rèn)為波動主要來自組內(nèi)方差,即因素對試驗(yàn)結(jié)果的影響不顯著。第一節(jié)方差分析方法引導(dǎo)(二)檢驗(yàn)統(tǒng)計量為了消除自由度對方差大小的影響,我們用方差除去自由度后的結(jié)果來比較兩者相對大小。F統(tǒng)計量的值越大,就越能說明組間方差是離差平方和的
48、主要來源,因素影響顯著;F統(tǒng)計量的值越小,就越能說明組內(nèi)方差是離差平方和的主要來源,因素影響不顯著。第二節(jié)單因素方差分析一、單因素條件下的平方和分解公式在試驗(yàn)中只考慮一個因素對試驗(yàn)結(jié)果影響顯著性的方差分析稱為單因素方差分析。為了檢驗(yàn)該因素在不同水平下的均值是否有顯著差異,我們可在該因素的不同水平下進(jìn)行一組重復(fù)試驗(yàn)(或抽樣);并將不同水平下的試驗(yàn)結(jié)果作為來自不同總體的樣本,即得到了多個組別的重復(fù)試驗(yàn)結(jié)果。第二節(jié)單因素方差分析二、因素作用顯著性的檢驗(yàn)若記各水平下的總體均值為1,2,r,則檢驗(yàn)因素對試驗(yàn)結(jié)果影響的顯著性就是檢驗(yàn)假設(shè): H01=2=r H11,2,r不全相等或簡單寫成:H0A對試驗(yàn)結(jié)果
49、影響不顯著H1A對試驗(yàn)結(jié)果有顯著影響由前所述,只要建立關(guān)于SA與SE的F統(tǒng)計量就可以進(jìn)行假設(shè)檢驗(yàn)。在此之前,先要推算出對應(yīng)的自由度。F=Fr-1,r(n-1)F值越大,越說明組間方差大于組內(nèi)方差,因此組間方差構(gòu)成了離差平方和的主要來源,即因素的不同水平對試驗(yàn)結(jié)果影響較大,應(yīng)拒絕原假設(shè);反之,說明組內(nèi)方差是主要來源,不能拒絕原假設(shè)。第二節(jié)單因素方差分析三、應(yīng)注意的問題(1)方差分析需滿足的假設(shè)條件。(2)在實(shí)際問題中,各水平下的總體的試驗(yàn)次數(shù)可以相等也可以不等,分析過程和結(jié)論基本不變。但是當(dāng)試驗(yàn)次數(shù)相差較大或因素較多時應(yīng)該考慮采用廣義線性模型分析,以消除非均衡試驗(yàn)設(shè)計的影響。(3)方差分析只能判
50、斷各總體的均值是否相等,而不能判斷出哪個總體的均值是大還是小,這時需要在均值不等的前提下,采用多重比較法進(jìn)一步比較各個均值的大小。第三節(jié)雙因素方差分析一、無交互作用的雙因素方差分析A與B是待確認(rèn)是否對試驗(yàn)結(jié)果有顯著影響的兩個因素,假定A,B之間無交互作用,在兩個因素的各種水平組合下進(jìn)行重復(fù)試驗(yàn)可得表7-8。檢驗(yàn)因素A與B對試驗(yàn)結(jié)果的影響是否顯著的F統(tǒng)計量。二、有交互作用的雙因素方差分析當(dāng)因素之間存在交互作用時,為了區(qū)分隨機(jī)誤差和交互作用,需要在不同的水平組合下進(jìn)行重復(fù)試驗(yàn)。第八章 相關(guān)與回歸分析目錄相關(guān)與回歸分析的基本概念1簡單線性相關(guān)分析2一元線性回歸分析3多元線性相關(guān)與回歸分析4非線性相關(guān)
51、與回歸分析5第一節(jié)相關(guān)與回歸分析的基本概念一、函數(shù)關(guān)系與相關(guān)關(guān)系客觀現(xiàn)象總是普遍聯(lián)系和相互依存的??陀^現(xiàn)象之間的數(shù)量聯(lián)系存在著兩種不同的類型:一種是函數(shù)關(guān)系,另一種是相關(guān)關(guān)系。當(dāng)一個或幾個變量取一定的值時,另一個變量有確定值與之相對應(yīng),我們稱這種關(guān)系為確定性的函數(shù)關(guān)系。當(dāng)一個或幾個相互聯(lián)系的變量取一定數(shù)值時,與之相對應(yīng)的另一變量的值雖然不確定,但它仍按某種規(guī)律在一定的范圍內(nèi)變化。 變量之間的函數(shù)關(guān)系和相關(guān)關(guān)系在一定條件下是可以互相轉(zhuǎn)化的。第一節(jié)相關(guān)與回歸分析的基本概念二、相關(guān)關(guān)系的種類客觀現(xiàn)象的相關(guān)關(guān)系可以按不同的標(biāo)志加以區(qū)分。(一)完全相關(guān)、不完全相關(guān)和不相關(guān)(二)正相關(guān)和負(fù)相關(guān)(三)線性相
52、關(guān)和非線性相關(guān)(四)單相關(guān)、復(fù)相關(guān)和偏相關(guān)第一節(jié)相關(guān)與回歸分析的基本概念三、相關(guān)分析與回歸分析相關(guān)分析和回歸分析是研究現(xiàn)象之間相關(guān)關(guān)系的兩種基本方法。所謂相關(guān)分析,就是用一個指標(biāo)來表明現(xiàn)象間相互依存關(guān)系的密切程度。所謂回歸分析,就是根據(jù)相關(guān)關(guān)系的具體形態(tài),選擇一個合適的數(shù)學(xué)模型,來近似地表達(dá)變量間的平均變化關(guān)系。相關(guān)分析和回歸分析有著密切的聯(lián)系,它們不僅具有共同的研究對象,而且在具體應(yīng)用時,常常必須互相補(bǔ)充。但是,應(yīng)當(dāng)指出,相關(guān)分析與回歸分析之間在研究目的和方法上是有明顯區(qū)別的。相關(guān)分析研究變量之間相關(guān)的方向和相關(guān)的程度,但是相關(guān)分析無法從一個變量的變化來推測另一個變量的變化情況。第一節(jié)相關(guān)與
53、回歸分析的基本概念四、相關(guān)圖相關(guān)圖又稱散點(diǎn)圖。它是以直角坐標(biāo)系的橫軸代表變量X,縱軸代表變量Y,將兩個變量間相對應(yīng)的變量值用坐標(biāo)點(diǎn)的形式描繪出來,用來反映兩變量之間相關(guān)關(guān)系的圖形。相關(guān)圖是研究相關(guān)關(guān)系的直觀工具,一般在進(jìn)行詳細(xì)的定量分析之前,可以先利用它對現(xiàn)象之間存在的相關(guān)關(guān)系的方向、形式和密切程度作大致判斷。第二節(jié)簡單線性相關(guān)分析一、相關(guān)系數(shù)及其檢驗(yàn) (一)相關(guān)系數(shù)的定義單相關(guān)分析是對兩個變量之間的線性相關(guān)程度進(jìn)行分析。單相關(guān)分析所采用的尺度為單相關(guān)系數(shù),簡稱相關(guān)系數(shù)??傮w相關(guān)系數(shù)是反映兩變量之間線性相關(guān)程度的一種特征值,表現(xiàn)為一個常數(shù)。由于實(shí)際上不可能對總體變量X和Y的全部數(shù)值都進(jìn)行觀測,
54、所以總體相關(guān)系數(shù)一般是不知道的。通常需要從總體中隨機(jī)抽取一定數(shù)量的樣本,通過X和Y的樣本觀測值去估計樣本相關(guān)系數(shù)。樣本相關(guān)系數(shù)是根據(jù)樣本觀測值計算的,抽取的樣本不同,其具體的數(shù)值也會有所差異。容易證明,樣本相關(guān)系數(shù)是總體相關(guān)系數(shù)的一致估計量。第二節(jié)簡單線性相關(guān)分析(二)相關(guān)系數(shù)的特點(diǎn) (1)r的取值介于-1與1之間。(2)當(dāng)r=0時,X與Y的樣本觀測值之間沒有線性關(guān)系。(3)在大多數(shù)情況下,0|r|0時,X與Y為正相關(guān);當(dāng)r0,或s30),H0s =0成立的前提下,rs近似服從正態(tài)分布N(0,1/(n-1)。因此,可以利用下面的檢驗(yàn)統(tǒng)計量:Z=N(0,1)(8.6)第三節(jié)一元線性回歸分析一、標(biāo)
55、準(zhǔn)的一元線性回歸模型(一)總體回歸函數(shù)當(dāng)變量之間存在顯著的相關(guān)關(guān)系時,可以利用一定的數(shù)學(xué)模型對其進(jìn)行回歸分析。在回歸分析中,最簡單的模型是只有一個因變量和一個自變量的線性回歸模型,即一元線性回歸模型,又稱簡單線性回歸模型。該模型假定因變量Y主要受自變量X的影響,它們之間存在著近似的線性函數(shù)關(guān)系,即有: Yt=1+2Xt+ut上式被稱為總體回歸函數(shù)。式中的1和2是未知的參數(shù),又叫回歸系數(shù)。Yt和Xt分別是Y和X的第t個觀測值。ut是隨機(jī)誤差項,又稱隨機(jī)干擾項,是一個特殊的隨機(jī)變量,反映未列入方程式的其他各種因素對Y的影響。第三節(jié)一元線性回歸分析(二)樣本回歸函數(shù)根據(jù)樣本數(shù)據(jù)擬合的直線,稱為樣本回
56、歸線。顯然,樣本回歸線的函數(shù)形式應(yīng)與總體回歸線的函數(shù)形式一致。樣本回歸函數(shù)與總體回歸函數(shù)之間的聯(lián)系顯而易見,這里需要特別指出的是它們之間的區(qū)別:(1)總體回歸線是未知的,它只有一條。而樣本回歸線則是根據(jù)樣本數(shù)據(jù)擬合的,每抽取一組樣本,便可以擬合一條樣本回歸線。(2)總體回歸函數(shù)中的1和2是未知的參數(shù),表現(xiàn)為常數(shù)。而樣本回歸函數(shù)中的和是隨機(jī)變量,其具體數(shù)值隨所抽取的樣本觀測值不同而變動。(3)總體回歸函數(shù)中的ut是Yt與未知的總體回歸線之間的縱向距離,它是不可直接觀測的。而樣本回歸函數(shù)中的et是Yt與樣本回歸線之間的縱向距離,當(dāng)根據(jù)樣本觀測值擬合出樣本回歸線之后,可以計算出et的具體數(shù)值。第三節(jié)
57、一元線性回歸分析(三)誤差項的標(biāo)準(zhǔn)假定滿足以上標(biāo)準(zhǔn)假定的一元線性模型稱為標(biāo)準(zhǔn)的一元線性回歸模型。應(yīng)當(dāng)指出,在現(xiàn)實(shí)生活中,由于各種原因,上述標(biāo)準(zhǔn)假定常常不能得到滿足。那么學(xué)習(xí)以標(biāo)準(zhǔn)假定為基礎(chǔ)的回歸分析理論與方法是否會失去意義呢?當(dāng)然不會。第三節(jié)一元線性回歸分析二、一元線性回歸模型的估計(一)回歸系數(shù)的點(diǎn)估計(二)總體方差的估計(三)最小二乘估計量的性質(zhì)(四)回歸系數(shù)的區(qū)間估計第三節(jié)一元線性回歸分析三、一元線性回歸模型的檢驗(yàn)(一) 回歸模型檢驗(yàn)的種類(二)擬合程度的評價(三)顯著性檢驗(yàn)第三節(jié)一元線性回歸分析四、一元線性回歸模型預(yù)測(一)回歸預(yù)測的基本公式(二)預(yù)測誤差(三)區(qū)間預(yù)測第四節(jié)多元線性相
58、關(guān)與回歸分析一、標(biāo)準(zhǔn)的多元線性回歸模型多元線性回歸模型總體回歸函數(shù)的一般形式如下:Yt=1+2X2t+kXkt+ut(8.52)上式假定因變量Y與(k-1)個自變量之間的回歸關(guān)系可以用線性函數(shù)來近似反映。式中,Yt是變量Y的第t個觀測值;Xjt是第j個自變量Xj的第t個觀測值(j=2,k);ut是隨機(jī)誤差項;1,2,k是總體回歸系數(shù)。j表示在其他自變量保持不變的情況下,自變量Xj變動一個單位所引起的因變量Y平均變動的數(shù)額,因而又叫做偏回歸系數(shù)。該式中,總體回歸系數(shù)是未知的,必須利用有關(guān)的樣本觀測值來進(jìn)行估計。第四節(jié)多元線性相關(guān)與回歸分析二、多元線性回歸模型的估計(一)回歸系數(shù)的估計(二)總體方
59、差的估計(三)最小二乘估計量的性質(zhì)第四節(jié)多元線性相關(guān)與回歸分析三、多元線性回歸模型的檢驗(yàn)(一)擬合程度的評價(二)顯著性檢驗(yàn)1.回歸系數(shù)的顯著性檢驗(yàn)2.回歸方程的顯著性檢驗(yàn)第四節(jié)多元線性相關(guān)與回歸分析四、多元線性回歸預(yù)測在通過各種檢驗(yàn)的基礎(chǔ)上,多元線性回歸模型可以用于預(yù)測。多元線性回歸預(yù)測與一元線性回歸預(yù)測的原理是一致的。五、復(fù)相關(guān)系數(shù)和偏相關(guān)系數(shù)(一)復(fù)相關(guān)系數(shù)(二)偏相關(guān)系數(shù)第五節(jié)非線性相關(guān)與回歸分析一、非線性函數(shù)形式的確定(一)拋物線函數(shù)(二)雙曲線函數(shù)(三)冪函數(shù)(四)指數(shù)函數(shù)(五)對數(shù)函數(shù)(六)S形曲線函數(shù)(七)多項式方程第五節(jié)非線性相關(guān)與回歸分析二、非線性回歸模型估計(一)倒數(shù)變換
60、(二)半對數(shù)變換(三)雙對數(shù)變換(四)多項式變換第五節(jié)非線性相關(guān)與回歸分析三、相關(guān)指數(shù)變量之間存在的非線性相關(guān)的強(qiáng)弱,難以用單相關(guān)系數(shù)去判斷。在這種場合,可以利用相關(guān)指數(shù)作為判斷變量之間是否顯著存在某種類型的非線性相關(guān)關(guān)系的尺度。所謂相關(guān)指數(shù),也就是對非線性回歸模型進(jìn)行擬合時所得到的決定系數(shù)。第九章 時間序列分析目錄時間序列分析概述1時間序列的分析指標(biāo)2長期趨勢的測定3季節(jié)變動和循環(huán)波動測定4時間序列預(yù)測方法5第一節(jié)時間序列分析概述一、時間序列的概念社會經(jīng)濟(jì)現(xiàn)象總是隨著時間的推移而變化,將統(tǒng)計指標(biāo)的數(shù)值按時間先后順序排列起來就形成了時間序列。任何一個時間序列,均由兩個基本要素構(gòu)成:一個是現(xiàn)象所
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度生物科技研發(fā)臨時工合作協(xié)議4篇
- 二零二五年度鋼結(jié)構(gòu)廠房買賣及建筑廢棄物處理合同3篇
- 二零二五白酒產(chǎn)業(yè)供應(yīng)鏈金融服務(wù)合作協(xié)議3篇
- 2025年校醫(yī)聘用協(xié)議書范本(含醫(yī)療設(shè)備使用規(guī)范)3篇
- 2025年私人二手車買賣合同樣本(含車輛使用規(guī)范)3篇
- 二零二五版城鄉(xiāng)規(guī)劃與教育規(guī)劃服務(wù)合同3篇
- 二零二五版臨時用電設(shè)備檢修與安全維護(hù)服務(wù)合同4篇
- 二零二五年度高級行政人員績效獎金發(fā)放協(xié)議3篇
- 2025年物業(yè)投訴處理承包服務(wù)協(xié)議3篇
- 社區(qū)物業(yè)服務(wù)制度匯編
- 供銷合同(完整版)
- 二零二五年企業(yè)存單質(zhì)押擔(dān)保貸款合同樣本3篇
- 鍋爐安裝、改造、維修質(zhì)量保證手冊
- 油氣行業(yè)人才需求預(yù)測-洞察分析
- (2024)河南省公務(wù)員考試《行測》真題及答案解析
- 1000只肉羊養(yǎng)殖基地建設(shè)項目可行性研究報告
- 《勞保用品安全培訓(xùn)》課件
- 2024版房屋市政工程生產(chǎn)安全重大事故隱患判定標(biāo)準(zhǔn)內(nèi)容解讀
- 2024院感年終總結(jié)報告
- 高一化學(xué)《活潑的金屬單質(zhì)-鈉》分層練習(xí)含答案解析
- 04S206自動噴水與水噴霧滅火設(shè)施安裝圖集
評論
0/150
提交評論