公共管理研究方法 課件 第5、6章 量化資料收集與整理、基本量化分析方法_第1頁(yè)
公共管理研究方法 課件 第5、6章 量化資料收集與整理、基本量化分析方法_第2頁(yè)
公共管理研究方法 課件 第5、6章 量化資料收集與整理、基本量化分析方法_第3頁(yè)
公共管理研究方法 課件 第5、6章 量化資料收集與整理、基本量化分析方法_第4頁(yè)
公共管理研究方法 課件 第5、6章 量化資料收集與整理、基本量化分析方法_第5頁(yè)
已閱讀5頁(yè),還剩74頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第5章量化資料收集與整理

Part15.1實(shí)驗(yàn)法

5.1實(shí)驗(yàn)法實(shí)驗(yàn)法適用于范圍有限、界定明確的概念與假設(shè)。這種方法更適合于解釋?zhuān)敲枋?。根?jù)對(duì)實(shí)驗(yàn)環(huán)境、變量的控制及實(shí)驗(yàn)設(shè)計(jì)的嚴(yán)格程度,實(shí)驗(yàn)可以分為標(biāo)準(zhǔn)實(shí)驗(yàn)和準(zhǔn)實(shí)驗(yàn)(Quasi-Experiment)。根據(jù)實(shí)驗(yàn)場(chǎng)所不同,實(shí)驗(yàn)法可以分為實(shí)驗(yàn)室實(shí)驗(yàn)(LaboratoryExperiment)和實(shí)地實(shí)驗(yàn)(FieldExperiment)。5.1.1實(shí)驗(yàn)法基本原理實(shí)驗(yàn)法的基本要素(1)自變量與因變量:不是由其他因素形成,有共變關(guān)系、有明確的時(shí)間順序的關(guān)系為因果關(guān)系。(2)前測(cè)和后測(cè):在X作用前先對(duì)Y進(jìn)行第一次測(cè)量(即前測(cè)),在X作用后再對(duì)Y進(jìn)行第二次測(cè)量(即后測(cè))。(3)實(shí)驗(yàn)組和控制組:實(shí)驗(yàn)組是在實(shí)驗(yàn)過(guò)程中接受實(shí)驗(yàn)刺激的那一組對(duì)象,控制組在各方面都與實(shí)驗(yàn)組相同,但是其成員并不是實(shí)驗(yàn)對(duì)象。5.1.1實(shí)驗(yàn)法基本原理實(shí)驗(yàn)法的特點(diǎn)與程序(1)實(shí)驗(yàn)法是在非自然狀態(tài)下觀(guān)察研究對(duì)象;(2)實(shí)驗(yàn)研究必須在兩變量之間建立起因果假設(shè);(3)實(shí)驗(yàn)研究旨在探索兩現(xiàn)象之間是否存在因果聯(lián)系,但是并不是兩現(xiàn)象之間只要存在因果聯(lián)系,就能用實(shí)驗(yàn)法加以研究;(4)實(shí)驗(yàn)研究可以把某一特定因素從復(fù)雜關(guān)系中分離出來(lái),以便于分析這一特定因素的效果;(5)社會(huì)研究中的實(shí)驗(yàn)法,基本在實(shí)際生活情境中進(jìn)行的,多為實(shí)地實(shí)驗(yàn)。5.1.1實(shí)驗(yàn)法基本原理實(shí)驗(yàn)法的特點(diǎn)與程序(1)建立因果假設(shè);(2)按可比性建立實(shí)驗(yàn)組與控制組;(3)確定自變量與因變量;(4)對(duì)因變量制定一個(gè)合適的測(cè)量;(5)就因變量對(duì)實(shí)驗(yàn)組與控制組進(jìn)行前測(cè);(6)對(duì)實(shí)驗(yàn)組實(shí)施實(shí)驗(yàn)刺激(即讓自變量出現(xiàn)并發(fā)揮作用);(7)就因變量對(duì)實(shí)驗(yàn)組與控制組進(jìn)行后測(cè);(8)運(yùn)用統(tǒng)計(jì)分析檢定假設(shè),說(shuō)明自變量與因變量之間是否存在因果聯(lián)系。5.1.1實(shí)驗(yàn)法基本原理實(shí)驗(yàn)組與控制組的產(chǎn)生(1)隨機(jī)指派法:完全按照隨機(jī)抽樣的原理和方法將實(shí)驗(yàn)對(duì)象分配到實(shí)驗(yàn)組和控制組,(2)匹配法:找出兩個(gè)各種條件完全相同的或幾乎完全相同的實(shí)驗(yàn)對(duì)象進(jìn)行配對(duì),然后將一組分到實(shí)驗(yàn)組,另一組分到控制組。5.1.2常用的實(shí)驗(yàn)設(shè)計(jì)單組前后測(cè)實(shí)驗(yàn)設(shè)計(jì)只有實(shí)驗(yàn)組而沒(méi)有控制組的一種簡(jiǎn)單實(shí)驗(yàn)方法,它直接出于因果聯(lián)系的基本分析邏輯。自變量的影響=實(shí)驗(yàn)組后測(cè)-實(shí)驗(yàn)組前測(cè)

前測(cè)自變量后測(cè)實(shí)驗(yàn)組y1xy25.1.2常用的實(shí)驗(yàn)設(shè)計(jì)經(jīng)典實(shí)驗(yàn)設(shè)計(jì)只有實(shí)驗(yàn)組而沒(méi)有控制組的一種簡(jiǎn)單實(shí)驗(yàn)方法,它直接出于因果聯(lián)系的基本分析邏輯。自變量的影響=(實(shí)驗(yàn)組后測(cè)-實(shí)驗(yàn)組前測(cè))-(控制組后測(cè)-控制組前測(cè))

前測(cè)自變量后測(cè)實(shí)驗(yàn)組y1xy2控制組y3

y45.1.2常用的實(shí)驗(yàn)設(shè)計(jì)所羅門(mén)三組實(shí)驗(yàn)設(shè)計(jì)在經(jīng)典實(shí)驗(yàn)設(shè)計(jì)的基礎(chǔ)上再增加一個(gè)控制組后形成的。旨在消除前測(cè)和實(shí)驗(yàn)刺激相互作用所形成的影響。自變量的影響=控制組2后測(cè)-控制組2前測(cè);前測(cè)的影響=控制組1后測(cè)-控制組1前測(cè);前測(cè)與自變量相互作用的影響=(實(shí)驗(yàn)組后測(cè)-實(shí)驗(yàn)組前測(cè))-(自變量影響+前測(cè)影響)。

前測(cè)自變量后測(cè)實(shí)驗(yàn)組y1xy2控制組1y3

y4控制組2

xy55.1.2常用的實(shí)驗(yàn)設(shè)計(jì)所羅門(mén)四組實(shí)驗(yàn)設(shè)計(jì)在所羅門(mén)三組實(shí)驗(yàn)設(shè)計(jì)的基礎(chǔ)上,再增加一個(gè)控制組3,它既無(wú)前測(cè)也不引入自變量,而只有后測(cè)。

前測(cè)自變量后測(cè)實(shí)驗(yàn)組y1xy2控制組1y3

y4控制組2

xy5控制組3

y65.1.2常用的實(shí)驗(yàn)設(shè)計(jì)所羅門(mén)四組實(shí)驗(yàn)設(shè)計(jì)外部因素影響=控制組3后測(cè)-控制組3前測(cè);自變量的實(shí)際影響=(控制組2后測(cè)-控制組2前測(cè))-外部影響;前測(cè)的實(shí)際影響=(控制組1后測(cè)-控制組1前測(cè))--外部影響;前測(cè)與自變量相互作用的影響=(實(shí)驗(yàn)組后測(cè)-實(shí)驗(yàn)組前測(cè))-(自變量影響+前測(cè)影響+外部因素的影響)。5.1.3實(shí)驗(yàn)法的信度和效度

信度實(shí)驗(yàn)法的信度較高,對(duì)信度的檢驗(yàn)一般是通過(guò)重復(fù)實(shí)驗(yàn)的方法。

效度實(shí)驗(yàn)的外在效度表示實(shí)驗(yàn)結(jié)果是否適合于推廣應(yīng)用。影響外在效度的主要因素有:實(shí)驗(yàn)情境過(guò)分“人工化”而沒(méi)有很好顧及真實(shí)社會(huì)情境;實(shí)驗(yàn)對(duì)象過(guò)分“純化”而缺乏代表性。影響內(nèi)在效度的因素主要是:社會(huì)現(xiàn)象和社會(huì)行為的因果關(guān)系很復(fù)雜,影響因素很多,對(duì)這些變量很難實(shí)施控制。提高內(nèi)在效度則有可能降低外在效度,反之亦然。

Part25.2問(wèn)卷調(diào)查法

5.2問(wèn)卷調(diào)查法問(wèn)卷調(diào)查適用于描述性、解釋性和探索性的研究,通常以個(gè)體為研究單位。當(dāng)研究總體數(shù)量過(guò)于龐大而無(wú)法直接觀(guān)察時(shí),問(wèn)卷調(diào)查就是最好的方法。5.2.1問(wèn)卷的類(lèi)型和結(jié)構(gòu)問(wèn)卷的主要類(lèi)型(1)自填式問(wèn)卷:如郵寄問(wèn)卷、送發(fā)問(wèn)卷和集體填答,這類(lèi)問(wèn)卷是由被調(diào)查者本人親自填寫(xiě)問(wèn)卷。(2)代填式問(wèn)卷:這類(lèi)問(wèn)卷是由調(diào)查者根據(jù)被調(diào)查者的回答代為填寫(xiě)的問(wèn)卷,主要有訪(fǎng)問(wèn)問(wèn)卷和電話(huà)問(wèn)卷兩種。問(wèn)卷的基本結(jié)構(gòu)題目、封面信、指導(dǎo)語(yǔ)、問(wèn)題和答案、結(jié)束語(yǔ)及其它。5.2.2問(wèn)卷設(shè)計(jì)的方法和步驟明確與問(wèn)卷設(shè)計(jì)緊密相關(guān)的各種因素調(diào)查目的、調(diào)查內(nèi)容、樣本的性質(zhì)及樣本的構(gòu)成情況、資料的處理。

問(wèn)卷設(shè)計(jì)的方法卡片法、框圖法。問(wèn)卷設(shè)計(jì)的步驟(1)探索性工作(2)利用卡片法和框圖法設(shè)計(jì)問(wèn)卷的初稿(3)試用和修改5.2.3問(wèn)題及答案的設(shè)計(jì)問(wèn)題形式的設(shè)計(jì)(1)開(kāi)放式問(wèn)題;(2)封閉式問(wèn)題:填空式、是否式、多項(xiàng)單選式、多項(xiàng)限選式、多項(xiàng)排序式、多項(xiàng)任選式、矩陣式、表格式。

答案的設(shè)計(jì)(1)要使答案具有窮盡性和互斥性;(2)要根據(jù)研究的需要來(lái)確定變量的測(cè)量層次;(3)要注意問(wèn)題的語(yǔ)言及提問(wèn)的方式5.2.3問(wèn)題及答案的設(shè)計(jì)答案的設(shè)計(jì)(1)問(wèn)題的語(yǔ)言盡量要簡(jiǎn)單,通俗易懂;(2)問(wèn)題的陳述要盡可能簡(jiǎn)短;(3)問(wèn)題要避免帶有雙重含義;(4)問(wèn)題不能帶有傾向性;(5)不要用否定形式提問(wèn);(6)不要問(wèn)回答者不知道的問(wèn)題;(7)不要直接詢(xún)問(wèn)敏感性問(wèn)題。5.2.3問(wèn)題及答案的設(shè)計(jì)

相倚問(wèn)題在前后兩個(gè)(或多個(gè))相連的問(wèn)題中,被調(diào)查者是否應(yīng)回答后一個(gè)(或幾個(gè))問(wèn)題,要由他對(duì)前一個(gè)問(wèn)題的回答結(jié)果來(lái)決定。即前一個(gè)問(wèn)題作為“過(guò)濾性問(wèn)題”或“篩選性問(wèn)題”,而把后一問(wèn)題叫做相倚問(wèn)題。5.2.3問(wèn)題及答案的設(shè)計(jì)

問(wèn)題的數(shù)目問(wèn)題的數(shù)目要依據(jù)調(diào)查的內(nèi)容、樣本的性質(zhì)、分析方法等確定。

問(wèn)題的順序(1)把被調(diào)查者熟悉的問(wèn)題放在前面,生疏的放在后面。(2)把簡(jiǎn)單宜答的問(wèn)題放在前面,難題放在后面(3)把能引起被調(diào)查者興趣的問(wèn)題放在前面,把容易引起他們緊張或產(chǎn)生顧慮的問(wèn)題放在后面,(4)先問(wèn)行為方面的問(wèn)題,后問(wèn)態(tài)度,意見(jiàn)看法方面的問(wèn)題,(5)個(gè)人的背景資料。(如年齡,性別,文化程度,婚姻狀況,職業(yè)等)。一般放在結(jié)尾,但有時(shí)也可放在開(kāi)頭。5.2.4問(wèn)卷的使用使用問(wèn)卷獲得數(shù)據(jù)的具體實(shí)施方法:自填式問(wèn)卷、訪(fǎng)談問(wèn)卷、電話(huà)訪(fǎng)問(wèn)和在線(xiàn)調(diào)查。5.2.5問(wèn)卷法的特點(diǎn)問(wèn)卷法的優(yōu)點(diǎn)是節(jié)省時(shí)間、經(jīng)費(fèi)和人力;具有很好的匿名性;所得資料便于定量處理和分析;可避免某些人為誤差。問(wèn)卷的回收率有時(shí)難以保證,自填問(wèn)卷法對(duì)被調(diào)查者的文化水平有一定要求,調(diào)查資料的質(zhì)量常常得不到保證;訪(fǎng)問(wèn)調(diào)查對(duì)訪(fǎng)問(wèn)員的要求較高,時(shí)間和成本都較大。

Part35.3資料的整理

5.3.1資料的審核

資料的審核內(nèi)容研究者對(duì)所收集的原始資料進(jìn)行初步的審閱,校正錯(cuò)填、誤填的答案,剔出亂填、空白和嚴(yán)重缺答的廢卷。資料的審核工作包含兩方面的內(nèi)容:一是檢查出問(wèn)卷資料中的問(wèn)題;二是重新向被調(diào)查者核實(shí)。

資料的審核工作有兩種不同的做法(1)實(shí)地審核或收集審核:收集資料的過(guò)程中進(jìn)行,即邊收集邊審核。(2)系統(tǒng)審核或集中審核:先將資料全部收回,然后集中時(shí)間進(jìn)行審核。5.3.2資料的整理(1)資料的編碼:用阿拉伯?dāng)?shù)字來(lái)代替問(wèn)卷中每一個(gè)問(wèn)題的回答,或者說(shuō)是將問(wèn)卷中的答案轉(zhuǎn)換成數(shù)字的過(guò)程。(2)資料的錄人:一是直接從問(wèn)卷上將編好碼的數(shù)據(jù)輸入計(jì)算機(jī);另一種是先將問(wèn)卷上編好碼的數(shù)據(jù)轉(zhuǎn)錄到專(zhuān)門(mén)的登錄表上,然后再?gòu)牡卿洷砩蠈?shù)據(jù)輸入計(jì)算機(jī)。(3)數(shù)據(jù)清理:有效范圍清理、邏輯一致性清理、數(shù)據(jù)質(zhì)量抽查。

Part45.4微觀(guān)調(diào)查數(shù)據(jù)庫(kù)

5.4.1CFPS數(shù)據(jù)庫(kù):中國(guó)家庭追蹤調(diào)查中國(guó)家庭追蹤調(diào)查(ChinaFamilyPanelStudies,CFPS)通過(guò)追蹤收集個(gè)體、家庭、社區(qū)三個(gè)層次的數(shù)據(jù),反映中國(guó)社會(huì)、經(jīng)濟(jì)、人口、教育和健康的變遷,為學(xué)術(shù)和政策研究提供數(shù)據(jù)基礎(chǔ)。家庭收入、支出和資產(chǎn)是CFPS家庭層面問(wèn)卷的主要內(nèi)容。研究者根據(jù)CFPS可以研究收入、消費(fèi)、資產(chǎn)的分布和變化情況以及相關(guān)因素;可以進(jìn)行各類(lèi)有關(guān)金融知識(shí)和經(jīng)濟(jì)行為的研究;可以和其他數(shù)據(jù)庫(kù)聯(lián)合進(jìn)行跨數(shù)據(jù)庫(kù)的研究。鏈接:/cfps/sjzx/gksj/index.htm文章:“高房?jī)r(jià)會(huì)扭曲公眾的價(jià)值觀(guān)嗎?基于中國(guó)家庭追蹤調(diào)查(CFPS)的實(shí)證分析”[J],經(jīng)濟(jì)學(xué)季刊,2021(5):1753-17725.4.2CGSS數(shù)據(jù)庫(kù):中國(guó)綜合社會(huì)調(diào)查中國(guó)綜合社會(huì)調(diào)查(ChineseGeneralSocialSurvey,CGSS)全面地收集社會(huì)、社區(qū)、家庭、個(gè)人多個(gè)層次的數(shù)據(jù),總結(jié)社會(huì)變遷的趨勢(shì),探討具有重大科學(xué)和現(xiàn)實(shí)意義的議題,推動(dòng)國(guó)內(nèi)科學(xué)研究的開(kāi)放與共享,為國(guó)際比較研究提供數(shù)據(jù)資料,充當(dāng)多學(xué)科的經(jīng)濟(jì)與社會(huì)數(shù)據(jù)采集平臺(tái)。CGSS的調(diào)查問(wèn)卷由三部分構(gòu)成:核心模塊調(diào)查全部樣本,年度調(diào)查,固定不變;主題模塊調(diào)查全部樣本,5年重復(fù)一次,兩次調(diào)查內(nèi)容重合率>80%;附加模塊為調(diào)查1/3或1/4隨機(jī)樣本,不確保重復(fù)周期和內(nèi)容。其中核心模塊與主題模塊主要服務(wù)于描述與解釋社會(huì)變遷的宗旨,擴(kuò)展模塊則主要服務(wù)于跨國(guó)比較研究的目的。鏈接:/5.4.3CHARLS數(shù)據(jù)庫(kù):中國(guó)健康與養(yǎng)老和追蹤調(diào)查中國(guó)健康與養(yǎng)老追蹤調(diào)查(ChinaHealthandRetirementLongitudinalSurvey,CHARLS)旨在收集一套代表中國(guó)45歲及以上中老年人家庭和個(gè)人的高質(zhì)量微觀(guān)數(shù)據(jù),用以分析我國(guó)人口老齡化問(wèn)題,推動(dòng)老齡化問(wèn)題的跨學(xué)科研究,為制定和完善我國(guó)相關(guān)政策提供更加科學(xué)的基礎(chǔ)。CHARLS設(shè)計(jì)了三種類(lèi)型問(wèn)卷:家戶(hù)問(wèn)卷、政策問(wèn)卷、社區(qū)問(wèn)卷。鏈接:/5.4.4CHIP數(shù)據(jù)庫(kù):中國(guó)家庭收入調(diào)查中國(guó)家庭收入調(diào)查(ChineseHouseholdIncomeProject,CHIP)已經(jīng)進(jìn)行了五次入戶(hù)調(diào)查。它們分別收集了1988、1995、2002、2007和2013年的收支信息,以及其他家庭和個(gè)人信息。CHIP適合的論文主題主要與就業(yè)、收入、支出等家庭和個(gè)人經(jīng)濟(jì)變量相關(guān)的主題,特別適合長(zhǎng)期趨勢(shì)的展示和分析。鏈接:/chip/index.asp5.4.5CSS數(shù)據(jù)庫(kù):中國(guó)社會(huì)狀況綜合調(diào)查中國(guó)社會(huì)狀況綜合調(diào)查(ChineseSocialSurvey,CSS)是一項(xiàng)全國(guó)范圍內(nèi)的大型連續(xù)性抽樣調(diào)查項(xiàng)目,目的是通過(guò)對(duì)全國(guó)公眾的勞動(dòng)就業(yè)、家庭及社會(huì)生活、社會(huì)態(tài)度等方面的長(zhǎng)期縱貫調(diào)查,來(lái)獲取轉(zhuǎn)型時(shí)期中國(guó)社會(huì)變遷的數(shù)據(jù)資料,從而為社會(huì)科學(xué)研究和政府決策提供翔實(shí)而科學(xué)的基礎(chǔ)信息。其基礎(chǔ)模塊固定不變,包含了個(gè)人基礎(chǔ)信息、勞動(dòng)與就業(yè)、家庭結(jié)構(gòu)、家庭經(jīng)濟(jì)狀況等內(nèi)容;更替模塊如社會(huì)階層地位流動(dòng)、社會(huì)保障、休閑消費(fèi)、社會(huì)價(jià)值觀(guān)等,隔一定周期后重復(fù)調(diào)查;熱點(diǎn)模塊則與時(shí)俱進(jìn),目前已進(jìn)行了社會(huì)群體利益關(guān)系、民生問(wèn)題、城鎮(zhèn)化等主題的研究。鏈接:/css_sy/5.4.6其他微觀(guān)調(diào)查數(shù)據(jù)庫(kù)中國(guó)教育追蹤調(diào)查(ChinaEducationPanelSurvey,CEPS)是由中國(guó)人民大學(xué)中國(guó)調(diào)查與數(shù)據(jù)中心設(shè)計(jì)與實(shí)施的大型追蹤調(diào)查項(xiàng)目,目的是旨在揭示家庭、學(xué)校、社區(qū)以及宏觀(guān)社會(huì)結(jié)構(gòu)對(duì)于個(gè)人教育產(chǎn)出的影響,并進(jìn)一步探究教育產(chǎn)出在個(gè)人生命歷程中發(fā)生作用的過(guò)程,為相關(guān)學(xué)術(shù)研究及政策制定提供具有全國(guó)代表性的多層次基礎(chǔ)數(shù)據(jù)支持。5.4.6其他微觀(guān)調(diào)查數(shù)據(jù)庫(kù)中國(guó)家庭金融調(diào)查數(shù)據(jù)(ChinaHouseholdFinanceSurvey,CHFS)是西南財(cái)經(jīng)大學(xué)中國(guó)家庭金融調(diào)查與研究中心在全國(guó)范圍內(nèi)開(kāi)展的抽樣調(diào)查項(xiàng)目,收集有關(guān)家庭金融微觀(guān)層次的相關(guān)信息。調(diào)查的內(nèi)容主要包括:金融資產(chǎn)和包括住房資產(chǎn)在內(nèi)的非金融資產(chǎn)、負(fù)債和信貸約束、收入、消費(fèi)、社會(huì)保障與保險(xiǎn)、代際轉(zhuǎn)移支付、人口特征和就業(yè)以及支付習(xí)慣等。5.4.6其他微觀(guān)調(diào)查數(shù)據(jù)庫(kù)中國(guó)勞動(dòng)力動(dòng)態(tài)調(diào)查(ChinaLabor-forceDynamicSurvey,CLDS)通過(guò)對(duì)中國(guó)城市和農(nóng)村的村居進(jìn)行兩年一次的追蹤調(diào)查,建立了以勞動(dòng)力為調(diào)查對(duì)象的綜合性數(shù)據(jù)庫(kù),包含了勞動(dòng)力個(gè)體、家庭和社區(qū)三個(gè)層次的追蹤和橫截面數(shù)據(jù),可為實(shí)證導(dǎo)向的理論研究和政策研究提供高質(zhì)量的基礎(chǔ)數(shù)據(jù)。復(fù)習(xí)思考題1.如果請(qǐng)你研究下區(qū)域的創(chuàng)新能力,你如何收集數(shù)據(jù)和資料?2.實(shí)驗(yàn)法開(kāi)展研究的邏輯是什么?什么樣的議題適用于實(shí)驗(yàn)法開(kāi)展研究?3.如果現(xiàn)在想要了解公眾對(duì)知識(shí)產(chǎn)權(quán)信息公共服務(wù)滿(mǎn)意的情況,如何設(shè)計(jì)問(wèn)卷,怎樣開(kāi)展調(diào)查,重點(diǎn)應(yīng)該關(guān)注哪些問(wèn)題?4.問(wèn)卷調(diào)查如何進(jìn)行數(shù)據(jù)的清洗與整理?第6章基本量化

分析方法

Part16.1描述性統(tǒng)計(jì)分析

6.1.1統(tǒng)計(jì)圖表

統(tǒng)計(jì)表統(tǒng)計(jì)表可以分為序列表和分類(lèi)表。序列表包括時(shí)間序列表和地域序列表。年份(地域)總?cè)丝冢昴┌葱詣e分單位:萬(wàn)人男女人口數(shù)比重(%)人口數(shù)比重(%)20101340916874851.276534348.7320111349166916151.266575548.7420121359226966051.256626248.756.1.1統(tǒng)計(jì)圖表

統(tǒng)計(jì)表分類(lèi)表分為定性分布表和頻數(shù)分布表。頻數(shù)分布產(chǎn)生過(guò)程:

6.1.1統(tǒng)計(jì)圖表

統(tǒng)計(jì)表頻數(shù)分布表參數(shù):累積頻數(shù)(CumulativeFrequency):由第一組起至第i組止各頻數(shù)之和稱(chēng)為第i組的累積頻數(shù),記為,即:頻率(PercentFrequency)就是頻數(shù)除以總數(shù)n:,經(jīng)常以百分?jǐn)?shù)表示。

6.1.1統(tǒng)計(jì)圖表

統(tǒng)計(jì)表頻數(shù)分布表參數(shù):基尼系數(shù)就是基于累積人口百分比以及累積收入百分比計(jì)算出來(lái)的,基尼系數(shù)=A/(A+B)。基尼系數(shù)衡量社會(huì)貧富差距程度:基尼系數(shù)取值貧富差距程度當(dāng)基尼系數(shù)小于0.2收入絕對(duì)平均當(dāng)基尼系數(shù)位于0.2-0.3收入比較平均當(dāng)基尼系數(shù)0.3-0.4收入相對(duì)合理當(dāng)基尼系數(shù)0.4-0.5收入差距較大當(dāng)基尼系數(shù)0.5以上收入差距懸殊6.1.1統(tǒng)計(jì)圖表

統(tǒng)計(jì)圖統(tǒng)計(jì)圖主要有柱狀圖、折線(xiàn)圖、餅圖、圓環(huán)圖、雷達(dá)圖、氣泡圖等。柱狀圖、折線(xiàn)圖、散點(diǎn)圖都適用于呈現(xiàn)離散變量的資料,可以呈現(xiàn)趨勢(shì)、相關(guān)關(guān)系等規(guī)律。餅圖和環(huán)形圖可以對(duì)數(shù)據(jù)進(jìn)行一個(gè)整合分析,很直觀(guān)的通過(guò)圖形來(lái)看出數(shù)據(jù)的分布占比。雷達(dá)圖可以比對(duì)不同研究對(duì)象在多個(gè)維度上指標(biāo)的差異。6.1.2單變量描述性統(tǒng)計(jì)分析

集中趨勢(shì)統(tǒng)計(jì)量(1)定類(lèi)變量:眾數(shù)(EXCEL,MODE函數(shù));(2)定序變量:中位數(shù)(EXCEL,MEDIAN函數(shù));(3)定距和定比變量:平均數(shù)(EXCEL,MEAN函數(shù))→①簡(jiǎn)單算術(shù)平均數(shù);②加權(quán)算術(shù)平均數(shù);③簡(jiǎn)單幾何平均數(shù);④加權(quán)幾何平均數(shù)。

6.1.2單變量描述性統(tǒng)計(jì)分析

集中趨勢(shì)統(tǒng)計(jì)量對(duì)于具有單峰分布的大多數(shù)數(shù)據(jù)而言,眾數(shù)、中位數(shù)和平均數(shù)之間具有以下關(guān)系:①如果數(shù)據(jù)的分布是對(duì)稱(chēng)的,眾數(shù)、中位數(shù)、平均數(shù)必定相等;②如果數(shù)據(jù)是左偏分布,說(shuō)明數(shù)據(jù)存在極小值,必然拉動(dòng)平均數(shù)向極小值一方靠近,而眾數(shù)和中位數(shù)由于是位置代表值,不受極值的影響,因此三者的關(guān)系為眾數(shù)>中位數(shù)>平均數(shù);③如果數(shù)據(jù)是右偏分布,說(shuō)明數(shù)據(jù)存在極大值,必然拉動(dòng)平均數(shù)向極大值的一方靠近,則眾數(shù)<中位數(shù)<平均數(shù)。6.1.2單變量描述性統(tǒng)計(jì)分析離中趨勢(shì)統(tǒng)計(jì)量(1)定類(lèi)變量:異眾比率(非眾數(shù)的頻數(shù)與總體單位數(shù)的比值);(2)定序變量:四分位差(EXCEL,QUARTILE函數(shù)、PERCENTILE函數(shù));

6.1.2單變量描述性統(tǒng)計(jì)分析離中趨勢(shì)統(tǒng)計(jì)量(3)定距變量:①全距(極差、EXCEL,MAX函數(shù)和MIN函數(shù))、②平均差(EXCEL,AVEDEV函數(shù))、③方差(EXCEL,VAR函數(shù))與④標(biāo)準(zhǔn)差(EXCEL,STDEV函數(shù))以及⑤離散系數(shù)

和(分組數(shù)據(jù))(未分組數(shù)據(jù))6.1.2單變量描述性統(tǒng)計(jì)分析離中趨勢(shì)統(tǒng)計(jì)量(3)定距變量:①全距(極差、EXCEL,MAX函數(shù)和MIN函數(shù))、②平均差(EXCEL,AVEDEV函數(shù))、③方差(EXCEL,VAR函數(shù))與④標(biāo)準(zhǔn)差(EXCEL,STDEV函數(shù))以及⑤離散系數(shù)(數(shù)據(jù)分布離中趨勢(shì)的絕對(duì)測(cè)度值與其相應(yīng)的算術(shù)平均數(shù)之比)和(分組數(shù)據(jù))(未分組數(shù)據(jù))

③④(未分組數(shù)據(jù))和

(分組數(shù)據(jù))

⑤6.1.2單變量描述性統(tǒng)計(jì)分析

(分組數(shù)據(jù))(未分組數(shù)據(jù))

6.1.2單變量描述性統(tǒng)計(jì)分析

(分組數(shù)據(jù))(未分組數(shù)據(jù))

6.1.2單變量描述性統(tǒng)計(jì)分析

(未分組數(shù)據(jù))

(分組數(shù)據(jù))

6.1.3雙變量統(tǒng)計(jì)分析相關(guān)系數(shù)(1)定類(lèi)變量:(2)定序變量:

6.1.3雙變量統(tǒng)計(jì)分析相關(guān)系數(shù)(3)定距變量(Pearson系數(shù),EXCEL中的CORREL函數(shù)):相關(guān)系數(shù)的計(jì)算需要N的個(gè)數(shù)不能小于30,如果小于30,相關(guān)系數(shù)可能失去意義。

Part26.2推斷性統(tǒng)計(jì)分析

6.2.1概率分布基礎(chǔ)知識(shí)概率與概率分布概率告知了隨機(jī)現(xiàn)象某一局部結(jié)果發(fā)生的可能性有多大;概率分布則要在滿(mǎn)足完備性(窮舉)和互不相容性(互斥)的前提下,回答隨機(jī)現(xiàn)象一共會(huì)出現(xiàn)多少種結(jié)果,以及每種結(jié)果所伴隨的概率是多少。概率分布的一般形式合計(jì)6.2.1概率分布基礎(chǔ)知識(shí)概率與概率分布概率分布與頻率分布的區(qū)別:(1)頻率分布是經(jīng)資料整理而來(lái)的,概率分布卻是先驗(yàn)的;(2)頻率分布隨樣本不同而有所不同,概率分布卻是唯一的;(3)頻率分布有對(duì)應(yīng)的頻數(shù)分布,概率分布則沒(méi)有。頻率分布被稱(chēng)為隨機(jī)變量的統(tǒng)計(jì)分布或經(jīng)驗(yàn)分布,而概率分布則被稱(chēng)為隨機(jī)變量的理論分布。6.2.1概率分布基礎(chǔ)知識(shí)分布函數(shù)

概率密度函數(shù):

f(x)xx1x2分布函數(shù):

6.2.1概率分布基礎(chǔ)知識(shí)數(shù)學(xué)期望與變異數(shù)數(shù)學(xué)期望,是反映隨機(jī)變量X取值的集中趨勢(shì)的理論均值(算術(shù)平均,記作E(X)。離散型隨機(jī)變量:

連續(xù)型隨機(jī)變量:

6.2.1概率分布基礎(chǔ)知識(shí)

6.2.1概率分布基礎(chǔ)知識(shí)

離散型隨機(jī)變量:

連續(xù)型隨機(jī)變量:

方差:6.2.1概率分布基礎(chǔ)知識(shí)

6.2.1概率分布基礎(chǔ)知識(shí)

6.2.1概率分布基礎(chǔ)知識(shí)

6.2.2參數(shù)估計(jì)與假設(shè)檢驗(yàn)

顯著性水平置信水平概率度6.2.2參數(shù)估計(jì)與假設(shè)檢驗(yàn)

6.2.2參數(shù)估計(jì)與假設(shè)檢驗(yàn)

檢驗(yàn)統(tǒng)計(jì)量:

6.2.2參數(shù)估計(jì)與假設(shè)檢驗(yàn)

Part36.3回歸分析

6.3.1.一元線(xiàn)性回歸回歸模型:基本假設(shè):(1)回歸函數(shù)線(xiàn)性假定:自變量與因變量之間的相關(guān)關(guān)系為線(xiàn)性關(guān)系;(2)獨(dú)立性假定:不同時(shí)期自變量因變量是相互獨(dú)立;(3)同方差假定:給定自變量后,Yi與Yt的波動(dòng)程度是相同的;(4)正態(tài)性假定:給定自變量后,誤差項(xiàng)服從正態(tài)分布;(5)零均值假定:誤差項(xiàng)對(duì)于整個(gè)模型不是系統(tǒng)性的影響因素以及誤差項(xiàng)和自變量線(xiàn)性無(wú)關(guān)。

6.3.1.一元線(xiàn)性回歸

6.3.2多元線(xiàn)性回歸回歸模型:基本假設(shè):(1)回歸函數(shù)線(xiàn)性假定:自變量與因變量之間的相關(guān)關(guān)系為線(xiàn)性關(guān)系;(2)獨(dú)立性假定:不同時(shí)期自變量因變量是相互獨(dú)立;(3)同方差假定:給定自變量后,Yi與Yt的波動(dòng)程度是相同的;(4)正態(tài)性假定:給定自變量后,誤差項(xiàng)服從正態(tài)分布;(5)零均值假定:誤差項(xiàng)對(duì)于整個(gè)模型不是系統(tǒng)性的影響因素以及誤差項(xiàng)和自變量線(xiàn)性無(wú)關(guān);(6)多重共線(xiàn)性假定:解釋變量之間不存在多重共線(xiàn)性。

6.3.2多元線(xiàn)性回歸

6.3.3幾類(lèi)其他回歸Logistic回歸:廣義的線(xiàn)性回歸分析模型,該模型常被用于估計(jì)某個(gè)事件發(fā)生的可能性以及針對(duì)某個(gè)事情的影響因素分析。基本模型:(p表示發(fā)生的概率)Logistic回歸分析的因變量屬于分類(lèi)數(shù)據(jù)。Logistics回歸的變量分布不符合正態(tài)分布,二值變量方差不是常數(shù),存在異方差性,因此其進(jìn)行系數(shù)估計(jì)時(shí)選擇的是最大似然估計(jì)法,評(píng)價(jià)模型擬合度的標(biāo)準(zhǔn)也變?yōu)樗迫恢刀请x差平方和。

6.3.3幾類(lèi)其他回歸Logistic回歸:二元Logit(Logistic)回歸、多分類(lèi)Logit(Logistic)回歸,有序Logit(Logistic)回歸。Logistics回歸的注意事項(xiàng):(1)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論