統(tǒng)計(jì)學(xué)復(fù)習(xí)提綱終極版_第1頁
統(tǒng)計(jì)學(xué)復(fù)習(xí)提綱終極版_第2頁
統(tǒng)計(jì)學(xué)復(fù)習(xí)提綱終極版_第3頁
統(tǒng)計(jì)學(xué)復(fù)習(xí)提綱終極版_第4頁
統(tǒng)計(jì)學(xué)復(fù)習(xí)提綱終極版_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第一章1.1什么是統(tǒng)計(jì)學(xué)

統(tǒng)計(jì)學(xué)是收集,處理,分析,解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué)。

1.2解釋描述統(tǒng)計(jì)和推斷統(tǒng)計(jì)

描述統(tǒng)計(jì):研究數(shù)據(jù)收集,處理,匯總,圖表描述,概括與分析等統(tǒng)計(jì)方法。

推斷統(tǒng)計(jì):研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計(jì)方法。

1.3統(tǒng)計(jì)學(xué)的類型和不同類型的特點(diǎn)

統(tǒng)計(jì)數(shù)據(jù)的分類:1、按計(jì)量層次分:①分類數(shù)據(jù)(只能歸于某一類別的非數(shù)字型數(shù)據(jù),是對(duì)事物進(jìn)行分類的結(jié)果,數(shù)據(jù)表現(xiàn)為類別,用文字來表述)

②順序數(shù)據(jù)(只能歸于某一有序類別的非數(shù)字型數(shù)據(jù)。對(duì)事物類別順序的測度,數(shù)據(jù)表現(xiàn)為類別,用文字來表述)

③數(shù)值型數(shù)據(jù)(按數(shù)字尺度測量的觀察值,其結(jié)果表現(xiàn)為具體的數(shù)值,對(duì)事物的精確測度)2、按收集方法分:①觀測數(shù)據(jù)(是通過調(diào)查或觀測而收集到的數(shù)據(jù),這類數(shù)據(jù)是在沒有對(duì)事物人為控制的條件下得到的,有關(guān)社會(huì)經(jīng)濟(jì)現(xiàn)象的統(tǒng)計(jì)數(shù)據(jù)幾乎都是觀測數(shù)據(jù))②實(shí)驗(yàn)數(shù)據(jù)(在實(shí)驗(yàn)中控制實(shí)驗(yàn)對(duì)象而收集到的數(shù)據(jù)。自然科學(xué)領(lǐng)域的數(shù)據(jù)大多為實(shí)驗(yàn)數(shù)據(jù))3、按時(shí)間狀況分:

①截面數(shù)據(jù)(在相同或近似相同的時(shí)間點(diǎn)上收集到的數(shù)據(jù),也叫靜態(tài)數(shù)據(jù)。描述現(xiàn)象在某一時(shí)刻的變化情況)

②時(shí)間序列數(shù)據(jù)(在不同時(shí)間上收集到的數(shù)據(jù),描述現(xiàn)象隨時(shí)間變化的情況,也叫動(dòng)態(tài)數(shù)據(jù))1.4解釋分類數(shù)據(jù),順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)

答案見1.3

1.5統(tǒng)計(jì)學(xué)中的幾個(gè)基本概念1、總體:是包含所研究的全部個(gè)體(數(shù)據(jù))的集合,其中的每一個(gè)個(gè)體稱為元素。分為有限總體和無限總體。2、樣本:從總體中抽取的一部分元素的集合,構(gòu)成樣本的元素的數(shù)目稱為樣本容量或樣本量。3、參數(shù):描述總體特征的概括性數(shù)字度量,是研究者想要了解的總體的某種特征值。4、統(tǒng)計(jì)量:用來描述樣本特征的概括性數(shù)字度量,是根據(jù)樣本數(shù)據(jù)計(jì)算出來的一些量,是樣本的函數(shù)5、變量:說明現(xiàn)象某種特征的概念。1.6變量的分類

變量可以分為分類變量,順序變量,數(shù)值型變量。

變量也可以分為隨機(jī)變量和非隨機(jī)變量。經(jīng)驗(yàn)變量和理論變量。

第二章2.1什么是二手資料?使用二手資料應(yīng)注意什么問題

與研究內(nèi)容有關(guān),由別人調(diào)查和試驗(yàn)而來已經(jīng)存在,并會(huì)被我們利用的資料為“二手資料”。使用時(shí)要進(jìn)行評(píng)估,要考慮到資料的原始收集人,收集目的,收集途徑,收集時(shí)間使用時(shí)要注明數(shù)據(jù)來源。

2.2比較概率抽樣和非概率抽樣的特點(diǎn)以及常用的抽樣方法比較:概率抽樣:遵循隨機(jī)原則進(jìn)行抽樣,可以據(jù)以對(duì)總體參數(shù)進(jìn)行估計(jì);它的特點(diǎn)是更精確、技術(shù)含量高、調(diào)查成本高非概率抽樣:遵循非隨機(jī)原則,統(tǒng)計(jì)量的分布不穩(wěn)定,無法進(jìn)行參數(shù)估計(jì);它的特點(diǎn)是操作簡單,時(shí)效快,成本低,適合探索性的研究常用的抽樣方法概率抽樣方法:簡單隨機(jī)抽樣、分層抽樣、整群抽樣、系統(tǒng)抽樣、多階段抽樣非概率抽樣方法:方便抽樣、判斷抽樣、自愿抽樣、滾雪球抽樣、配額抽樣2.3除了自填式,面訪式和電話式還有什么搜集數(shù)據(jù)的辦法

觀察式2.4自填式,面訪式和電話式各自的長處和弱點(diǎn)自填式優(yōu)點(diǎn):1、調(diào)查組織者管理容易2、成本低,可進(jìn)行大規(guī)模調(diào)查3、對(duì)被調(diào)查者,可選擇方便時(shí)間答卷,減少回答敏感問題壓力。缺點(diǎn):1、回收率低2、不適合結(jié)構(gòu)復(fù)雜的問卷,調(diào)查內(nèi)容有限3、調(diào)查周期長4在數(shù)據(jù)搜集過程中遇見問題不能及時(shí)調(diào)整。

面訪式優(yōu)點(diǎn):1、回答率高2、數(shù)據(jù)質(zhì)量高3、在調(diào)查過程中遇見問題可以及時(shí)調(diào)整。缺點(diǎn):1、成本比較高2、搜集數(shù)據(jù)的方式對(duì)調(diào)查過程的質(zhì)量控制有一定難度3、對(duì)于敏感問題,被訪者會(huì)有壓力。

電話式優(yōu)點(diǎn):1、速度快2、對(duì)調(diào)查員比較安全3、對(duì)訪問過程的控制比較容易。缺點(diǎn):1、實(shí)施地區(qū)有限2、調(diào)查時(shí)間不能過長3、使用的問卷要簡單4被訪者不愿回答時(shí),不易勸服。

提綱第五點(diǎn):抽樣誤差和非抽樣誤差的概念抽樣誤差:指由于抽樣的隨機(jī)性引起的樣本結(jié)果與總體真值之間的誤差非抽樣誤差:指除抽樣誤差以外的所有誤差的總和2.6如何控制調(diào)查中的回答誤差

抽樣誤差是不可避免的,能夠在調(diào)查過程中進(jìn)行控制的只有非抽樣誤差。抽樣誤差可以計(jì)算,因此可以通過統(tǒng)計(jì)學(xué)專業(yè)知識(shí)根據(jù)允許誤差來確定樣本量,以控制抽樣誤差。費(fèi)抽樣誤差控制的重要方面是調(diào)查過程的質(zhì)量控制。包括:調(diào)查員的挑選,調(diào)查員的培訓(xùn),督導(dǎo)員的調(diào)查專業(yè)水平,對(duì)調(diào)查過程進(jìn)行控制的具體措施(包括對(duì)調(diào)查結(jié)果進(jìn)行檢驗(yàn)、評(píng)估,對(duì)現(xiàn)場調(diào)查人員進(jìn)行獎(jiǎng)懲制度等)第三章3.1數(shù)據(jù)預(yù)處理內(nèi)容

:數(shù)據(jù)審核(完整性和準(zhǔn)確性;適用性和時(shí)效性),數(shù)據(jù)篩選和數(shù)據(jù)排序。3.2分類數(shù)據(jù)和順序數(shù)據(jù)的整理和圖示方法各有哪些

分類數(shù)據(jù)的整理(基本過程):1、列出各類別2、計(jì)算各類別的頻數(shù)3、制作頻數(shù)分布表4、用圖形顯示數(shù)據(jù)分類數(shù)據(jù):制作頻數(shù)分布表,用比例,百分比,比率等進(jìn)行描述性分析??捎脳l形圖,對(duì)比條形圖,帕累托圖和餅圖進(jìn)行圖示分析。順序數(shù)據(jù):制作頻數(shù)分布表,用比例,百分比,比率。累計(jì)頻數(shù)和累計(jì)頻率等進(jìn)行描述性分析??捎脳l形圖,帕累托圖和餅圖,累計(jì)頻數(shù)分布圖和環(huán)形圖進(jìn)行圖示分析。提綱第五點(diǎn):數(shù)值型數(shù)據(jù)的整理與展示圖示:分組數(shù)據(jù)——直方圖和折線圖未分組數(shù)據(jù)——莖葉圖和箱線圖時(shí)間序列數(shù)據(jù)——線圖多變量數(shù)據(jù)——兩個(gè)變量間的關(guān)系:二維散點(diǎn)圖三個(gè)變量間的關(guān)系:氣泡圖多變量數(shù)據(jù):雷達(dá)圖(蜘蛛圖)

3.3數(shù)值型數(shù)據(jù)的分組方法和步驟

分組方法:單變量值分組和組距分組,組距分組又分為等距分組和異距分組。

分組步驟:1確定組數(shù)2確定各組組距3根據(jù)各組頻數(shù)整理成頻數(shù)分布表

3.4直方圖和條形圖的區(qū)別

條形圖使用條形的長度表示各類別頻數(shù)的多少,其寬度固定,直方圖用面積表示各組頻數(shù),矩形的高度表示每一組的頻數(shù)或百分比,寬度表示組距,2、直方圖各矩形連續(xù)排列,條形圖分開排列,3條形圖主要展示分類數(shù)據(jù),直方圖主要展示數(shù)值型數(shù)據(jù)。

3.5繪制線圖應(yīng)注意問題

時(shí)間在橫軸,觀測值繪在縱軸。圖形長寬比例為10:7,縱軸下端一般從0開始,數(shù)據(jù)與0距離過大時(shí),采用折斷符號(hào)將縱軸折斷。

3.6餅圖和環(huán)形圖的不同

餅圖只能顯示一個(gè)樣本或總體各部分所占比例,環(huán)形圖可以同時(shí)繪制多個(gè)樣本或總體的數(shù)據(jù)系列,其圖形中間有個(gè)“空洞”,每個(gè)樣本或總體的數(shù)據(jù)系列為一個(gè)環(huán)。

3.7莖葉圖比直方圖的優(yōu)勢,他們各自的應(yīng)用場合

直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值。莖葉圖既能給出數(shù)據(jù)的分布情況,又能給出每一個(gè)原始數(shù)據(jù),即保留了原始數(shù)據(jù)的信息。在應(yīng)用方面,直方圖通常適用于大批量數(shù)據(jù),莖葉圖適用于小批量數(shù)據(jù)。3.9制作統(tǒng)計(jì)表應(yīng)注意的問題

1、合理安排統(tǒng)計(jì)表結(jié)構(gòu)2、標(biāo)題內(nèi)容應(yīng)滿足3W(數(shù)據(jù)的時(shí)間、地點(diǎn)以及何種數(shù)據(jù))要求3、數(shù)據(jù)計(jì)量單位相同時(shí),可放在表的右上角標(biāo)明,不同時(shí)應(yīng)放在每個(gè)變量后或單列出一列標(biāo)明4、表中的上下兩條橫線一般用粗線,其他用細(xì)線5、通常情況下,統(tǒng)計(jì)表的左右兩邊不封口。表中的數(shù)據(jù)一般右對(duì)齊,有小數(shù)點(diǎn)時(shí)以小數(shù)點(diǎn)對(duì)其,而且小數(shù)點(diǎn)位數(shù)統(tǒng)一。對(duì)于沒有數(shù)據(jù)的表格單元用“—”表示

提綱:數(shù)據(jù)透視表的應(yīng)用1、可以從復(fù)雜的數(shù)據(jù)中提取有用的信息2、可以對(duì)數(shù)據(jù)表的重要信息按使用者的習(xí)慣或分析要求進(jìn)行匯總和作圖3、形成一個(gè)符合需要的交叉表(列聯(lián)表)4、在利用數(shù)據(jù)透視表時(shí),數(shù)據(jù)源表中的首行必須有列標(biāo)題第4章

數(shù)據(jù)的概括性度量

4.1一組數(shù)據(jù)的分布特征可以從哪幾個(gè)方面進(jìn)行測度?

三個(gè)方面:一、分布的集中趨勢,反映各數(shù)據(jù)向其中心值靠攏或聚集的程度;二、分布的離散程度,反映各數(shù)據(jù)遠(yuǎn)離其中心值的趨勢;三、分布的形狀,反映數(shù)據(jù)分布的偏態(tài)和峰態(tài)。4.2怎樣理解平均數(shù)在統(tǒng)計(jì)學(xué)中的地位?

平均數(shù):1、平均數(shù)也稱為均值,是一組數(shù)據(jù)相加后除以數(shù)據(jù)的個(gè)數(shù)得到的結(jié)果2、是集中趨勢的最主要測度值,它主要適用于數(shù)值型數(shù)據(jù)3、是一組數(shù)據(jù)的均衡點(diǎn)所在4、體現(xiàn)了數(shù)據(jù)數(shù)據(jù)的必然性特征5、易受極端值影響6、有簡單平均數(shù)和加權(quán)平均數(shù)地位:平均數(shù)在統(tǒng)計(jì)學(xué)中具有重要地位,它是進(jìn)行統(tǒng)計(jì)分析和統(tǒng)計(jì)推斷的基礎(chǔ)。從統(tǒng)計(jì)思想上看,平均數(shù)是一組數(shù)據(jù)的中心所在,是數(shù)據(jù)誤差相互抵消后的必然結(jié)果4.3簡述四分位數(shù)的計(jì)算方法。

四分位數(shù)是一組數(shù)據(jù)排序后處于25%和75%位置上的值。根據(jù)未分組數(shù)據(jù)計(jì)算四分位數(shù)時(shí),首先對(duì)數(shù)據(jù)進(jìn)行排序,然后確定四分位數(shù)所在的位置,該位置上的數(shù)值就是四分位數(shù)。

4.4對(duì)于比率數(shù)據(jù)的平均為什么采用幾何平均?

幾何平均數(shù)是指n個(gè)變量值乘積的n次方根,用G表示,計(jì)算公式為比率數(shù)據(jù)屬于相對(duì)數(shù),它不能如絕對(duì)數(shù)那樣對(duì)其進(jìn)行累加,而只能對(duì)其進(jìn)行連乘,因此對(duì)于比率數(shù)據(jù),在對(duì)其計(jì)算平均數(shù)的時(shí)候,我們不能像計(jì)算一般的平均數(shù)那樣計(jì)算,而要用幾何平均數(shù)的計(jì)算公式計(jì)算。

4.5簡述眾數(shù)、中位數(shù)和平均數(shù)的特點(diǎn)和應(yīng)用場合。眾數(shù)是一組數(shù)據(jù)分布的峰值,不受極端值的影響,缺點(diǎn)是具有不唯一性。眾數(shù)只有在數(shù)據(jù)量較多時(shí)才有意義,數(shù)據(jù)量較少時(shí)不宜使用。主要適合作為分類數(shù)據(jù)的集中趨勢測度值。

中位數(shù)是一組數(shù)據(jù)中間位置上的代表值,不受極端值的影響。當(dāng)數(shù)據(jù)的分布偏斜程度較大時(shí),使用中位數(shù)也許是個(gè)好的選擇。主要適合作為順序數(shù)據(jù)的集中趨勢測度值。

平均數(shù)是針對(duì)數(shù)值型數(shù)據(jù)計(jì)算的,而且利用了全部數(shù)據(jù)信息,在實(shí)際應(yīng)用中最廣泛。當(dāng)數(shù)據(jù)呈對(duì)稱分布或近似對(duì)稱分布時(shí),三個(gè)代表值相等或相近,此時(shí)應(yīng)選擇平均數(shù)作為集中趨勢的代表值。但平均數(shù)易受極端值的影響,對(duì)于偏態(tài)分布的數(shù)據(jù),平均數(shù)的代表性較差,此時(shí)應(yīng)考慮中位數(shù)或眾數(shù)。

4.6簡述異眾比率、四分位差、方差或標(biāo)準(zhǔn)差的適用場合

異眾比率主要用于衡量眾數(shù)對(duì)一組數(shù)據(jù)的代表程度,主要適合測度分類數(shù)據(jù)的離散程度;四分位差主要用于來測量順序數(shù)據(jù)的離散程度;方差或標(biāo)準(zhǔn)差主要用來測量數(shù)值型數(shù)據(jù)的離散程度。

4.7標(biāo)準(zhǔn)分?jǐn)?shù)有哪些用途?

標(biāo)準(zhǔn)分?jǐn)?shù)給出了一組數(shù)據(jù)中各數(shù)值的相對(duì)位置。在對(duì)多個(gè)具有不同量綱的變量進(jìn)行處理時(shí),常需要對(duì)各變量進(jìn)行標(biāo)準(zhǔn)化處理。它還可以用來判斷一組數(shù)據(jù)是否有離群數(shù)據(jù)。

4.9測度數(shù)據(jù)分布形狀的統(tǒng)計(jì)量有哪些?

對(duì)分布形狀的測度有偏態(tài)和峰態(tài),測度偏態(tài)的統(tǒng)計(jì)量是偏態(tài)系數(shù),測度峰態(tài)的統(tǒng)計(jì)量是峰態(tài)系數(shù)。數(shù)據(jù)集中趨勢度量的各統(tǒng)計(jì)量的計(jì)算、特點(diǎn)和應(yīng)用場合;①眾數(shù):M0=一個(gè)一個(gè)數(shù)啊②中位數(shù):(n為數(shù)據(jù)個(gè)數(shù),(n為奇數(shù))Me=,(n為偶數(shù))③設(shè)下四分位數(shù)為QL,上四分位數(shù)為QU,根據(jù)四分位數(shù)的定義有:QL位置=QU位置=④平均數(shù)其中n為樣本量設(shè)原始數(shù)據(jù)被分為k組,組中值為M1,M2…Mk,各組變量出現(xiàn)的頻數(shù)為f1,f2…fk幾何平均數(shù)數(shù)據(jù)離散程度的度量的各統(tǒng)計(jì)量的計(jì)算、特點(diǎn)和應(yīng)用場合;分類數(shù)據(jù):異眾比率其中為變量值的總頻數(shù);為眾數(shù)組的頻數(shù)(比率越大,非眾數(shù)組的頻數(shù)占總頻數(shù)的比重越大,眾數(shù)的代表性越差;反之順序數(shù)據(jù):四分位差=上四分位數(shù)與下四分?jǐn)?shù)之差(數(shù)值越小,說明中間的數(shù)據(jù)越集中;反之?dāng)?shù)值型數(shù)據(jù):極差R=max(xi)-min(xi)(一組數(shù)據(jù)最大值-最小值方差:標(biāo)注差:離散系數(shù):(即一組數(shù)據(jù)的標(biāo)準(zhǔn)差與其相應(yīng)的平均數(shù)之比)(離散系數(shù)大,說明數(shù)據(jù)的離散程度也大;反之度量數(shù)據(jù)分布的偏態(tài)、峰態(tài)系數(shù)的計(jì)算及應(yīng)用場合;①偏態(tài)系數(shù)(SK):偏態(tài)是對(duì)數(shù)據(jù)分布對(duì)稱性的測度;SK=0,則數(shù)據(jù)分布是對(duì)稱的;SK>1或SK<-1,高度偏態(tài)分布;0.5<SK<1或-1<SK<-0.5,中等偏態(tài)分布;越接近0偏態(tài)程度越低當(dāng)SK為正值時(shí),表示正離差值越大,可判斷為正偏或右偏;負(fù)值時(shí),表示負(fù)離差值越大,可判斷為負(fù)偏或左偏②峰態(tài)系數(shù)(K):它是對(duì)數(shù)據(jù)分布平峰或尖峰程度的測度K>0,尖峰分布,數(shù)據(jù)分布更集中;K<0,扁平分布,數(shù)據(jù)分布越分散第九章分類數(shù)據(jù)分析1、分類數(shù)據(jù):是對(duì)事物進(jìn)行分類的結(jié)果,其特征是,調(diào)查結(jié)果雖然用數(shù)值表示,但不同數(shù)值描述了調(diào)查對(duì)象的不同特征。分類數(shù)據(jù)的結(jié)果是頻數(shù),X2檢驗(yàn)是對(duì)分類數(shù)據(jù)的頻數(shù)進(jìn)行分析的統(tǒng)計(jì)方法2、X2統(tǒng)計(jì)量:X2可以用于測定兩個(gè)分類變量之間的相關(guān)程度,f0表示觀察值頻數(shù),fe表示期望值頻數(shù)。(f0-fe)2X2=E----------fe3、X2統(tǒng)計(jì)量特征:X2>=0,X2統(tǒng)計(jì)量分布與自由度有關(guān),X2統(tǒng)計(jì)量描述了觀察值與期望值的接近程度:自由度越小,分布越向左邊傾斜,隨著自由度的增加,X2分布的偏斜程度趨于緩解,逐漸顯露對(duì)稱性,隨著自由度的跡象增大,X2分布將趨近于對(duì)稱的正太分布。利用X2統(tǒng)計(jì)量可以對(duì)分類數(shù)據(jù)進(jìn)行擬合優(yōu)度檢驗(yàn)和獨(dú)立性檢驗(yàn)。4、擬合優(yōu)度檢驗(yàn):利用X2統(tǒng)計(jì)量進(jìn)行統(tǒng)計(jì)顯著性檢驗(yàn)的重要內(nèi)容之一。依據(jù)總體分布狀況,計(jì)算出分類變量中各類別的期望頻數(shù),與分布的觀察頻數(shù)進(jìn)行對(duì)比,判斷期望頻數(shù)與觀察頻數(shù)是否有顯著差異,從而達(dá)到對(duì)分類變量進(jìn)行分析的目的。例題:發(fā)生船難,共有2208人,其中男性1738人,女性470人,事后,幸存者共有718人,其中男性374人,女性344人,以a=0.1的顯著性水平檢驗(yàn)存活狀況與性別是否有關(guān)H0:觀察頻數(shù)與期望頻數(shù)一致H1:觀察頻數(shù)與期望頻數(shù)不一致男性:觀察頻數(shù)374,期望頻數(shù)565女性:觀察頻數(shù)344,期望頻數(shù)153自由度計(jì)算公式:df=R-1R為分類變量類型的個(gè)數(shù),這里分類變量是男女,R=2,df=2-1=1,X20.1(1)=2.706,括號(hào)中的數(shù)字是自由度,因?yàn)閄2遠(yuǎn)大于X20.1,所以拒絕H0,接受H1,說明存活狀況與性別顯著相關(guān)。5、列聯(lián)分析:擬合優(yōu)度檢驗(yàn)是對(duì)一個(gè)分類變量的檢驗(yàn),對(duì)于兩個(gè)分類變量的分析,稱為獨(dú)立性檢驗(yàn),分析過程可以通過列聯(lián)表的方式呈現(xiàn),所以有人把這種分析稱為列聯(lián)分析6、列聯(lián)表:由兩個(gè)以上的變量進(jìn)行交叉分類的頻數(shù)分布表(N*N列聯(lián)表,不包括合計(jì)一欄)7、獨(dú)立性檢驗(yàn):就是分析列聯(lián)表中行變量和列變量是否相互獨(dú)立H0:XX和XX之間是獨(dú)立的(不存在依賴關(guān)系)H1:XX和XX之間不獨(dú)立(存在依賴關(guān)系)X2的自由度=(R-1)(C-1)R是行合計(jì),C是列合計(jì)8、列聯(lián)表中的相關(guān)測量應(yīng)用場合:1、Φ相關(guān)系數(shù):描述2*2列聯(lián)表數(shù)據(jù)相關(guān)程度最常用的一種相關(guān)系數(shù)2、列聯(lián)相關(guān)系數(shù):主要用于大于2*2的列聯(lián)表的情況3、V相關(guān)系數(shù):對(duì)于同一個(gè)數(shù)據(jù),以上三個(gè)相關(guān)系數(shù)求出的結(jié)果不同思考題:1、簡述列聯(lián)表的構(gòu)造和列聯(lián)表的分布。(1)構(gòu)造:(2)分布:一、觀察值的分布(條件分布)二、百分比分布三、期望頻數(shù)的分布2、簡述Φ系數(shù)、c系數(shù)、V系數(shù)的各自特點(diǎn)(1)Φ系數(shù):A、主要用于2*2列聯(lián)表B、2*2列聯(lián)表中,數(shù)值位于0~1之間C、數(shù)值越大表明相關(guān)程度越強(qiáng)D、行數(shù)列數(shù)大于2后,系數(shù)值會(huì)隨行列數(shù)變大,且無上限(2)c系數(shù):A、主要用于2*2列聯(lián)表B、數(shù)值位于0~1之間C、數(shù)值越大表明相關(guān)程度越強(qiáng)D、相關(guān)系數(shù)的最大值與行列數(shù)的多少有關(guān),且隨著R和C的增大而增大E、當(dāng)列聯(lián)表中的兩個(gè)變量相互獨(dú)立時(shí),系數(shù)C=0,但它不可能大于1(3)V系數(shù):A、適用于所有列聯(lián)表B、數(shù)值位于0~1之間C、數(shù)值越大表明相關(guān)程度越強(qiáng)3、構(gòu)造下列維數(shù)的列聯(lián)表,并給出X2檢驗(yàn)的自由度。A、2行5列B、4行6列C、3行4列第十二章1、解釋多元回歸模型、多元回歸方程、估計(jì)的多元回歸方程的含義多元回歸模型是對(duì)統(tǒng)計(jì)關(guān)系進(jìn)行定量描述的一種數(shù)學(xué)模型。多元回歸方程是對(duì)變量之間統(tǒng)計(jì)關(guān)系進(jìn)行定量描述的一種數(shù)學(xué)表達(dá)式。指具有相關(guān)的隨機(jī)變量和固定變量之間關(guān)系的方程。主要有回歸直線方程。當(dāng)幾個(gè)變量有多重共線性時(shí),多元回歸分析得出的回歸方程,靠手算精確值計(jì)算量太大,所以只能得出估計(jì)值2、多元線性回歸模型中有哪些基本的假定。在多元線性回歸模型中,對(duì)誤差項(xiàng)ε同樣有三個(gè)基本的假定:①誤差項(xiàng)ε是一個(gè)期望值為0的隨機(jī)變量,即E(ε)=0。這意味著對(duì)于給定X1,X2…..Xk的值,y的期望值為E(y)=β0+β1X1+β2X2+……+βkXk。②對(duì)于自變量X1,X2,….Xk的所有值,ε的方差σ^2都相同。③誤差項(xiàng)ε是一個(gè)服從正態(tài)分布的隨機(jī)變量,且相互獨(dú)立,即ε~N(0,σ^2)。獨(dú)立性意味著自變量X1,X2......Xk的一組特定值所對(duì)應(yīng)的ε與X1,X2……Xk任意一組其他值所對(duì)應(yīng)的ε不相關(guān)。正態(tài)性意味著對(duì)于給定的X1,X2….Xk的值,因變量y也是一個(gè)服從正態(tài)分布的隨機(jī)變量。根據(jù)回歸模型的假定有:E(y)=β0+β1X1+β2X2+……+βkXk簡單版:

誤差項(xiàng)ε是一個(gè)期望值為0的隨機(jī)變量,即E(ε)=0

對(duì)于自變量x1,x2,…,xp的所有值,的方差2都相同

誤差項(xiàng)ε是一個(gè)服從正態(tài)分布的隨機(jī)變量,即ε~N(0,2),且相互獨(dú)立3、解釋多重判定系數(shù)和調(diào)整的多重判定系數(shù)的含義和作用。(1)多重判定系數(shù):是多元回歸中的回歸平方和占總平方和的比例,它是度量多元回歸方程擬合程度的一個(gè)統(tǒng)計(jì)量,反應(yīng)了在因變量y的變差中被估計(jì)的回

歸方程所解釋的比例。

(2)調(diào)

數(shù):用樣本容量n和自變量的個(gè)數(shù)k去調(diào)整R2

得到,這使得

Ra

2

的值永遠(yuǎn)小于

R2

Ra

2

的值不會(huì)由于模型中自變量個(gè)數(shù)的增加而越來越接近作用:避免增加自變量而高估多重判定系數(shù)(R2)。4、解釋多重共線性的含義當(dāng)回歸模型中兩個(gè)或兩個(gè)以上的自變量彼此相關(guān)時(shí),稱回歸模型中存在多重共線性。5、多重共線性對(duì)回歸分析有哪些影響?1、變量之間高度相關(guān)時(shí),可能會(huì)使回歸的結(jié)果混亂,甚至?xí)逊治鲆肫缤尽?、多重共線性可能對(duì)參數(shù)估計(jì)值的正負(fù)號(hào)產(chǎn)生影響,特別是βi的正負(fù)號(hào)有可能同預(yù)期的正負(fù)號(hào)相反。6、多重共線性的判別方法主要有哪些?其中最簡單的方法是計(jì)算模型中各對(duì)自變量之間的相關(guān)系數(shù),并對(duì)各相關(guān)系數(shù)進(jìn)行顯著性檢驗(yàn)。如果有一個(gè)或多個(gè)相關(guān)系數(shù)是顯著的,就表示模型中所使用的自變量之間相關(guān),因而存在多重共線性問題。具體來說,如果出現(xiàn)下列情況,暗示存在多重共線性:(1)模型中各對(duì)自變量之間顯著相關(guān)。

(2)當(dāng)模型的線性關(guān)系檢驗(yàn)(F檢驗(yàn))顯著時(shí),幾乎所有回歸系數(shù)βi的t檢驗(yàn)卻不顯著。

(3)回歸系數(shù)的正負(fù)號(hào)與預(yù)期的相反。

(4)容忍度與方差擴(kuò)大因子(VIF)。容忍度越小,多重共線性越嚴(yán)重,當(dāng)小于0.1時(shí),存在嚴(yán)重多重共線性。VIF越大,多重共線性越嚴(yán)重,一般認(rèn)為VIF大于10時(shí),存在嚴(yán)重多重共線性。

7、多重共線性的處理方法有哪些?(1)將一個(gè)或多個(gè)相關(guān)的自變量從模型中剔除,使保留的自變量盡可能不相關(guān)。(2)如果要在模型中保留所有的自變量,那就應(yīng)該:避免根據(jù)t統(tǒng)計(jì)量對(duì)單個(gè)參數(shù)β進(jìn)行檢驗(yàn)。對(duì)因變量y的推斷(估計(jì)或預(yù)測)限定在自變量樣本值的范圍內(nèi)。提綱:2、估計(jì)的多元線性回歸方程及參數(shù)的最小二乘估計(jì);參數(shù)的最小二乘估計(jì):回歸方程中的,,,···,仍然是根據(jù)最小二乘法求得,也就是使殘差平方和Q=最小。由此可以得到求解,,,···,的標(biāo)準(zhǔn)方程為:3、多重判定系數(shù)、估計(jì)標(biāo)準(zhǔn)誤差等概念;估計(jì)標(biāo)準(zhǔn)誤差:是對(duì)誤差項(xiàng)的方差的一個(gè)估計(jì)值,用于衡量多元回歸方程的擬合優(yōu)度計(jì)算公式:是根據(jù)自變量x1,x2,···,xk來預(yù)測因變量y時(shí)的平均預(yù)測誤差4、多元線性回歸方程的擬合優(yōu)度F檢驗(yàn);5、多元線性回歸方程參系數(shù)的顯著性t檢驗(yàn);6、多重共線性的概念、判別及其處理方法;概念:所謂多重共線性(Multicollinearity)是指線性回歸模型中的解釋變量之間由于存在精確相關(guān)關(guān)系或高度相關(guān)關(guān)系而使模型估計(jì)失真或難以估計(jì)準(zhǔn)確。一般來說,由于經(jīng)濟(jì)數(shù)據(jù)的限制使得模型設(shè)計(jì)不當(dāng),導(dǎo)致設(shè)計(jì)矩陣中解釋變量間存在普遍的相關(guān)關(guān)系。處理方法:(1)排除引起共線性的變量找出引起多重共線性的解釋變量,將它排除出去,以逐步回歸法得到最廣泛的應(yīng)用。(2)差分法時(shí)間序列數(shù)據(jù)、線性模型:將原模型變換為差分模型。減小參數(shù)估計(jì)量的方差:嶺回歸法(RidgeRegression)。第13章時(shí)間序列分析和預(yù)測1、時(shí)間序列組成要素及其分解;時(shí)間序列的構(gòu)成要素:趨勢(線性趨勢,非線性趨勢),季節(jié)性,周期性,隨機(jī)性趨勢:呈現(xiàn)出某種持續(xù)向上或持續(xù)下降的狀態(tài)或規(guī)律季節(jié)性:也稱季節(jié)變動(dòng),時(shí)間序列在一年內(nèi)重復(fù)出現(xiàn)的周期性波動(dòng)周期性:也稱循環(huán)波動(dòng),圍繞長期趨勢的一種波浪形或振蕩式變動(dòng)隨機(jī)性:也稱不規(guī)則波動(dòng),除去趨勢、周期性和季節(jié)性之后的偶然性波動(dòng)2、時(shí)間序列的圖形描述、增長率分析等描述性分析;圖形描述:P325-327增長率分析:P327-3293、增長率的計(jì)算和分析方法;環(huán)比增長率:報(bào)告期增長率與前一期水平之比減1:定基增長率:報(bào)告期水平與某一固定時(shí)期水平之比減1:平均增長率:序列中各逐期環(huán)比值的幾何平均數(shù)減1:4、時(shí)間序列預(yù)測的程序;第一步:確定時(shí)間序列所包含的成分,也就是確定時(shí)間序列的類型。第二步:找出適合此類時(shí)間序列的預(yù)測方法。

第三步:對(duì)可能的預(yù)測方法進(jìn)行評(píng)估,以確定最佳預(yù)測方案。

第四步:利用最佳預(yù)測方案進(jìn)行預(yù)測。

5、平穩(wěn)序列的含義及預(yù)測方法;含義:基本上不存在趨勢的序列,各觀察值基本上在某個(gè)固定的水平上波動(dòng)或雖有波動(dòng),但并不存在某種規(guī)律,而其波動(dòng)可以看成是隨機(jī)的

預(yù)測方法:簡單平均法、移動(dòng)平均法、指數(shù)平滑法P335-3386、含有線性趨勢、非線性趨勢的趨勢型序列的預(yù)測;①線性趨勢方程P341:線性模型法(a和b的求解方程)根據(jù)最小二乘法得到求解a和b的標(biāo)準(zhǔn)方程為:預(yù)測誤差可用估計(jì)標(biāo)準(zhǔn)誤差來衡量(m為未知常數(shù)個(gè)數(shù))②非線性趨勢包括指數(shù)曲線、多階曲線P343-345指數(shù)曲線:k階曲線函數(shù)形式7、季節(jié)型序列的預(yù)測;P3478、含有線性趨勢和季節(jié)成分的復(fù)合型序列的分解預(yù)測;第一步:確定并分離季節(jié)成分,計(jì)算季節(jié)指數(shù),以確定時(shí)間序列中的季節(jié)成分。然后將季節(jié)性因素從時(shí)間序列中分離出去,以便觀察和分析時(shí)間序列的其他特征。

第二步:對(duì)消除了季節(jié)成分的時(shí)間序列建立適當(dāng)預(yù)測模型,并進(jìn)行預(yù)測。

第三步:計(jì)算出最后的預(yù)測值。用預(yù)測值乘以相應(yīng)的季節(jié)指數(shù),得到最終的預(yù)測值

9、應(yīng)用Excel對(duì)時(shí)間序列進(jìn)行描述性分析及對(duì)不同成分時(shí)間序列進(jìn)行預(yù)測。P330-334第十四章什么是指數(shù),它的性質(zhì)、分類及編制中的問題指數(shù),或稱統(tǒng)計(jì)數(shù),是分析社會(huì)經(jīng)濟(jì)現(xiàn)象數(shù)量變化的一種重要統(tǒng)計(jì)方法指數(shù)是測定多項(xiàng)內(nèi)容數(shù)量綜合變動(dòng)的相對(duì)數(shù)。第一要點(diǎn):指數(shù)的實(shí)質(zhì)是測定多項(xiàng)內(nèi)容第二要點(diǎn):其表現(xiàn)形式為動(dòng)態(tài)相對(duì)數(shù)P363指數(shù)分類:①按照考察對(duì)象的范圍不同:還在于計(jì)算方法的不同個(gè)體指數(shù):考察總體中個(gè)別現(xiàn)象或個(gè)別項(xiàng)目數(shù)量變動(dòng)的相對(duì)數(shù)總指數(shù):綜合反映多種項(xiàng)目數(shù)量變動(dòng)的相對(duì)數(shù)②按照反映指標(biāo)的性質(zhì)不同:指標(biāo)指數(shù):反映數(shù)量指標(biāo)變動(dòng)程度的不同,常采用實(shí)物計(jì)量單位質(zhì)量指標(biāo)指數(shù):反映品質(zhì)指標(biāo)變動(dòng)程度的相對(duì)數(shù),常采用貨幣計(jì)量單位③按照計(jì)算形式不同:簡單指數(shù):把計(jì)入指數(shù)的各個(gè)項(xiàng)目的重要性視為相同加權(quán)指數(shù):對(duì)計(jì)入指數(shù)的各個(gè)項(xiàng)目依據(jù)重要程度賦予不同的權(quán)數(shù),

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論