




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
§3.6含有虛擬變量的多元線性回歸模型
一、含有虛擬變量的模型一、虛擬變量的引入二、虛擬變量的設(shè)置原則
§3.6含有虛擬變量的多元線性回歸模型一、含有虛擬變量1一、含有虛擬變量的模型一、含有虛擬變量的模型21、虛擬變量(dummyvariables)許多經(jīng)濟(jì)變量是可以定量度量。一些影響經(jīng)濟(jì)變量的因素是無法定量度量。為了在模型中能夠反映這些因素的影響,并提高模型的精度,需要將它們“量化”。這種“量化”通常是通過引入“虛擬變量”來完成的。根據(jù)這些因素的屬性類型,構(gòu)造只取“0”或“1”的人工變量,通常稱為虛擬變量,記為D。虛擬變量只作為解釋變量。1、虛擬變量(dummyvariables)許多經(jīng)濟(jì)變量是3一般地,在虛擬變量的設(shè)置中:
基礎(chǔ)類型、肯定類型取值為1;比較類型,否定類型取值為0。例如,反映文程度的虛擬變量可取為:D=1,本科學(xué)歷D=0,非本科學(xué)歷虛擬變量能否取1、0以外的數(shù)值?一般地,在虛擬變量的設(shè)置中:42、虛擬變量模型同時(shí)含有一般解釋變量與虛擬變量的模型稱為虛擬變量模型或者方差分析(analysis-ofvariance:ANOVA)模型。例如,一個(gè)以性別為虛擬變量考察企業(yè)職工薪金的模型:其中:Yi為企業(yè)職工的薪金;Xi為工齡;Di=1,若是男性,Di=0,若是女性。2、虛擬變量模型同時(shí)含有一般解釋變量與虛擬變量的模型稱為虛擬5二、虛擬變量的引入二、虛擬變量的引入61、加法方式虛擬變量作為解釋變量引入模型有兩種基本方式:加法方式和乘法方式。上述企業(yè)職工薪金模型中性別虛擬變量的引入采取了加法方式。在該模型中,如果仍假定E(i)=0,則企業(yè)男、女職工的平均薪金為:1、加法方式虛擬變量作為解釋變量引入模型有兩種基本方式:加法7假定2>0,則兩個(gè)函數(shù)有相同的斜率,但有不同的截距。意即,男女職工平均薪金對(duì)工齡的變化率是一樣的,但兩者的平均薪金水平相差2??梢酝ㄟ^對(duì)2的統(tǒng)計(jì)顯著性進(jìn)行檢驗(yàn),以判斷企業(yè)男女職工的平均薪金水平是否有顯著差異。02假定2>0,則兩個(gè)函數(shù)有相同的斜率,但有不同的截距。意即,8將上例中的性別換成教育水平,教育水平考慮三個(gè)層次:高中以下、高中、大學(xué)及其以上。高中以下高中大學(xué)及以上將上例中的性別換成教育水平,教育水平考慮三個(gè)層次:高中以下、9在上例中同時(shí)引入性別和教育水平:在上例中同時(shí)引入性別和教育水平:10女職工本科以下學(xué)歷的平均薪金:女職工本科以上學(xué)歷的平均薪金:男職工本科以下學(xué)歷的平均薪金:男職工本科以上學(xué)歷的平均薪金:女職工本科以下學(xué)歷的平均薪金:女職工本科以上學(xué)歷的平均薪金:112、乘法方式加法方式引入虛擬變量,考察:截距的不同。許多情況下,斜率發(fā)生變化,或斜率、截距同時(shí)發(fā)生變化。斜率的變化可通過以乘法的方式引入虛擬變量來測度。2、乘法方式加法方式引入虛擬變量,考察:截距的不同。12例如,根據(jù)消費(fèi)理論,收入決定消費(fèi)。但是,農(nóng)村居民和城鎮(zhèn)居民的邊際消費(fèi)傾向往往是不同的。這種消費(fèi)傾向的不同可通過在消費(fèi)函數(shù)中引入虛擬變量來考察。農(nóng)村居民:城鎮(zhèn)居民:例如,根據(jù)消費(fèi)理論,收入決定消費(fèi)。但是,農(nóng)村居民和城鎮(zhèn)居民的133、同時(shí)引入加法與乘法形式的虛擬變量當(dāng)截距與斜率發(fā)生變化時(shí),則需要同時(shí)引入加法與乘法形式的虛擬變量。對(duì)于一元模型,有兩組樣本,則有可能出現(xiàn)下述四種情況中的一種:
1=1,且2=2,即兩個(gè)回歸相同,稱為重合回歸(CoincidentRegressions);11,但2=2,即兩個(gè)回歸的差異僅在其截距,稱為平行回歸(ParallelRegressions);1=1,但22,即兩個(gè)回歸的差異僅在其斜率,稱為匯合回歸(ConcurrentRegressions);11,且22,即兩個(gè)回歸完全不同,稱為相異回歸(DissimilarRegressions)。3、同時(shí)引入加法與乘法形式的虛擬變量當(dāng)截距與斜率發(fā)生變化時(shí),144、例題判斷中國農(nóng)村居民與城鎮(zhèn)居民的消費(fèi)行為是否有顯著差異。被解釋變量:居民家庭人均生活消費(fèi)支出Y解釋變量:居民家庭人均工資收入X1、其他收入X2樣本:2013年31個(gè)地區(qū)農(nóng)村居民與城鎮(zhèn)居民人均數(shù)據(jù)虛擬變量Di:農(nóng)村居民取值1,城鎮(zhèn)居民取值0
4、例題判斷中國農(nóng)村居民與城鎮(zhèn)居民的消費(fèi)行為是否有顯著差異。15由變量顯著性檢驗(yàn)得到:在10%的顯著性水平下,Di和DiXi1是顯著的,而DiXi2不顯著。因此:2013年農(nóng)村居民的平均消費(fèi)支出要比城鎮(zhèn)居民少1573.9元;在其他條件不變的情況下,農(nóng)村居民與城鎮(zhèn)居民的工資收入都增加100元時(shí),農(nóng)村居民要比城鎮(zhèn)居民多支出19元用于生活消費(fèi);農(nóng)村居民與城鎮(zhèn)居民在其他收入方面有相同的增加量時(shí),兩者增加的消費(fèi)支出沒有顯著差異。總體回歸模型樣本回歸函數(shù)由變量顯著性檢驗(yàn)得到:在10%的顯著性水平下,Di和DiXi16三、虛擬變量的設(shè)置原則三、虛擬變量的設(shè)置原則17每一定性變量(qualitativevariable)所需的虛擬變量個(gè)數(shù)要比該定性變量的狀態(tài)類別數(shù)(categories)少1。即如果有m種狀態(tài),只在模型中引入m-1個(gè)虛擬變量。例如,季節(jié)定性變量有春、夏、秋、冬4種狀態(tài),只需要設(shè)置3個(gè)虛變量:
如果設(shè)置第4個(gè)虛變量,則出現(xiàn)“虛擬變量陷井”(DummyVariableTrap)。為什么?每一定性變量(qualitativevariable)所需18例如:包含季節(jié)變量的正確模型:解釋變量完全共線性錯(cuò)誤模型例如:包含季節(jié)變量的正確模型:解釋變量完全共線性錯(cuò)誤模型19如果在服裝需求函數(shù)模型中必須包含3個(gè)定性變量:季節(jié)(4種狀態(tài))、性別(2種狀態(tài))、職業(yè)(5種狀態(tài)),應(yīng)該設(shè)置多少虛變量?模型含常數(shù)項(xiàng)模型不含常數(shù)項(xiàng)如果在服裝需求函數(shù)模型中必須包含3個(gè)定性變量:季節(jié)(4種狀態(tài)20討論:定序定性變量可否按照狀態(tài)賦值?例如:表示居民對(duì)某種服務(wù)的滿意程度,分5種狀態(tài):非常不滿意、一般不滿意、無所謂、一般滿意、非常滿意。在模型中按照狀態(tài)分別賦值0、1、2、3、4或者-2、-1、0、1、2。被經(jīng)常采用,尤其在管理學(xué)、社會(huì)學(xué)研究領(lǐng)域。正確的方法:設(shè)置多個(gè)虛擬變量,理論上正確,帶來自由度損失。以定性變量為研究對(duì)象,構(gòu)造多元排序離散選擇模型,然后以模型結(jié)果對(duì)定性變量的各種狀態(tài)賦值。但需要更多的信息支持。賦值的方法等于是對(duì)虛變量方法中的各個(gè)虛變量的參數(shù)施加了約束,而這種約束經(jīng)常被檢驗(yàn)為錯(cuò)誤的。討論:定序定性變量可否按照狀態(tài)賦值?例如:表示居民對(duì)某種服務(wù)21§3.6含有虛擬變量的多元線性回歸模型
一、含有虛擬變量的模型一、虛擬變量的引入二、虛擬變量的設(shè)置原則
§3.6含有虛擬變量的多元線性回歸模型一、含有虛擬變量22一、含有虛擬變量的模型一、含有虛擬變量的模型231、虛擬變量(dummyvariables)許多經(jīng)濟(jì)變量是可以定量度量。一些影響經(jīng)濟(jì)變量的因素是無法定量度量。為了在模型中能夠反映這些因素的影響,并提高模型的精度,需要將它們“量化”。這種“量化”通常是通過引入“虛擬變量”來完成的。根據(jù)這些因素的屬性類型,構(gòu)造只取“0”或“1”的人工變量,通常稱為虛擬變量,記為D。虛擬變量只作為解釋變量。1、虛擬變量(dummyvariables)許多經(jīng)濟(jì)變量是24一般地,在虛擬變量的設(shè)置中:
基礎(chǔ)類型、肯定類型取值為1;比較類型,否定類型取值為0。例如,反映文程度的虛擬變量可取為:D=1,本科學(xué)歷D=0,非本科學(xué)歷虛擬變量能否取1、0以外的數(shù)值?一般地,在虛擬變量的設(shè)置中:252、虛擬變量模型同時(shí)含有一般解釋變量與虛擬變量的模型稱為虛擬變量模型或者方差分析(analysis-ofvariance:ANOVA)模型。例如,一個(gè)以性別為虛擬變量考察企業(yè)職工薪金的模型:其中:Yi為企業(yè)職工的薪金;Xi為工齡;Di=1,若是男性,Di=0,若是女性。2、虛擬變量模型同時(shí)含有一般解釋變量與虛擬變量的模型稱為虛擬26二、虛擬變量的引入二、虛擬變量的引入271、加法方式虛擬變量作為解釋變量引入模型有兩種基本方式:加法方式和乘法方式。上述企業(yè)職工薪金模型中性別虛擬變量的引入采取了加法方式。在該模型中,如果仍假定E(i)=0,則企業(yè)男、女職工的平均薪金為:1、加法方式虛擬變量作為解釋變量引入模型有兩種基本方式:加法28假定2>0,則兩個(gè)函數(shù)有相同的斜率,但有不同的截距。意即,男女職工平均薪金對(duì)工齡的變化率是一樣的,但兩者的平均薪金水平相差2??梢酝ㄟ^對(duì)2的統(tǒng)計(jì)顯著性進(jìn)行檢驗(yàn),以判斷企業(yè)男女職工的平均薪金水平是否有顯著差異。02假定2>0,則兩個(gè)函數(shù)有相同的斜率,但有不同的截距。意即,29將上例中的性別換成教育水平,教育水平考慮三個(gè)層次:高中以下、高中、大學(xué)及其以上。高中以下高中大學(xué)及以上將上例中的性別換成教育水平,教育水平考慮三個(gè)層次:高中以下、30在上例中同時(shí)引入性別和教育水平:在上例中同時(shí)引入性別和教育水平:31女職工本科以下學(xué)歷的平均薪金:女職工本科以上學(xué)歷的平均薪金:男職工本科以下學(xué)歷的平均薪金:男職工本科以上學(xué)歷的平均薪金:女職工本科以下學(xué)歷的平均薪金:女職工本科以上學(xué)歷的平均薪金:322、乘法方式加法方式引入虛擬變量,考察:截距的不同。許多情況下,斜率發(fā)生變化,或斜率、截距同時(shí)發(fā)生變化。斜率的變化可通過以乘法的方式引入虛擬變量來測度。2、乘法方式加法方式引入虛擬變量,考察:截距的不同。33例如,根據(jù)消費(fèi)理論,收入決定消費(fèi)。但是,農(nóng)村居民和城鎮(zhèn)居民的邊際消費(fèi)傾向往往是不同的。這種消費(fèi)傾向的不同可通過在消費(fèi)函數(shù)中引入虛擬變量來考察。農(nóng)村居民:城鎮(zhèn)居民:例如,根據(jù)消費(fèi)理論,收入決定消費(fèi)。但是,農(nóng)村居民和城鎮(zhèn)居民的343、同時(shí)引入加法與乘法形式的虛擬變量當(dāng)截距與斜率發(fā)生變化時(shí),則需要同時(shí)引入加法與乘法形式的虛擬變量。對(duì)于一元模型,有兩組樣本,則有可能出現(xiàn)下述四種情況中的一種:
1=1,且2=2,即兩個(gè)回歸相同,稱為重合回歸(CoincidentRegressions);11,但2=2,即兩個(gè)回歸的差異僅在其截距,稱為平行回歸(ParallelRegressions);1=1,但22,即兩個(gè)回歸的差異僅在其斜率,稱為匯合回歸(ConcurrentRegressions);11,且22,即兩個(gè)回歸完全不同,稱為相異回歸(DissimilarRegressions)。3、同時(shí)引入加法與乘法形式的虛擬變量當(dāng)截距與斜率發(fā)生變化時(shí),354、例題判斷中國農(nóng)村居民與城鎮(zhèn)居民的消費(fèi)行為是否有顯著差異。被解釋變量:居民家庭人均生活消費(fèi)支出Y解釋變量:居民家庭人均工資收入X1、其他收入X2樣本:2013年31個(gè)地區(qū)農(nóng)村居民與城鎮(zhèn)居民人均數(shù)據(jù)虛擬變量Di:農(nóng)村居民取值1,城鎮(zhèn)居民取值0
4、例題判斷中國農(nóng)村居民與城鎮(zhèn)居民的消費(fèi)行為是否有顯著差異。36由變量顯著性檢驗(yàn)得到:在10%的顯著性水平下,Di和DiXi1是顯著的,而DiXi2不顯著。因此:2013年農(nóng)村居民的平均消費(fèi)支出要比城鎮(zhèn)居民少1573.9元;在其他條件不變的情況下,農(nóng)村居民與城鎮(zhèn)居民的工資收入都增加100元時(shí),農(nóng)村居民要比城鎮(zhèn)居民多支出19元用于生活消費(fèi);農(nóng)村居民與城鎮(zhèn)居民在其他收入方面有相同的增加量時(shí),兩者增加的消費(fèi)支出沒有顯著差異??傮w回歸模型樣本回歸函數(shù)由變量顯著性檢驗(yàn)得到:在10%的顯著性水平下,Di和DiXi37三、虛擬變量的設(shè)置原則三、虛擬變量的設(shè)置原則38每一定性變量(qualitativevariable)所需的虛擬變量個(gè)數(shù)要比該定性變量的狀態(tài)類別數(shù)(categories)少1。即如果有m種狀態(tài),只在模型中引入m-1個(gè)虛擬變量。例如,季節(jié)定性變量有春、夏、秋、冬4種狀態(tài),只需要設(shè)置3個(gè)虛變量:
如果設(shè)置第4個(gè)虛變量,則出現(xiàn)“虛擬變量陷井”(DummyVariableTrap)。為什么?每一定性變量(qualitativevariable)所需39例如:包含季節(jié)變量的正確模型:解釋變量完全共線性錯(cuò)誤模型例如:包含季節(jié)變量的正確模型:解釋變量完全共線性錯(cuò)誤模型40如果在服裝需求函數(shù)模型中必須包含3個(gè)定性變量:季節(jié)(4種狀態(tài))、性別(2種狀態(tài))、職業(yè)(5種狀態(tài)),應(yīng)該設(shè)置多少虛變量?模型含常數(shù)項(xiàng)模型不含常數(shù)項(xiàng)如果在服裝需求函數(shù)模型中必須包含3個(gè)定性變量:季節(jié)(4種狀態(tài)41
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 院校進(jìn)修培訓(xùn)協(xié)議書
- 軟件代理銷售協(xié)議書
- 小學(xué)衛(wèi)生承包協(xié)議書
- 食堂搭伙管理協(xié)議書
- 資產(chǎn)管理協(xié)議書范本
- 事故之后和解協(xié)議書
- 口頭協(xié)議書補(bǔ)償標(biāo)準(zhǔn)
- 爺爺撫養(yǎng)孫子協(xié)議書
- 簡單安全承包協(xié)議書
- 糧食買賣對(duì)接協(xié)議書
- 人教版五年級(jí)數(shù)學(xué)下冊(cè)第七單元《折線統(tǒng)計(jì)圖》(教學(xué)設(shè)計(jì))
- 金鏟鏟之戰(zhàn)教程
- 青春期生殖保健知識(shí)講座
- 紀(jì)檢辦案培訓(xùn)課件
- 核事故現(xiàn)場處置和救援方案
- 機(jī)房吸音墻施工方案范本
- 高考語文小說專題閱讀(9)2019年新高考I卷《理水》原文+真題+答案+解析
- 第7課《大雁歸來》課件(共14張)語文八年級(jí)下冊(cè)
- 江蘇省蘇州市蘇州地區(qū)校2024屆中考一模數(shù)學(xué)試題含解析
- 車棚施工方案
評(píng)論
0/150
提交評(píng)論