《管理定量分析:方法與技術(第三版)》課件 第6、7章 變量間關系研究:相關與回歸分析、時間序列分析_第1頁
《管理定量分析:方法與技術(第三版)》課件 第6、7章 變量間關系研究:相關與回歸分析、時間序列分析_第2頁
《管理定量分析:方法與技術(第三版)》課件 第6、7章 變量間關系研究:相關與回歸分析、時間序列分析_第3頁
《管理定量分析:方法與技術(第三版)》課件 第6、7章 變量間關系研究:相關與回歸分析、時間序列分析_第4頁
《管理定量分析:方法與技術(第三版)》課件 第6、7章 變量間關系研究:相關與回歸分析、時間序列分析_第5頁
已閱讀5頁,還剩88頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第6章變量間關系研究:相關與回歸分析引例世界上的事物或多或少存在著某種聯(lián)系。例如:吸煙和人的健康之間受教育程度與收入水平之間課程考核次數(shù)和學生對知識的掌握程度之間公路上汽車的平均車速是否與那段公路上巡邏車的數(shù)量之間這種聯(lián)系可分為兩類:函數(shù)關系與相關關系6.1相關分析㈠函數(shù)關系(二)相關關系相關關系是指現(xiàn)象之間確實存在依存關系,但這種關系不確定不嚴格。例如:身高與體重之間,存在一定的依存關系。但是體重除了與身高有關外,還受年齡、性別、區(qū)域、種族等因素影響。身高與體重并無嚴格的對應關系,同一身高的人,體重大多數(shù)情況下是不相等的。但即便如此,這兩個變量之間仍舊存在一定的規(guī)律性,在一般條件下,身高越高,體重越大。相關關系的種類㈠按相關關系涉及的變量多少來劃分,可分為單相關和復相關㈡按相關的方向分,可分為正相關和負相關㈢按相關的表現(xiàn)形式分,分為線性相關(直線相關)和非線性相關(曲線相關)㈣按照相關的密切程度分,分為完全相關、不完全相關和無相關變量間關系的密切程度一般用相關系數(shù)r衡量6.2回歸分析相關分析可以說明變量間相關關系的方向和程度,但是卻不能說明變量之間具體的數(shù)量因果關系。當自變量給出一個數(shù)值時,因變量可能取值是多少,這是相關分析不能解決的。這需要通過新的方法,即回歸分析。例如,交警隊隊長認為,高速公路路段上汽車的平均車速與在該路段上的巡邏車數(shù)有關。于是,他專門派人進行測試,試圖證實這一假設。測試連續(xù)進行了60天。隨機抽取了5天的測試結果列在表6—2中。主講人:劉蘭劍公路上的巡邏車數(shù)和該路段上汽車平均車速的例子中,能繪出一條描述這兩個變量之間關系的直線。直線因斜率不同而不同斜率斜率(第一個決定直線的要素):相對于點在直線上移動的水平距離,點在直線上上升或下降的距離。主講人:劉蘭劍截距截距:直線與y軸的交點(第二個決定直線的要素)。截距常用α表示因此有時候同樣的散點圖上可以配上多條斜率不同的直線,哪一條才是最優(yōu)的呢?

根據(jù)最小二乘法則,可以確定回歸方程的兩個系數(shù):回歸方程的應用第一,當6輛巡邏車在執(zhí)勤時,公路上汽車的平均車速是多少?第二,7量巡邏車呢?第三,一輛巡邏車也沒有呢?6輛警車和7輛警車對車速的影響有多少差距?擬合優(yōu)度的測度有三種擬合優(yōu)度的測度方法㈠估計標準誤差

剩余剩余離差利用如下公式可以進行任意一點預測值的區(qū)間估計假定交通警察想預測當3輛巡邏車在公路上時汽車的平均車速時,利用回歸方程,有Y=72.2-2.55×3=72.2-7.65=64.55當有3輛巡邏車在公路上時,我們有90%的把握確定車速在60.28公里/小時——

68.82公里/小時之間。㈡判定系數(shù)㈢斜率的標準誤差

巡邏車與車速關系問題的斜率t檢驗

巡邏車與車速關系問題回歸系數(shù)的區(qū)間估計~6.3線性回歸的假定上述內(nèi)容并沒有討論線性回歸的假定和限制條件。許多分析人員經(jīng)常忽視這些假定,這樣做確實冒著一定的決策風險。只要任何一個假定被違背,上面的處理結果就會變得不可信。假定1:對所有的X值,Y的預測值的誤差服從均值為0的標準正態(tài)分布。假定1要求每一個Y的估計值與真實值相減而形成的一列數(shù)(誤差項)服從標準正態(tài)分布。假定2無論X為何值,誤差項的方差都為常數(shù)。異方差的處理異方差的檢驗有圖示法及解析法。檢驗異方差的解析方法的共同思想是,由于不同的觀察值隨機誤差項具有不同的方差,因此檢驗異方差的主要問題是判斷隨機誤差項的方差與解釋變量之間的相關性。如果相關,則存在異方差,反之沒有。異方差的修正方法有加權最小二乘法和模型對數(shù)變換法等,其基本思路是變異方差為同方差,或者盡量緩解方差變異的程度。假定3:誤差相互獨立。這個假定的另一種說法是,一個誤差的大小不是任何從前誤差的函數(shù)。如果殘差相互之間是隨機的,誤差就是相互獨立的。誤差不獨立就存在自相關問題。自相關不是指兩個或兩個以上的變量之間的相關關系,而是指一個變量前后期數(shù)值之間存在的相關關系。存在自相關的數(shù)據(jù)用以上回歸方法得出的結論是不可靠的。自相關發(fā)生在時間序列分析中。自相關性產(chǎn)生的原因有以下幾種:第一,所建模型遺漏關鍵變量會產(chǎn)生序列的自相關性。第二,經(jīng)濟變量的滯后性會給序列帶來自相關性。第三,采用錯誤的回歸函數(shù)形式也可能引起自相關性。第四,蛛網(wǎng)現(xiàn)象可能帶來序列的自相關性。第五,因?qū)?shù)據(jù)加工整理而導致誤差項之間產(chǎn)生自相關性自相關一般用圖示檢驗法或D-W檢驗來檢測。假定4:自變量和因變量都必須是定距變量。定類和定序變量對回歸分析是個問題,但并不是不可克服的。從技術上來講,回歸需要定距層次的數(shù)據(jù)。然而,通過將數(shù)字1,2,3等簡單地分派給有順序的分類,定序數(shù)據(jù)就常常在回歸分析中使用。對于定類變量,不能簡單地分派數(shù)字給變量的類別,可以通過構造虛擬變量(dummyvariable)將定類變量納入回歸中。一個例子某企業(yè)的負責人想確定品牌A和品牌B的機器中哪種品牌的效率更高。他將每一品牌的3臺機器在同等條件的車間中進行了測試,測試結果見表計算回歸方程并檢驗顯著性定類因變量回歸的一個例子某一單位的人事處對將被錄用的10個求職者的打字速度進行了測試。1年后,這些打字員中的5個被解雇。人事主管假設打字員被解雇是因打字速度太慢。工作境遇和打字速度列在表中。假定5:變量間關系是線性的。對數(shù)關系二次曲線關系三次曲線關系關鍵術語相關關系相關系數(shù)擬合優(yōu)度線性相關非線性相關估計的標準誤差判定系數(shù)

本章到此結束!

謝謝各位!管理定量分析長安大學:劉蘭劍第7章時間序列分析引例某一城市從2012年到2021年中,每年參加體育鍛煉的人口數(shù),排列起來,共有10個數(shù)據(jù)構成一個時間序列。人們希望用某個數(shù)學模型,根據(jù)這10個歷史數(shù)據(jù),來預測2022年或以后若干年中每年的體育鍛煉人數(shù)是多少,以便于該城市制訂一個有關體育健身的發(fā)展戰(zhàn)略。年份參加鍛煉人數(shù)(萬人)20121500201318502014123020151639201616002017199320181995201920302020201120212050對一些與管理有關的變量的未來狀態(tài)進行估計被稱為預測(forcasting)。依據(jù)數(shù)據(jù)進行預測的主要技術是時間序列分析(timeseriesanalysis)。本章將介紹幾種時間序列分析技術:首先,介紹時間序列分析的一般原則;其次,介紹簡單的時間序列線性回歸模型;其后,介紹一種更為常見的對數(shù)回歸模型;再次,介紹這些模型的預測能力;最后,討論二元時間序列模型。7.1時間序列簡介時間序列分析(Timeseriesanalysis)是一種動態(tài)數(shù)據(jù)處理的統(tǒng)計方法。時間序列分析是根據(jù)系統(tǒng)觀測得到的時間序列數(shù)據(jù),通過曲線擬合和參數(shù)估計來建立數(shù)學模型的理論和方法進行處理。時間序列分析法作為一種常用的預測手段被廣泛應用。在二次大戰(zhàn)中和戰(zhàn)后,在軍事科學、空間科學、氣象預報和工業(yè)自動化等部門的應用更加廣泛。當前,時間序列分析常用在國民經(jīng)濟宏觀控制、區(qū)域綜合發(fā)展規(guī)劃、企業(yè)經(jīng)營管理、市場潛量預測、氣象預報、水文預報、地震前兆預報、農(nóng)作物病蟲災害預報、環(huán)境污染控制、生態(tài)平衡、天文學和海洋學等方面。7.2時間序列分析方法時間序列分析有六個基本步驟。第一,繪制數(shù)據(jù)的散點圖。第二,檢驗散點圖并確定是否存在短期波動。第三,如果數(shù)據(jù)表明有短期波動,確定短期波動的長度并剔除這個趨勢。第四,確定時間與分析變量之間是否存在某種關系。第五,利用線性回歸來估計時間與分析變量之間的關系。第六,根據(jù)回歸方程進行預測。7.2.1沒有波動的預測望山市人力資源與社會保障局需要預測今后5年每年大致的公務員人數(shù)。首席人力資源分析師王女士所掌握的唯一的信息是該市2008年以來的公務員人數(shù)。數(shù)據(jù)見表:年份公務員人數(shù)(千人)200835.7200938.8201040.9201143.4201244.9201347.2201448.8201550.8201650.8201750.7201855.0201955.3202058.6202159.9步驟1:繪制數(shù)據(jù)的散點圖。就業(yè)應被視為因變量,年份應被視為自變量,見圖7-3。步驟2檢驗數(shù)據(jù)散點圖,確定是否存在短期波動。數(shù)據(jù)表明沒有明顯的短期波動,因此跳至步驟4。步驟3如果數(shù)據(jù)表明存在周期趨勢,如缺勤數(shù)量顯示的那樣,就有必要確定短期趨勢的長度。利用這個長度(L),構造一個L項移動平均模型。步驟4確定變量間是否有關。根據(jù)圖7-3,可以識別出時間與望山市公務員人數(shù)之間存在一個正的線性關系。步驟5:利用線性回歸估計時間與分析變量之間的關系。

為此,把第一年(2008)記為1,第二年記為2,依此類推。重新計數(shù)之后,得到如下數(shù)據(jù)集:步驟6

利用回歸方程,對今后5年的就業(yè)進行預測。

由于2021年相當于X的值等于14,因此2022年,即預測的第一年,其X值等于15。把15代入回歸方程,得到:

我們對望山市2022年就業(yè)的最好的估計是61640人。根據(jù)估計的標準誤差,到均值的距離的修正項,以及自由度為12、置信度為90%的t值,我們可以得到這個估計值的90%置信區(qū)間:對望山市2023年、2024年、2025年和2026年的就業(yè)預測如下:年份

X×b202316×1.7327.68+35.69=63.37202417×1.7329.41+35.69=65.10202518×1.7331.14+35.69=66.83202619×1.7332.87+35.69=68.567.2.2一種指數(shù)趨勢的預測案例:望山市財政局的首席預算員李先生需要對本市下一年度的收入進行預測。他想測算未來5年的收入減去支出之后的盈余能否足夠建設一個預算100萬元的公共游樂場。望山市2021年的支出預算是2100萬元,估計今后5年每年的支出將以7%的速度增長,在過去的收入趨勢今后仍將繼續(xù)的假定下,望山市今后5年能夠積累起100萬元的超額收入嗎?(2021年節(jié)余的收入不能作為100萬元的一部分)收入數(shù)據(jù)見表7-3。年份收入(萬元)2008678200967920107432011837201294920139822014108120151205201613172017141620181479201916372020196820212138表7-3望山市2008-2021年財政收入表7-4望山市2021-2026年計劃支出年份支出(萬元)20212100(實際數(shù)字)2022224720232404202425732025275320262945根據(jù)表7-3繪制的散點圖見圖7-4。通過散點圖可以發(fā)現(xiàn),圖中沒有明顯的短期波動,因此李先生假定不存在短期波動。利用線性回歸,李先生估計了線性方程。為此,他把2008年轉(zhuǎn)換為1,其后的年份依次類推(2021年為14)。他估計了如下的回歸線:年份X×b202215×108.11621.5+412=2033.5202316×108.11729.6+412=2141.6202417×108.11837.7+412=2249.7202518×108.11945.8+412=2357.8202619×108.12053.9+412=2465.9利用回歸方程,李先生預測了2022-2026年望山市的財政收入:如果把回歸斜率轉(zhuǎn)換為反對數(shù)(在本例中,0.0389的反對數(shù)為1.094),再將反對數(shù)減去1,結果就是Y每年增長的百分比。1.094-1.0=0.094或9.4%望山市收入年增長率為9.4%。年份X×b202215×0.03890.584+2.767=3.351202316×0.03890.622+2.767=3.389202417×0.03890.661+2.767=3.428202518×0.03890.700+2.767=3.467202619×0.03890.739+2.767=3.506要用對數(shù)回歸模型預測市收入,先按照一般的程序求得收入的對數(shù)預測值。年份預測收入(萬元)20223.351224120233.389245120243.428268120253.467293220263.5063207表7-7把

轉(zhuǎn)換為收入年份收入(萬元)支出(萬元)盈余(萬元)202222412247﹣620232451240447202426812573108202529322753179202632072945262表7-8新回歸方程下的收入與支出對比表7.2.3一種有短期波動的預測某局機關的缺勤率一直比較高,而且呈一定的規(guī)律出現(xiàn),為了降低缺勤率,該局提出了新的考勤辦法。下圖顯示了新的考勤辦法公布之后的6周內(nèi)工作人員的缺勤數(shù)量。請根據(jù)數(shù)據(jù)分析該考勤辦法有沒有效果。

7.2.4二元預測在前面的例子中,自變量都是時間。其實,在一些預測中,自變量可以不是時間,這樣的預測稱為二元預測。案例未央?yún)^(qū)是位于長安市北部的一個區(qū)。張先生是未央污水處理廠的經(jīng)理,他希望對今后5年中工廠每天需要處理的污水量進行預測。未央污水處理廠的處理能力為每天處理500萬噸污水。目前,廠里每天處理375萬噸污水。擴建工廠需要4年時間(籌措資金,政府授權,建造和測試)。為此,張先生需要預測未來對污水處理廠的需求量。如果今后5年中,每天需求超過500萬噸,張先生現(xiàn)在就必須著手擴建工廠。分析因為未央?yún)^(qū)是一個沒有工業(yè)且商業(yè)設施也很少的近郊區(qū),因此污水量主要與未央?yún)^(qū)的住戶有關。張先生發(fā)現(xiàn)通過把未央?yún)^(qū)現(xiàn)有房屋數(shù)量與頒發(fā)的新房建筑許可數(shù)量的90%(之所以用90%,是因為得到許可的新房中有10%尚未建好)合并起來,就可以準確地預測下一年的污水處理需求量。張先生搜集的數(shù)據(jù)見表7-9。表7-9未央?yún)^(qū)污水排放及房屋建設數(shù)據(jù)年份每天的污水噸數(shù)(萬噸)房屋數(shù)(萬套)新房建筑許可數(shù)(萬套)下一年預計房屋數(shù)(萬套)200811003001370200915813701501505201018815005702013201119220006002540201223025105112970201323430007543679201425237003103979201528540506804662201629346203184906201731548858155619201833555005105959201935360406036583202035865805907111202137571504757578預測把2022年的預測房屋數(shù)(7578)代入X,張先生得到2022年的預測污水處理量如下:區(qū)間估計年份X×b20237983×0.0367293.0+125.2=418.220248388×0.0367307.8+125.2=433.020258793×0.0367322.7+125.2=447.920269198×0.0367337.6+125.2=462.8用同樣的方法,對未來幾年的污水處理數(shù)量進行預測:哪一年將超過500?出于計劃的需要,區(qū)長還想知道到哪一年需求量將超過500萬噸。張先生將

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論