版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、1回歸分析 本章主要內(nèi)容:本章主要內(nèi)容:8.1 回歸分析概述8.2 一元線性回歸8.3 曲線回歸8.4 多元線性回歸本章內(nèi)容重點(diǎn):本章內(nèi)容重點(diǎn):最小二乘法的原理;回歸方程和回歸系數(shù)的顯著性檢驗(yàn);多元線性回歸及其預(yù)測(cè)和控制;軟件的求解分析。 2回歸分析的起源(回歸分析的起源(1) 英國(guó)統(tǒng)計(jì)學(xué)家英國(guó)統(tǒng)計(jì)學(xué)家F F高爾頓和皮爾遜在研究父母身高爾頓和皮爾遜在研究父母身高與其子女身高的遺傳問(wèn)題時(shí),觀察了高與其子女身高的遺傳問(wèn)題時(shí),觀察了10781078對(duì)夫婦,對(duì)夫婦,以每對(duì)夫婦的平均身高作為以每對(duì)夫婦的平均身高作為x x,而取他們的一個(gè)成年,而取他們的一個(gè)成年兒子的身高作為兒子的身高作為y y,將結(jié)果在
2、平面直角坐標(biāo)系上繪成,將結(jié)果在平面直角坐標(biāo)系上繪成散點(diǎn)圖,發(fā)現(xiàn)趨勢(shì)近乎一條直線。并計(jì)算出的回歸散點(diǎn)圖,發(fā)現(xiàn)趨勢(shì)近乎一條直線。并計(jì)算出的回歸直線方程為直線方程為 33.730.516yx回歸分析的起源(回歸分析的起源(2)研究結(jié)果表明研究結(jié)果表明一群高個(gè)子父輩的兒子們?cè)谕g人中平均僅為略高一群高個(gè)子父輩的兒子們?cè)谕g人中平均僅為略高個(gè)子,一群矮個(gè)子父輩的兒子們?cè)谕g人中平均個(gè)子,一群矮個(gè)子父輩的兒子們?cè)谕g人中平均僅為略矮個(gè)子,即子代的平均高度向中心僅為略矮個(gè)子,即子代的平均高度向中心“回歸回歸”了。這一趨勢(shì)現(xiàn)在被稱作了。這一趨勢(shì)現(xiàn)在被稱作“回歸效應(yīng)回歸效應(yīng)”。回歸分析的起源(回歸分析的起源(3
3、)后來(lái),人們發(fā)現(xiàn)它的應(yīng)用很廣,而不局限于身高后來(lái),人們發(fā)現(xiàn)它的應(yīng)用很廣,而不局限于身高的遺傳問(wèn)題。的遺傳問(wèn)題。如,在第一次考試中成績(jī)最差的那些學(xué)生在第如,在第一次考試中成績(jī)最差的那些學(xué)生在第二次考試中傾向于有更好的成績(jī)二次考試中傾向于有更好的成績(jī)( (比較接近所比較接近所有學(xué)生的平均成績(jī)有學(xué)生的平均成績(jī)) ),而第一次考試中成績(jī)最,而第一次考試中成績(jī)最好的那些學(xué)生在第二次考試中則傾向于有較好的那些學(xué)生在第二次考試中則傾向于有較差的成績(jī)差的成績(jī)( (同樣比較接近所有學(xué)生的平均成同樣比較接近所有學(xué)生的平均成績(jī)績(jī)) )。同樣同樣,平均來(lái)說(shuō),第一年利潤(rùn)最低的公司第二,平均來(lái)說(shuō),第一年利潤(rùn)最低的公司第二
4、年不會(huì)最差,而第一年利潤(rùn)最高的公司第二年不會(huì)最差,而第一年利潤(rùn)最高的公司第二年則不會(huì)是最好的年則不會(huì)是最好的在經(jīng)濟(jì)管理和其他領(lǐng)域中,人們經(jīng)常需要研究?jī)蓚€(gè)或多個(gè)變量(現(xiàn)象)之間的相互(因果)關(guān)系,并使用數(shù)學(xué)模型來(lái)加以描述和解釋。如:商品銷售量與價(jià)格間的關(guān)系;產(chǎn)品的某些質(zhì)量指標(biāo)與某些控制因素之間的關(guān)系;家庭消費(fèi)支出與家庭收入間的關(guān)系等等。回歸分析就是對(duì)變量間存在的不確定關(guān)系進(jìn)行分析的統(tǒng)計(jì)方法?;貧w分析是使用得最為廣泛的統(tǒng)計(jì)學(xué)分支,本章介紹回歸分析中最基本的內(nèi)容。 68.1 回歸分析概述回歸分析概述某鋼廠生產(chǎn)的某種合金鋼有兩個(gè)重要的質(zhì)量指標(biāo):抗拉強(qiáng)度(kg/mm2)和延伸率(%)。該合金鋼的質(zhì)量標(biāo)準(zhǔn)
5、要求:抗拉強(qiáng)度應(yīng)大于32kg/mm2;延伸率應(yīng)大于33%。根據(jù)冶金學(xué)的專業(yè)知識(shí)和實(shí)踐經(jīng)驗(yàn),該合金鋼的含碳量是影響抗拉強(qiáng)度和延伸率的主要因素。其中含碳量高,則抗拉強(qiáng)度也就會(huì)相應(yīng)提高,但與此同時(shí)延伸率則會(huì)降低。為降低生產(chǎn)成本,提高產(chǎn)品質(zhì)量和競(jìng)爭(zhēng)能力,該廠質(zhì)量控制部門要求該種合金鋼產(chǎn)品的上述兩項(xiàng)質(zhì)量指標(biāo)的合格率都應(yīng)達(dá)到99%以上。 7質(zhì)量控制應(yīng)用案例質(zhì)量控制應(yīng)用案例為達(dá)到以上質(zhì)量控制要求,就需要制定該合金鋼冶煉中含碳量的工藝控制標(biāo)準(zhǔn),也即要確定在冶煉中應(yīng)將含碳量控制在什么范圍內(nèi),可以有99%的把握使抗拉強(qiáng)度和延伸率這兩項(xiàng)指標(biāo)都達(dá)到要求。這是一個(gè)典型的產(chǎn)品質(zhì)量控制問(wèn)題,可以使用回歸分析方法求解。 8如
6、何制訂含碳量的控制標(biāo)準(zhǔn)?如何制訂含碳量的控制標(biāo)準(zhǔn)?1. 確定性關(guān)系確定性關(guān)系也即函數(shù)關(guān)系,即 Y = (X) ; Y = (X1, X2, , Xp)或 F(X, Y) = 0; F(X1, X2, , Xp, Y) = 0例:例:價(jià)格不變時(shí)商品銷售收入與銷售量的關(guān)系。9Y = cXX銷售收入Y銷售量OY 與 X 間的確定性關(guān)系 一一. 變量間的兩類關(guān)系變量間的兩類關(guān)系10家庭收入非確定性關(guān)系O家庭消費(fèi)支出 = b0 + b1X2. 非確定性關(guān)系非確定性關(guān)系 指變量間雖存在著相互影響和相互制約關(guān)系,但由于許多無(wú)法預(yù)計(jì)和控制的因素的影響,使變量間的關(guān)系呈現(xiàn)不確定性。 即不能由一個(gè)或若干變量的值精
7、確地確定另一變量的值。但通過(guò)大量觀察,可以發(fā)現(xiàn)非確定性關(guān)系的變量間存在著某種統(tǒng)計(jì)規(guī)律性稱為相關(guān)關(guān)系相關(guān)關(guān)系或回歸關(guān)系回歸關(guān)系。以三口之家為單位,某種食品在某年各月的家庭平均月消費(fèi)量 Y (kg)與其價(jià)格 X (元/kg) 間的調(diào)查數(shù)據(jù)如下,試分析該食品家庭平均月消費(fèi)量與價(jià)格間的關(guān)系。11價(jià)格 xi 4.0 4.0 4.8 5.4 6.0 6.0 7.0 7.2 7.6 8.0 9.0 10 消費(fèi)量 yi 3.0 3.8 2.6 2.8 2.0 2.9 1.9 2.2 1.9 1.2 1.5 1.6 0123450123456789101112= 0+ 1Xyx【案例案例1】商品價(jià)格與消費(fèi)量的關(guān)
8、系商品價(jià)格與消費(fèi)量的關(guān)系 由圖可知,該食品家庭月平均消費(fèi)量 Y 與價(jià)格 X 間基本呈線性關(guān)系。這些點(diǎn)與直線 Y = 0 + 1X間的偏差是由其他一些無(wú)法控制的因素和觀察誤差引起的。 因此可以建立 Y 與 X 之間關(guān)系的如下線性回歸模型 Y = 0 + 1X + (8.1-1)其中 X 解釋變量(自變量) Y 被解釋變量(因變量) 0, 1 模型中的未知參數(shù)未知參數(shù) 隨機(jī)誤差項(xiàng) 12二二. 線性回歸模型線性回歸模型隨機(jī)誤差項(xiàng)產(chǎn)生的原因隨機(jī)誤差項(xiàng)產(chǎn)生的原因(1) 模型中忽略的其他因素對(duì) Y 的影響;(2) 模型不準(zhǔn)確所產(chǎn)生的偏差;(3) 模型中包含了對(duì) Y 無(wú)顯著影響的變量;(4) 對(duì)變量的觀察誤
9、差;(5) 其他隨機(jī)因素的影響。 13線性回歸模型的數(shù)據(jù)結(jié)構(gòu)線性回歸模型的數(shù)據(jù)結(jié)構(gòu) yi = 0 + 1xi + i ; i =1, 2, , N (8.1-2)其中 i 是其他因素和試驗(yàn)誤差對(duì) yi 影響的總和。 14當(dāng) X 取不完全相同的值 x1, x2, , xN 時(shí),得到 Y 的一組相應(yīng)的觀察值 y1, y2, , yN 。顯然,每一對(duì)觀察值 (xi, yi) 都應(yīng)滿足(8.1-1)式。因此一元線性回歸模型有如下的數(shù)據(jù)結(jié)構(gòu):例例 解釋截距和斜率。一名統(tǒng)計(jì)學(xué)教授打算運(yùn)用學(xué)生為準(zhǔn)備期末考試而學(xué)習(xí)統(tǒng)計(jì)學(xué)的小時(shí)數(shù)(X)預(yù)測(cè)其期末考試成績(jī)(Y)。依據(jù)上學(xué)期上課班級(jí)中收集的數(shù)據(jù)建立的回歸模型如下:
10、如何解釋截距和斜率?解解 截距=35.0表示當(dāng)學(xué)生不為期末考試做準(zhǔn)備的話,期末考試平均成績(jī)是35.0。斜率=3表示每增加1小時(shí)學(xué)習(xí)時(shí)間,期末考試平均成績(jī)就變化+3.0。換句話說(shuō),每增加1小時(shí)學(xué)習(xí)時(shí)間,期末成績(jī)就增加3.0。 151. 各 i N( 0, 2 ),且相互獨(dú)立;2. 解釋變量是可以精確觀察的普通變量(非隨機(jī)變量);3. 解釋變量與隨機(jī)誤差項(xiàng)是各自獨(dú)立對(duì)被解釋變量產(chǎn)生影響的。稱滿足以上條件的回歸模型為經(jīng)典回歸模型經(jīng)典回歸模型。本章僅討論經(jīng)典回歸模型。但在經(jīng)濟(jì)領(lǐng)域中,經(jīng)濟(jì)變量間的關(guān)系通常是不會(huì)完全滿足上述條件的。例如家庭消費(fèi)支出 Y 與家庭收入 X 間的回歸模型就不會(huì)是同方差的。16三
11、三. 回歸模型的經(jīng)典假設(shè)條件回歸模型的經(jīng)典假設(shè)條件1. 根據(jù)問(wèn)題的實(shí)際背景、專業(yè)知識(shí)或通過(guò)對(duì)樣本數(shù)據(jù)的分析,建立描述變量間相關(guān)關(guān)系的回歸模型;2. 利用樣本數(shù)據(jù)估計(jì)模型中的未知參數(shù),得到回歸方程;3. 對(duì)模型進(jìn)行檢驗(yàn);4. 利用通過(guò)檢驗(yàn)的回歸方程對(duì)被解釋變量進(jìn)行預(yù)測(cè)或控制。 17四四. 回歸分析的主要內(nèi)容和分析步驟回歸分析的主要內(nèi)容和分析步驟一一. 一元線性回歸模型一元線性回歸模型 設(shè)被解釋變量 Y 與 解釋變量 X 間存在線形相關(guān)關(guān)系,則 Y = 0 + 1X + ; N(0, 2 ) 其中 X 是普通變量。 則 Y N( 0+ 1X, 2 ) 稱 Y 的條件期望 E( Y|X ) = 0
12、+ 1X (8.2-1)為 Y 對(duì) X 的回歸。 188.2 一元線性回歸一元線性回歸二二. 回歸方程回歸方程分別是參數(shù) 0 和 1 的點(diǎn)估計(jì),19 1 0 , 10XYYiixy10對(duì)每一 xi 值,由回歸方程可以確定一個(gè)回歸值回歸系數(shù)回歸系數(shù)。稱(8.2-2) 式為回歸方回歸方程。記為 Y 的條件期望 E( Y|X ) 的點(diǎn)估計(jì),則由(8.2-1)式, 有(8.2-2) 并稱 1 0 ,為回歸方程的并記 20),Q(10210)() (iiyy,Q。 1iy 就可求出,0; 00Q, 01Q三三. 回歸模型的參數(shù)估計(jì)回歸模型的參數(shù)估計(jì)回歸模型中的參數(shù)估計(jì),采用的是“最小二乘法”,其原理如下
13、:Y 的各觀察值 yi 與回歸值 之差iiyy反映了 yi 與回歸直線之間的偏離程度,從而全部觀察值與回歸值的殘差平方和210)(iixy反映了全部觀察值與回歸直線間總的偏離程度。顯然, Q 的值越小,就說(shuō)明回歸直線對(duì)所有樣本數(shù)據(jù)的擬和程度越好。所謂最小二乘法,就是要使為最小。只要令 21。 。xy0。yi要找一條直線,使min)(2iiyyiy xi最小二乘法原理示意圖最小二乘法原理示意圖 最小二乘結(jié)果最小二乘結(jié)果22011020niiiQyx 011120niiiiQxyx 12,iiixxyyCov x yVar xxx01yx 可以證明,23分別是參數(shù) 0 和 1 的最小方差無(wú)偏估計(jì)。
14、, )(1)(2220 xxxNDi221)()(xxDi10 和 以上兩式說(shuō)明,的方差分別為:2.2.10 和10 和 四四. 最小二乘估計(jì)的性質(zhì)最小二乘估計(jì)的性質(zhì)在滿足經(jīng)典假設(shè)的條件下1 1回歸系數(shù)的估計(jì)精度不僅與 2 及樣本容量 N 有關(guān),而且與各 xi 取值的分散程度有關(guān)。 在給定樣本容量下,xi 的取值越分散,的取值越分散, 則估則估計(jì)的方差就越小計(jì)的方差就越小,即對(duì)參數(shù) 0 和 1 的估計(jì)就越精確;反之估計(jì)的精確就差。了解這一點(diǎn),對(duì)指導(dǎo)試驗(yàn)或抽樣調(diào)查是非常重要的。 通過(guò)參數(shù)估計(jì)得到回歸方程后,還需要對(duì)回歸方程進(jìn)行檢驗(yàn),以確定變量間是否存在顯著的線性關(guān)系。對(duì)一元線性回歸模型,如果變量
15、 Y 與 X 之間并不存在線性相關(guān)關(guān)系,則模型中的一次項(xiàng)系數(shù) 1 應(yīng)為 0;反之,則 10。故對(duì)一元線性回歸模型,要檢驗(yàn)的原假設(shè)為 H0:1 = 0以上檢驗(yàn)稱為對(duì)回歸方程的顯著性檢驗(yàn),使用的仍然是方差分析方法。Y 的觀察值 y1, y2, , yN 之間的差異是由兩方面的原因引起的:(1) 解釋變量 X 的取值 xi 不同;(2) 其他因素和試驗(yàn)誤差的影響。 24五五. 回歸方程的顯著性檢驗(yàn)回歸方程的顯著性檢驗(yàn) 為檢驗(yàn)以上兩方面中哪一個(gè)對(duì) Y 取值的影響是主要的,就需要將它們各自對(duì) Y 取值的影響,從 yi 總的差異中分解出來(lái)。 與方差分析類似地,可以用總的偏差平方和252)(yySiT22)
16、 ()(yyyySiiiT來(lái)表示全部觀察值 yi 間總的差異量。1. 偏差平方和的分解偏差平方和的分解RESS 將 ST 作如下分解:稱 SR 為回歸平方和回歸平方和,它主要是由于變量 X 的取值不同引起的,其大小反映了 X 的對(duì) Y 影響的重要程度。稱 SE 為剩余平方和剩余平方和或殘差平方和殘差平方和,它主要是由隨機(jī)誤差和其他因素的影響所引起的。 可以證明,262)(N/SSFER因此,在給定顯著性水平 下,若 F F (1, N-2) F(1, N-2) 2. 檢驗(yàn)檢驗(yàn) H0 的統(tǒng)計(jì)量的統(tǒng)計(jì)量當(dāng) H0 為真時(shí), 統(tǒng)計(jì)量就拒絕 H0,并稱回歸方程是顯著的,可以用回歸方程對(duì)被解釋變量進(jìn)行預(yù)測(cè)
17、或控制分析; 反之,則稱回歸方程無(wú)顯著意義。 若不能拒絕 H0,則可能有以下原因:(1) Y 和 X 之間不是線性關(guān)系;(2) 模型中忽略了對(duì) Y 有重要影響的其他因素;(3) Y 和 X 基本無(wú)關(guān); (4) 數(shù)據(jù)誤差過(guò)大。 回歸方程的顯著性檢驗(yàn)過(guò)程同樣可以列成如下方差分析表: 方差分析表27來(lái)源 平方和 自由度 均方和 F 比 顯著性 回歸 SR 1 SR 剩余 SE N-2 SE /(N-2) 總和 ST N-1 )(2N/SSER3.3.方差分析表方差分析表 【案例案例1】商品價(jià)格與消費(fèi)量的關(guān)系商品價(jià)格與消費(fèi)量的關(guān)系以三口之家為單位,某種食品在某年各月的家庭平均月消費(fèi)量 Y (kg)與其
18、價(jià)格 X (元/kg) 間的調(diào)查數(shù)據(jù)如下,試分析該食品家庭平均月消費(fèi)量與價(jià)格間的關(guān)系。280123450123456789101112= 0+ 1Xyx價(jià)格 xi 4.0 4.0 4.8 5.4 6.0 6.0 7.0 7.2 7.6 8.0 9.0 10 消費(fèi)量 yi 3.0 3.8 2.6 2.8 2.0 2.9 1.9 2.2 1.9 1.2 1.5 1.6 可用 Excel 【工具】“數(shù)據(jù)分析”“回歸”求解線性回歸問(wèn)題。本案例可解得29,5240. 3401.X.Y3405245240. 來(lái)源 平方和 自由度 均方和 F 比 Significance F 回歸 4.589 1 4.58
19、9 剩余 1.608 10 0.1608 28.54 0.00032 總和 6.197 11 “Significance F”為達(dá)到的顯著性水平,含義與 P-value 相同。 Significance F = 0.00032 0.001 故回歸方程是極高度顯著的。 方差分析表故所求回歸方程為:案例案例 1 求解分析求解分析說(shuō)明該食品價(jià)格每上漲一元,家庭月平均消費(fèi)量將下降0.34kg, kg 為該食品的最大月平均消費(fèi)量。運(yùn)用回歸分析,可能存在如下一些錯(cuò)誤:不注意最小二乘回歸的假設(shè)條件不知道如何評(píng)估最小二乘回歸的假設(shè)條件不知道在違背某一假設(shè)條件的情況下運(yùn)用除最小二乘回歸外的其它方法在對(duì)主要問(wèn)題不
20、了解的情況下運(yùn)用回歸模型在相關(guān)范圍外進(jìn)行外推根據(jù)某研究中的因果關(guān)系得出存在顯著關(guān)系的結(jié)論3031 案例案例 1 需要繼續(xù)研究的問(wèn)題需要繼續(xù)研究的問(wèn)題 1. 以 90% 的可信度預(yù)測(cè)當(dāng)價(jià)格為5.6元/kg時(shí),該食品的家庭平均月消費(fèi)量。 2. 該食品的生產(chǎn)商和供應(yīng)商希望該食品的家庭月平均消費(fèi)量能以 90% 的把握達(dá)到 2.5kg 以上, 應(yīng)將價(jià)格控制在什么水平之下? 32)2( )()(11 )2( 2202N/SxxxxNNtdEi/) (00dyd,y可以證明,0100 xy五五. 預(yù)測(cè)和控制預(yù)測(cè)和控制1. 預(yù)測(cè)預(yù)測(cè)就是對(duì)解釋變量 X 的某一給定值 x0,求被解釋變量 Y 的取值 y0 的類似
21、于區(qū)間估計(jì)問(wèn)題。對(duì)任一給定的 x0,由回歸方程可得 y0 的回歸值(點(diǎn)估計(jì)): y0 的置信度為 1- 的預(yù)測(cè)區(qū)間為置信度為 1- 的預(yù)測(cè)區(qū)間,關(guān)于預(yù)測(cè)的精度關(guān)于預(yù)測(cè)的精度33xx)(00 xdy )(00 xdy 01xy00 xx0oy允許誤差 d 的公式說(shuō)明,預(yù)測(cè)區(qū)間的大小(預(yù)測(cè)精度)不僅與 、樣本容量 N 及各 xi 取值的分散程度有關(guān), 而且和 x0 有關(guān)。當(dāng) x0 靠近時(shí),d 就較小,反之,x0 離越遠(yuǎn),d 就越大。 d 是 x0 的函數(shù) d = d(x0)。 預(yù)測(cè)區(qū)間的近似計(jì)算預(yù)測(cè)區(qū)間的近似計(jì)算 當(dāng)樣本容量 N 足夠大時(shí),34)( )()(11 )(222202N/SxxxxNN
22、tdEi/ 222)()(N/SNE/td 22)(N/SZE/d或中方括號(hào)內(nèi)的部分就近似于 1。 因此 d 可以使用以下近似公式計(jì)算:其中)2/(NSE(5.2-3)(5.2-4) 就是回歸方程的標(biāo)準(zhǔn)誤差標(biāo)準(zhǔn)誤差。 由所得回歸方程 35XY0.344.526 . 534. 052. 40y4007. 0)2/(NSE由 Excel 或 SPSS 的輸出結(jié)果,可解得當(dāng) x0=5.6 時(shí),案例案例 1 的預(yù)測(cè)問(wèn)題分析的預(yù)測(cè)問(wèn)題分析62. 2可得標(biāo)準(zhǔn)誤差為dt0.05(10)0.4007 = 1.81250.4007 = 0.73 故當(dāng)價(jià)格為 5.6/kg 時(shí),該食品的家庭月平均消費(fèi)量的 90%
23、置信預(yù)測(cè)區(qū)間為:) ,(00dydykg )35. 3 ,89. 1 ( 362. 控制控制控制問(wèn)題在質(zhì)量管理及其他經(jīng)濟(jì)管理領(lǐng)域中有著非常廣泛的應(yīng)用,它是預(yù)測(cè)的反問(wèn)題。即當(dāng)要求以 1- 的概率將 Y 的值控制在某一范圍 ( y1, y2 ) 內(nèi)時(shí),應(yīng)將解釋變量 X 的值控制在哪一范圍內(nèi)的問(wèn)題。也即要確定 X 的兩個(gè)值 x1, x2,當(dāng) x1 X x2 時(shí),在 1- 的置信度下可使y1 Y y2即滿足 P y1 Y y2 | x1 X x2 ,則說(shuō)明無(wú)法實(shí)現(xiàn)所要求的控制目標(biāo),也即 Y 的控制范圍不能過(guò)小(與,N 及 xi 的分散程度等都有關(guān))。 當(dāng)樣本容量 N 足夠大時(shí),可用(5.2-3)式或(
24、5.2-4)式作為 d 的近似值。 此時(shí)(5.2-5)和(5.2-6)式可簡(jiǎn)化為:391110ydx2210ydx)0(1dydyxy10 x0yx1x2y2y1x0yx1x2y2y1控制范圍的近似求解控制范圍的近似求解1210ydx2110ydx)0(1 要求以90%的概率使該食品的家庭月平均消費(fèi)量達(dá)到2.5kg以上,應(yīng)將價(jià)格控制在什么水平之下?40 x0yx22.5X.Y340524dY 5210.dx )2()2(N/SNEtd本例中,可得 dt0.1(10)0.4007 = 0.55由 4.52 - 0.34x - 0.55 2.5可解得:x 4.32 故應(yīng)將該食品價(jià)格控制在4.32元
25、/kg 之下。 注意,對(duì)于單側(cè)控制案例案例 1 的控制要求分析的控制要求分析 顯然,這是一個(gè)單側(cè)控制問(wèn)題。即要確定 x2的值,使某鋼廠生產(chǎn)的某種合金鋼有兩個(gè)重要的質(zhì)量指標(biāo):抗拉強(qiáng)度(kg/mm2)和延伸率(%)。該合金鋼的質(zhì)量標(biāo)準(zhǔn)要求:抗拉強(qiáng)度應(yīng)大于32kg/mm2;延伸率應(yīng)大于33%。 根據(jù)冶金學(xué)的專業(yè)理論知識(shí)和實(shí)踐經(jīng)驗(yàn)知道,該合金鋼的含碳量是影響抗拉強(qiáng)度和延伸率的主要因素。其中含碳量高,則抗拉強(qiáng)度也就會(huì)相應(yīng)提高,但與此同時(shí)延伸率則會(huì)降低。為降低生產(chǎn)成本,提高產(chǎn)品質(zhì)量和競(jìng)爭(zhēng)能力,該廠質(zhì)量控制部門要求該種合金鋼產(chǎn)品的上述兩項(xiàng)質(zhì)量指標(biāo)的合格率都應(yīng)達(dá)到 99% 。 41質(zhì)量控制應(yīng)用案例質(zhì)量控制應(yīng)用
26、案例為達(dá)到以上質(zhì)量控制要求,就需要重新修訂該合金鋼冶煉中關(guān)于含碳量的工藝控制標(biāo)準(zhǔn)。也即要確定在冶煉中應(yīng)將含碳量控制在什么范圍內(nèi),可以有99%的把握使抗拉強(qiáng)度和延伸率這兩項(xiàng)指標(biāo)都達(dá)到要求。 42如何制訂含碳量的控制標(biāo)準(zhǔn)如何制訂含碳量的控制標(biāo)準(zhǔn)? 1. 樣本數(shù)據(jù)的收集樣本數(shù)據(jù)的收集 為分析抗拉強(qiáng)度和延伸率這兩項(xiàng)指標(biāo)與含碳量之間的關(guān)系,需要有關(guān)該合金鋼的含碳量與抗拉強(qiáng)度及延伸率的樣本數(shù)據(jù)。 該廠質(zhì)量控制部門查閱了該合金鋼的質(zhì)量檢驗(yàn)紀(jì)錄,在剔除了異常情況后,整理了該合金鋼的上述兩項(xiàng)指標(biāo)與含碳量的 92 爐實(shí)測(cè)數(shù)據(jù)(見(jiàn)Excel工作表)。 43案例分析案例分析 為分析抗拉強(qiáng)度和延伸率這兩項(xiàng)指標(biāo)與含碳量之
27、間的關(guān)系,需要建立反映它們之間相關(guān)關(guān)系的回歸模型。 設(shè) Y1, Y2分別為該合金鋼的抗拉強(qiáng)度和延伸率,X 為含碳量,則 Y1 = 01 +1 X +1 Y2 = 02 +2 X +2分別為該合金鋼抗拉強(qiáng)度和延伸率關(guān)于含碳量的一元線性回歸模型。 442. 建立線性回歸模型建立線性回歸模型用 Excel 分別求解本案例的兩個(gè)回歸方程,可得:4534.7728,018269.871X.Y826987772834160878. 2)2/(1NSE這一數(shù)據(jù)在求解控制范圍時(shí)需要用到。 再由輸出的方差分析表可知, Significance F = 2.05E-32 0.001,回歸方程極高度顯著。 此外還得
28、到標(biāo)準(zhǔn)誤差為:從而得到抗拉強(qiáng)度和含碳量間的線性回歸方程為3. 軟件軟件運(yùn)行輸出結(jié)果分析運(yùn)行輸出結(jié)果分析同樣可得到:46,8075.41026092.312XY6092.318075.4124669. 2)2/(2NSE 再由輸出的方差分析表, Significance F = 3.69E-10 32 41.8075 - 31.6092 X - 5.7479 33) 2/(101. 01NSZdE 解此不等式組,得: 0.0376 X 0b 0b 0令 y =1/y, x =1/x,,得: y = a + bx二二. 非線性函數(shù)的線性化方法非線性函數(shù)的線性化方法2. 冪函數(shù):冪函數(shù): y = a
29、xb 若 a 0,則 ln y = ln a + b ln x 令 y = ln y,b0 = ln a,x = ln x,得: y = b0 + bx52b 10 b 00 xya1a 0yx0b 0,則 ln y = ln a + bx 令 y = ln y,b0 = ln a,得: y = b0 + bx53ab 0yx0aa 04. 負(fù)指數(shù)函數(shù):負(fù)指數(shù)函數(shù):y = aeb/x 若a 0,則 ln y = ln a + b/x 令 y = ln y, b0 = ln a, x = 1/x 得:y = b0+ bx 54b 0a5. 對(duì)數(shù)函數(shù):對(duì)數(shù)函數(shù):y = a + b ln x令 x
30、= ln x,得:y = a + bx55b 0 x0y0yxb 0 x0yb 0a7S 型曲線:型曲線:令 y = 1/y,x = e -x,得:y = a + bx57xbeay1xy01/a1/(a+b) 在實(shí)際問(wèn)題中,究竟應(yīng)使用哪種曲線來(lái)配置解釋變量與被解釋變量間的回歸模型,通常可根據(jù)有關(guān)專業(yè)理論知識(shí)、或分析樣本數(shù)據(jù)的散點(diǎn)圖來(lái)決定。58配置曲線的原則配置曲線的原則但合適的曲線類型并不是一下就能選準(zhǔn)的,往往需要選擇幾種類型,通過(guò)求解經(jīng)數(shù)據(jù)變換后的線性回歸方程,比較各回歸方程的顯著性水平,則顯著性水平最高的曲線對(duì)樣本數(shù)據(jù)的擬合程度最好。 對(duì) 10 家化妝品企業(yè)某年的產(chǎn)品銷售額 yi 與當(dāng)年
31、廣告費(fèi)投入 xi 的調(diào)查數(shù)據(jù)如下:59xi (百 萬(wàn) ) 2.0 3.0 4.5 5.4 6.0 6.8 7.6 8.2 9.5 10 yi (千 萬(wàn) ) 2.1 1.9 3.2 4.1 3.1 4.3 4.0 4.6 3.9 4.5 試分析化妝品銷售額與廣告費(fèi)投入間的關(guān)系。 【案例案例2】產(chǎn)品銷售額與廣告費(fèi)投入的關(guān)系產(chǎn)品銷售額與廣告費(fèi)投入的關(guān)系對(duì)所給數(shù)據(jù)作散點(diǎn)圖如下:60/通用格式/通用格式/通用格式/通用格式/通用格式/通用格式/通用格式/通用格式/通用格式/通用格式/通用格式y(tǒng)x案例案例 2 分析分析 由圖可知 Y 與 X 之間呈非線性相關(guān)關(guān)系,Y 隨 X 增加而增加, 但增長(zhǎng)率逐漸遞減
32、。根據(jù)這一特點(diǎn)可試用以下兩種曲線進(jìn)行擬合: 冪函數(shù); 對(duì)數(shù)函數(shù) 設(shè)設(shè) Y 與與 X 間為冪函數(shù)關(guān)系:間為冪函數(shù)關(guān)系: 令 Y = ln Y,X = ln X,0 = ln a 得線性回歸模型: Y = 0+ 1X + 用 Excel 求解,可得線性化后的回歸方程及方差分析表如下:61X Y0.54470.2860eaXY1來(lái)源 平方和 自由度 均方和 F 比 Significance F 回歸 0.7101 1 0.7101 剩余 0.1775 8 0.0222 32.00 0.00048 總和 0.8876 9 Significance F = 0.00048 0.001,回歸方程極高度顯著
33、。 方差分析表設(shè)設(shè) Y 與與 X 間為對(duì)數(shù)關(guān)系:間為對(duì)數(shù)關(guān)系:令 X = ln X,得線性回歸模型:Y = 0 + 1X + 用 Excel 求解,得線性化后的回歸方程及方差分析表如下:62XY1.65666913. 0來(lái)源 平方和 自由度 均方和 F 比 Significance F 回歸 6.5675 1 6.5675 剩余 1.7735 8 0.2217 29.63 0.0006 總和 8.341 9 Significance F = 0.0006 t(N-P-1)就拒絕 H0k,說(shuō)明 Xk 的作用顯著。 反之,則說(shuō)明 Xk 的作用不顯著。 702. 存在不顯著變量后的處理存在不顯著變量
34、后的處理71若經(jīng)檢驗(yàn),Xk 的作用不顯著,則應(yīng)從模型中剔除Xk,并重新求解 Y 對(duì)余下的 P-1 個(gè)變量的回歸方程。若檢驗(yàn)中同時(shí)存在多個(gè)不顯著的變量,則每次只能剔除一個(gè)顯著性水平最低的變量,重新求解新的回歸方程。再對(duì)新的回歸系數(shù)進(jìn)行檢驗(yàn),直至所有變量都顯著為止。當(dāng)模型中解釋變量很多時(shí),通常會(huì)存在較多的不顯著變量,以上步驟就非常繁瑣。更為有效的方法是采用“逐步回歸”來(lái)求解多元線性回歸方程。 逐步回歸的基本思想是:采用一定的評(píng)價(jià)標(biāo)準(zhǔn),將解釋變量一個(gè)一個(gè)地逐步引入回歸方程。每引進(jìn)一個(gè)新變量后,都對(duì)方程中的所有變量進(jìn)行顯著性檢驗(yàn),并剔除不顯著的變量,被剔除的變量以后就不再進(jìn)入回歸方程。采用逐步回歸方法
35、最終所得到的回歸方程與前述方法的結(jié)果是一樣的,但計(jì)算量要少得多。在 SPSS 軟件的線性回歸功能中就提供了逐步回歸的可選項(xiàng)。 72逐步回歸方法簡(jiǎn)介逐步回歸方法簡(jiǎn)介家電商品的需求量 Y 與其價(jià)格 X1 及居民家庭平均收入 X2 有關(guān)。下表給出了某市 10 年中某家電商品需求量與價(jià)格和家庭年平均收入水平間的數(shù)據(jù)。73需 求 量 (萬(wàn) 臺(tái) ) 3.0 5.0 6.5 7.0 8.5 7.5 10 9.0 11 12.5 價(jià) 格 (千 元 ) 4.0 4.5 3.5 3.0 3.0 3.5 2.5 3.0 2.5 2.0 收 入 (千 元 ) 6.0 6.8 8.0 10 16 20 22 24 26
36、 28 求該商品年需求量 Y 關(guān)于價(jià)格 X1和家庭年平均收入 X2 的回歸方程。 【案例案例3】需求量與價(jià)格及收入間的關(guān)系需求量與價(jià)格及收入間的關(guān)系用 Excel 求解案例 3,可得回歸方程如下:74 由方差分析表,Significance F = 0.0001,因而回歸方程極高度顯著。 對(duì)回歸系數(shù)的顯著性檢驗(yàn)結(jié)果為: X1 的P-value = 0.0268,X2 的 P-value = 0.0262都是一般顯著。 此外還得到回歸方程的標(biāo)準(zhǔn)誤差:210.16951.90311.167XXY8618. 01)P/(NSE該值在求預(yù)測(cè)區(qū)間和控制范圍時(shí)要用到。 案例案例 3 分析分析 預(yù)計(jì)下一年度該商品的價(jià)格水平為1800元,家庭年平均收入為30000元,希望預(yù)測(cè)該商品下一年的需求量。 假定下一年度居民家庭年平均收入估計(jì)在30000-31000元之間。 若要以90%的概率使該商品的年需求量不低于12萬(wàn)臺(tái),則應(yīng)將價(jià)格控制在什么范圍內(nèi)? 75案案例例 3 需要進(jìn)需要進(jìn)一步分析的問(wèn)題一步分析的問(wèn)題 1. 預(yù)測(cè)預(yù)測(cè) 在給定解釋變量的一組取值 ( x01, x02 , x0P ),由回歸方程可得回歸值76PPxxxy002201100) (00d yd, y) 1(
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年新型材料廠房建造木工施工合同范本3篇
- 2025年環(huán)保型水泵購(gòu)銷及售后服務(wù)保障合同3篇
- 二零二五年度煤炭行業(yè)安全生產(chǎn)標(biāo)準(zhǔn)化建設(shè)承包合同模板4篇
- 2025年茶葉產(chǎn)品研發(fā)與生產(chǎn)合作合同4篇
- 2025年度智慧交通產(chǎn)品承包及運(yùn)營(yíng)維護(hù)合同4篇
- 二零二五年度酒店大堂花卉租賃與維護(hù)合同
- 2025年度住宅電梯零星維修保養(yǎng)合同4篇
- 二零二五年度火鍋連鎖品牌區(qū)域分店加盟合同
- 2025年度倉(cāng)儲(chǔ)物流場(chǎng)地租賃及倉(cāng)儲(chǔ)服務(wù)合同4篇
- 2025年度監(jiān)護(hù)責(zé)任保險(xiǎn)合同規(guī)范文本
- 山東省濰坊市2023-2024學(xué)年高二下學(xué)期期末考試 歷史 含解析
- 中醫(yī)診療規(guī)范
- 報(bào)建協(xié)議書(shū)模板
- 第14課《葉圣陶先生二三事》導(dǎo)學(xué)案 統(tǒng)編版語(yǔ)文七年級(jí)下冊(cè)
- 貴州省2024年中考英語(yǔ)真題(含答案)
- 施工項(xiàng)目平移合同范本
- 北師大版八年級(jí)上冊(cè)數(shù)學(xué)期中綜合測(cè)試卷(含答案解析)
- 幼兒園創(chuàng)意美勞培訓(xùn)
- 同濟(jì)大學(xué)第四版線性代數(shù)課后習(xí)題答案
- 醫(yī)療領(lǐng)域人工智能技術(shù)應(yīng)用的倫理與法規(guī)
- 工地春節(jié)停工復(fù)工計(jì)劃安排
評(píng)論
0/150
提交評(píng)論