![六西格瑪:相關(guān)和回歸分析課件_第1頁(yè)](http://file4.renrendoc.com/view/ce40f75cc202f57e8e954b18a3533a29/ce40f75cc202f57e8e954b18a3533a291.gif)
![六西格瑪:相關(guān)和回歸分析課件_第2頁(yè)](http://file4.renrendoc.com/view/ce40f75cc202f57e8e954b18a3533a29/ce40f75cc202f57e8e954b18a3533a292.gif)
![六西格瑪:相關(guān)和回歸分析課件_第3頁(yè)](http://file4.renrendoc.com/view/ce40f75cc202f57e8e954b18a3533a29/ce40f75cc202f57e8e954b18a3533a293.gif)
![六西格瑪:相關(guān)和回歸分析課件_第4頁(yè)](http://file4.renrendoc.com/view/ce40f75cc202f57e8e954b18a3533a29/ce40f75cc202f57e8e954b18a3533a294.gif)
![六西格瑪:相關(guān)和回歸分析課件_第5頁(yè)](http://file4.renrendoc.com/view/ce40f75cc202f57e8e954b18a3533a29/ce40f75cc202f57e8e954b18a3533a295.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
(分析階段)(ZTE-GB402-V1.5)相關(guān)和回歸分析
(分析階段)(ZTE-GB402-V1.5)相關(guān)和回歸分析主要內(nèi)容1.相關(guān)分析2.回歸分析主要內(nèi)容1.相關(guān)分析
學(xué)習(xí)目的變量(X1)與變量(X2)間或X與Y間
-有多少相關(guān)性–相關(guān)分析
-變量間關(guān)系式的推測(cè)
–
回歸分析它們之間有關(guān)系嗎?有多強(qiáng)的關(guān)系?有什么樣的關(guān)系式?
機(jī)動(dòng)車的數(shù)量
vs
交通事故發(fā)生率網(wǎng)板厚度
vs焊膏厚度學(xué)習(xí)目的變量(X1)與變量(X2)間或X與Y間它們之間有1.相關(guān)關(guān)系是?相關(guān)關(guān)系可以用數(shù)據(jù)來看出兩個(gè)變量(Y與X,或兩個(gè)X)間緊密程度如何.兩者之間關(guān)系的強(qiáng)度通過相關(guān)系數(shù)(r)可以計(jì)數(shù)化.(Minitab使用Pearsonproductmoment相關(guān)系數(shù))-1.00+1.0負(fù)的相關(guān)系正的相關(guān)關(guān)系“r”
弱相關(guān)關(guān)系決定點(diǎn)1.相關(guān)關(guān)系是?相關(guān)關(guān)系可以用數(shù)據(jù)來看出兩個(gè)變量(Y與X,r值r
接近-1r
接近+1(+)正的相關(guān)關(guān)系()負(fù)的相關(guān)關(guān)系接近0時(shí)幾乎沒有相關(guān)關(guān)系相關(guān)系數(shù)的性質(zhì)為調(diào)查相關(guān)關(guān)系,需要數(shù)據(jù)構(gòu)造為成對(duì)的2個(gè)變量數(shù)據(jù)r值r接近-1r接近+1(+)正的相關(guān)關(guān)系相關(guān)系數(shù)相關(guān)系數(shù)(CorrelationCoefficient)
一般表示為(總體的相關(guān)關(guān)系),其范圍是11.
一般情況下我們無法知道的正確的值,因此使用從樣本推斷的值r.r從如下公式得出且范圍是-1r1.一般樣本大小(30個(gè)以上)為基準(zhǔn)
如果|r|>0.80時(shí)具有強(qiáng)的相關(guān)關(guān)系
如果0.3>|r|>0.80時(shí)具有弱的相關(guān)關(guān)系.
如果|r|<0.30時(shí)認(rèn)為沒有有效的關(guān)系.相關(guān)公式相關(guān)系數(shù)(CorrelationCoefficient)強(qiáng)的正相關(guān)弱的正相關(guān)中間程度的正相關(guān)|r
|=0.936|r
|=0.560|r
|=0.3390強(qiáng)的負(fù)相關(guān)弱的負(fù)相關(guān)中間程度的負(fù)相關(guān)相關(guān)的類型和大小強(qiáng)的正相關(guān)弱的正相關(guān)中間程度的正相關(guān)|r|=0.93判斷相關(guān)類型…對(duì)結(jié)果
Y影響最大的因子,可從點(diǎn)的密集程度判斷
單純通過散點(diǎn)圖分析相關(guān)關(guān)系時(shí)不客觀,因此需要客觀的分析,即可看出相關(guān)程度的指數(shù)(相關(guān)系數(shù)計(jì)算方法等)
相關(guān)系數(shù)計(jì)算方法是從直線的觀點(diǎn)進(jìn)行分析.
曲線關(guān)系時(shí),如果以相關(guān)系數(shù)方法計(jì)算時(shí)會(huì)出現(xiàn)錯(cuò)誤的結(jié)果.判斷相關(guān)類型…對(duì)結(jié)果Y影響最大的因子,可從點(diǎn)的密集程度判斷相關(guān)并不是分析所有的因果關(guān)系!即使證明Y與
X間具有相關(guān),也并不意味著Y的變動(dòng)一定是X的變動(dòng)引起的.可能存在引起X與Y同時(shí)變動(dòng)的第3個(gè)隱藏變量.
兩個(gè)變量間有關(guān)系的結(jié)論并不意味著因果關(guān)系.且樣本相關(guān)系數(shù)的值接近“0”表示
兩個(gè)變量間直線關(guān)系弱
,并不意味著兩個(gè)變量間沒有關(guān)系.相關(guān)的濫用與誤用相關(guān)并不是分析所有的因果關(guān)系!即使證明Y與X間具有相關(guān),也事例分析單板生產(chǎn)過程中,刮刀壓力可能會(huì)影響到焊膏的厚度,為了了解刮刀壓力和焊膏厚度的關(guān)系.為此我們進(jìn)行幾次實(shí)驗(yàn)后得出如下資料.求此資料的散點(diǎn)圖及總體的相關(guān)系數(shù).
打開
A_08.mtw.事例分析單板生產(chǎn)過程中,刮刀壓力可能會(huì)影響到焊膏的厚度,為了Stat>BasicStatistics>Correlation從上面點(diǎn)來看,可以猜測(cè)有強(qiáng)的相關(guān)關(guān)系Stat>BasicStatistics>Corr分析結(jié)果根據(jù)
刮刀壓力和焊膏厚度的相關(guān)系數(shù)為r=0.955,可看出具有強(qiáng)的負(fù)相關(guān).從上述結(jié)果可以得出:為了保證焊膏厚度符合要求.必須監(jiān)控刮刀的壓力.
統(tǒng)計(jì)分析
結(jié)果解釋分析結(jié)果根據(jù)刮刀壓力和焊膏厚度的相關(guān)系數(shù)為統(tǒng)計(jì)分析結(jié)果事例分析下面給出13家上市公司的每股賬面價(jià)值和每股紅利,以1.賬面價(jià)值作為橫軸,畫散點(diǎn)圖2.計(jì)算相關(guān)系數(shù)并解釋公司名稱賬面價(jià)值紅利海爾22.442.40中興23.542.98深科技22.092.06深發(fā)展14.481.09清華同方20.731.96上海一汽19.251.55第一鉛筆20.732.16陜西旅游26.431.60云南白藥12.140.8粵電力23.311.94北大方正16.233.00深彩虹18.051.80咸陽(yáng)偏轉(zhuǎn)12.451.21事例分析下面給出13家上市公司的每股賬面價(jià)值和每股紅利,以公從散點(diǎn)圖我們可以看出什么?相關(guān)系數(shù)可以看出什么?從散點(diǎn)圖我們可以看出什么?相關(guān)系數(shù)可以看出什么?通過它我們可以知道哪個(gè)輸入對(duì)輸出值有多少影響?為了得到想要的輸出值,我們應(yīng)按什么水平管理X的規(guī)格.回歸…尋找“Y”與“X”關(guān)系的方法什么是回歸?描述“Y”與“X”關(guān)系的數(shù)學(xué)方法-創(chuàng)建過程的“模型”。2.回歸分析回歸…尋找“Y”與“X”關(guān)系的方法2.回歸分析
相關(guān)是告訴關(guān)系的程度,回歸分析是找出Y=F(X)的函數(shù)關(guān)系式
回歸分析的種類
單純回歸模型:獨(dú)立變量為一個(gè)
多重回歸模型:獨(dú)立變量為兩個(gè)以上
例
Y=a+bx1+cx2+dx3
單純線性回歸模型:設(shè)定直線關(guān)系后分析
例
Y=a+bx
曲線回歸模型:設(shè)定曲線關(guān)系后分析
例
Y=a+bx+cx2+dx3
Y=a
bx相關(guān)是告訴關(guān)系的程度,回歸分析是找出Y=F(X)的函數(shù)關(guān)系單純線性回歸回歸分析的階段Data收集用散點(diǎn)圖確認(rèn)關(guān)系用最小二乘法推斷總體進(jìn)行方差分析畫直線(LineFitting)分析殘差此章的因子為一個(gè),因子和輸出值(Y)的關(guān)系為直線關(guān)系的單純線性回歸(SimpleLinearRegression)單純線性回歸回歸分析的階段Data收集用散點(diǎn)圖確認(rèn)關(guān)系用最通過樣本推測(cè)的直線未知的真實(shí)直線Yi=+xi+i
(i=1,.…,n)i
是相互獨(dú)立的遵守N(0,2)的概率變量單純線性回歸模型εiei(xi,yi)xy在這里,εi~iidN(0,σ2)Model
定義
一個(gè)獨(dú)立變量(x)與
一個(gè)從屬變量(Y)間的關(guān)系方程式化后顯示的方法通過樣本推測(cè)的直線未知的真實(shí)直線Yi=+xi+將誤差平方和最小化的推斷方法,找出將殘差平方最小化的直線.420410400390380370360350340330320350400450獨(dú)立變量從屬變量最小平方和的單純回歸單純回歸直線與回歸直線的差異(誤差)直線是以“最小平方和推斷法(leastsquareestimation)”的原則畫出的.從資料的點(diǎn)到直線的距離的平方和最小化.將誤差平方和最小化的推斷方法,找出將殘差平方最小化的直線.ebScatterPlotYvs.XwithFittedLineY=a+bX直線的方程式是
Y=a+bXa是
常數(shù),b是斜率.“擬合線”是包括實(shí)際點(diǎn)和直線的平方差的和最小化后形成的直線.
實(shí)際資料的點(diǎn)和直線的差異稱為殘差(residuals(e)).擬合線,回歸方程式構(gòu)造ebScatterPlotYvs.XwithFit殘差(e)是對(duì)誤差的最佳推斷值,是實(shí)際結(jié)果值和回歸方程式推測(cè)的最佳值間的差異.殘差:實(shí)際觀測(cè)值(yi)和推測(cè)值的差殘差越小推斷的回歸式更能說明實(shí)際結(jié)果,殘差是誤差的最好的推斷值.殘差按大小排列或按資料的順序排列時(shí),它們以“0”為軸相對(duì)稱,并且不能存在特別的傾向.殘差(e)是對(duì)誤差的最佳推斷值,是實(shí)際結(jié)果值和回歸方程式推測(cè)大家用MINITAB對(duì)上述數(shù)據(jù)進(jìn)行回歸分析.打開:A13.mtw.下面是對(duì)硅膠強(qiáng)度有重要影響的SiO2使用量的關(guān)系的分析數(shù)據(jù).事例分析大家用MINITAB對(duì)上述數(shù)據(jù)進(jìn)行回歸分析.打開:A13Graph>Plot從散點(diǎn)圖看似乎有一定相關(guān)性!!!那么要進(jìn)一步分析有多少相關(guān)性...
Graph>Plot從散點(diǎn)圖看似乎有一定相關(guān)性!!!Stat>Regression>Regression回歸方程式方差分析Stat>Regression>Regressions: 殘差(誤差)的標(biāo)準(zhǔn)差。殘差為觀測(cè)值-預(yù)測(cè)值。換句話說,指觀測(cè)點(diǎn)至回歸方程式中描述的擬合線的距離。(對(duì)于優(yōu)秀的模型,此值應(yīng)較小)s=MS(error)1/2
R-Sq:由擬合線能夠“解釋”的總變差的百分?jǐn)?shù)。由“X”解釋的變差。(對(duì)于優(yōu)秀的模型,此值應(yīng)較大)
R-Sq(adj):對(duì)過于擬合情況(方程式中的變量過多)的調(diào)整,它將包括模型中的項(xiàng)數(shù)與觀測(cè)值的個(gè)數(shù)進(jìn)行對(duì)比
其中 n=觀測(cè)值數(shù)量
p=模型中項(xiàng)數(shù),包括常數(shù)
判斷的方法News: 殘差(誤差)的標(biāo)準(zhǔn)差。殘差為觀測(cè)值-預(yù)測(cè)值。換句話說,“X”變量的p值-速度
Ho:斜率=0
H1:斜率=0
或者,另一種表達(dá)方式:
Ho:“X”不顯著
H1:“X”顯著常數(shù)的p-值
H0:直線通過原點(diǎn)(0,0)…
(0硬度=0使用量)
H1:直線不通過原點(diǎn)(0,0)…結(jié)果判斷R2越大,模型對(duì)工序模擬得越好New“X”變量的p值-速度常數(shù)的p-值結(jié)果判斷R2越大,SSregression:
由模型中的“X”解釋變量“Y”的變動(dòng)每一X值對(duì)應(yīng)的模型預(yù)測(cè)值和Y的總平均值之差的平方和。SSerror:
未被解釋的“Y”的變差。每個(gè)數(shù)據(jù)點(diǎn)的Y觀測(cè)值和該 數(shù)據(jù)點(diǎn)Y的預(yù)測(cè)值之差的平方和。值越小越好。SStotal: Y值相對(duì)其平均值的總變差。結(jié)果判斷回歸項(xiàng)(的SS和MS)應(yīng)比誤差項(xiàng)的(SS和MS)大通過查看R-Sq,R-Sq(adj),s和p值來評(píng)估模型p-值應(yīng)<0.05,以表示統(tǒng)計(jì)顯著性(良好擬合的方程式)NewSSregression: 由模型中的“X”解釋變量“Stat>Regression>FittedLinePlot(擬合線)R-sq值稱為決定系數(shù),用R2
表示,范圍是0R21,R2
越接近1時(shí)可以說明越接近回歸線.Stat>Regression>FittedLinStat>Regression>FittedLinePlot
殘差分析StorageOprion中選擇Residual和
Fits時(shí),可得出如下數(shù)據(jù).
Stat>Regression>FittedLinStat>Regression>ResidualPlots(殘差圖表)殘差具有多少正態(tài)性條狀圖是鐘型的曲線嗎?要無視(<30)以下的資料.個(gè)別殘差能看出多少傾向?或異常點(diǎn)?是否沒有傾向,對(duì)“0”是隨機(jī)的?Stat>Regression>ResidualP回歸分析結(jié)果解釋
SiO2的使用量(X)與強(qiáng)度(Y)間的推斷回歸式是強(qiáng)度(Y)=3.07+6.9SiO2使用量(X).
且兩個(gè)變量回歸系數(shù)為72%,可以說具有強(qiáng)的關(guān)系.(使用Adj.R-sq)
即,用上述回歸直線可以說明的變動(dòng)量為72%.
觀察方差分析表回歸分析結(jié)果解釋回歸相關(guān)警告-圖表!!!R-Sq.66.2%R-Sq.66.2%R-Sq.66.2%R-Sq.66.2%對(duì)4個(gè)不同的資料群從基本統(tǒng)計(jì)結(jié)果來看似乎一樣,但期間很明顯有差異.總是要用一種以上的方法來看!!!不要忘記憶原始資料(rawdata)!!!→畫散點(diǎn)圖!!!回歸相關(guān)警告-圖表!!!R-Sq.66.2%R-Sq相關(guān)與回歸的概要相關(guān)分析可以作為非常有用的工具活用于實(shí)際生活中.相關(guān)關(guān)系是看出兩個(gè)連續(xù)型變量間相關(guān)性的尺度假定因果關(guān)系時(shí)需要更加注意.回歸模型將變量間的關(guān)系顯示為線型或非線型函數(shù).回歸分析可以從回歸式預(yù)測(cè)期望值.相關(guān)與回歸的概要相關(guān)分析可以作為非常有用的工具活用于實(shí)際生您相信我們的家電所占據(jù)的展示廳面積的大小會(huì)影響銷售量。您已經(jīng)收集了過去12個(gè)月內(nèi),多個(gè)零售點(diǎn)銷售量與總的占地面積方面的數(shù)據(jù)?,F(xiàn)在,您希望分析這些數(shù)據(jù),看占地面積是否確實(shí)與年銷售量存在某種關(guān)系。應(yīng)用所學(xué)的單變量回歸方法。準(zhǔn)備解釋您的答案、以及支持您的結(jié)論的結(jié)果。($K)(平方英尺)New您相信我們的家電所占據(jù)的展示廳面積的大小會(huì)影響銷售量。您已經(jīng)分析階段總結(jié)如果我們的數(shù)據(jù)量比較大,采集數(shù)據(jù)非常容易時(shí),我們可以使用描述型的統(tǒng)計(jì)工具進(jìn)行分析。1.如果想知道變量的分布形狀、平均值的位置、離散程度、傾斜度、峰態(tài)等具體的統(tǒng)計(jì)信息,可以用DisplayDescriptive
Statistics
工具來分析.2.如果我們想知道變量分布形狀、均值的大概位置、離散的程度的粗略信息時(shí),我們可以用Histogram、MultipleDotplot等工具分析.
3.如果我們要比較兩個(gè)變量或者想知道在不同“條件”下變量發(fā)生什么樣的變化時(shí),我們可以用Boxplot、MultipleDotplot工具來分析.
New分析階段總結(jié)如果我們的數(shù)據(jù)量比較大,采集數(shù)據(jù)非常容易時(shí),我們4.如果我們想知道變量之間的相互關(guān)系時(shí),可以使用Scatterplot
、
Marginalplot
(兩個(gè)變量之間的關(guān)系)和Matrixplot(多個(gè)變量之間的相互作用).5.如果我們想知道隨著時(shí)間變化,變量怎樣變化時(shí)可以使用Timeseries
plot進(jìn)行分析.
6.如果我們要知道多個(gè)輸入變量(X)對(duì)輸出變量(Y)的影響程度,可以使用Multi-VariChart、MainEffectsPlot進(jìn)行分析.7.如果我們要知道不良品,缺陷數(shù),爭(zhēng)議點(diǎn),事故的現(xiàn)象或原因等集中在哪些方面的時(shí)候,可以使用Paretochart、Piechart進(jìn)行分析.
New4.如果我們想知道變量之間的相互關(guān)系時(shí),可以使用Sc如果我們的數(shù)據(jù)量比較小,采集數(shù)據(jù)非常難,我們可以使用假設(shè)檢驗(yàn)工具對(duì)均值進(jìn)行分析。
一、我們涉及的數(shù)據(jù)是連續(xù)性的數(shù)據(jù)時(shí)1.如果我們想知道一個(gè)變量跟一個(gè)基準(zhǔn)值是否在統(tǒng)計(jì)意義上有顯著性差異的時(shí)候(也就是判斷這個(gè)變量是否發(fā)生了異常原因的波動(dòng)),可以使用1samplet工具分析.2.如果我們想知道兩個(gè)變量或者兩種水平下是否在統(tǒng)計(jì)意義上有顯著性差異的時(shí)候,可以使用2samplet、Pairedt工具分析.
3.如果我們要比較多個(gè)變量或者一個(gè)變量在多個(gè)水平下是否有顯著性差異時(shí),可以用ANOVA工具來分析.
New如果我們的數(shù)據(jù)量比較小,采集數(shù)據(jù)非常難,我們可以使New二、我們涉及的數(shù)據(jù)是離散型的數(shù)據(jù)時(shí)1.如果我們想知道一個(gè)變量跟一個(gè)基準(zhǔn)值是否在統(tǒng)計(jì)意義上有顯著性差異的時(shí)候(也就是判斷這個(gè)變量是否發(fā)生了異常原因的波動(dòng)),可以使用1Proportion工具分析.
2.如果我們想知道兩個(gè)變量或者兩種水平下是否在統(tǒng)計(jì)意義上有顯著性差異的時(shí)候,可以使用2Proportion工具分析.
3.如果我們要比較多個(gè)變量或者一個(gè)變量在多個(gè)水平下是否有顯著性差異時(shí),可以用Chi-squaretest工具來分析.
New二、我們涉及的數(shù)據(jù)是離散型的數(shù)據(jù)時(shí)New如果我們的數(shù)據(jù)量比較小,采集數(shù)據(jù)非常難,我們可以使用假設(shè)檢驗(yàn)工具對(duì)方差進(jìn)行分析。如果我們想知道兩個(gè)變量或多個(gè)變量的方差在統(tǒng)計(jì)意義上是否有顯著性差異的時(shí)候可以TestforEqualvariance進(jìn)行分析.如果我們想知道兩個(gè)變量之間有多強(qiáng)的關(guān)系是,可以使用
Correlation進(jìn)行分析,要求和Scatterplot和用.
如果我們想知道輸出變量和輸入變量之間的函數(shù)關(guān)系時(shí),可以使用Regression進(jìn)行分析.New如果我們的數(shù)據(jù)量比較小,采集數(shù)據(jù)非常難,我們可以使New(分析階段)(ZTE-GB402-V1.5)相關(guān)和回歸分析
(分析階段)(ZTE-GB402-V1.5)相關(guān)和回歸分析主要內(nèi)容1.相關(guān)分析2.回歸分析主要內(nèi)容1.相關(guān)分析
學(xué)習(xí)目的變量(X1)與變量(X2)間或X與Y間
-有多少相關(guān)性–相關(guān)分析
-變量間關(guān)系式的推測(cè)
–
回歸分析它們之間有關(guān)系嗎?有多強(qiáng)的關(guān)系?有什么樣的關(guān)系式?
機(jī)動(dòng)車的數(shù)量
vs
交通事故發(fā)生率網(wǎng)板厚度
vs焊膏厚度學(xué)習(xí)目的變量(X1)與變量(X2)間或X與Y間它們之間有1.相關(guān)關(guān)系是?相關(guān)關(guān)系可以用數(shù)據(jù)來看出兩個(gè)變量(Y與X,或兩個(gè)X)間緊密程度如何.兩者之間關(guān)系的強(qiáng)度通過相關(guān)系數(shù)(r)可以計(jì)數(shù)化.(Minitab使用Pearsonproductmoment相關(guān)系數(shù))-1.00+1.0負(fù)的相關(guān)系正的相關(guān)關(guān)系“r”
弱相關(guān)關(guān)系決定點(diǎn)1.相關(guān)關(guān)系是?相關(guān)關(guān)系可以用數(shù)據(jù)來看出兩個(gè)變量(Y與X,r值r
接近-1r
接近+1(+)正的相關(guān)關(guān)系()負(fù)的相關(guān)關(guān)系接近0時(shí)幾乎沒有相關(guān)關(guān)系相關(guān)系數(shù)的性質(zhì)為調(diào)查相關(guān)關(guān)系,需要數(shù)據(jù)構(gòu)造為成對(duì)的2個(gè)變量數(shù)據(jù)r值r接近-1r接近+1(+)正的相關(guān)關(guān)系相關(guān)系數(shù)相關(guān)系數(shù)(CorrelationCoefficient)
一般表示為(總體的相關(guān)關(guān)系),其范圍是11.
一般情況下我們無法知道的正確的值,因此使用從樣本推斷的值r.r從如下公式得出且范圍是-1r1.一般樣本大小(30個(gè)以上)為基準(zhǔn)
如果|r|>0.80時(shí)具有強(qiáng)的相關(guān)關(guān)系
如果0.3>|r|>0.80時(shí)具有弱的相關(guān)關(guān)系.
如果|r|<0.30時(shí)認(rèn)為沒有有效的關(guān)系.相關(guān)公式相關(guān)系數(shù)(CorrelationCoefficient)強(qiáng)的正相關(guān)弱的正相關(guān)中間程度的正相關(guān)|r
|=0.936|r
|=0.560|r
|=0.3390強(qiáng)的負(fù)相關(guān)弱的負(fù)相關(guān)中間程度的負(fù)相關(guān)相關(guān)的類型和大小強(qiáng)的正相關(guān)弱的正相關(guān)中間程度的正相關(guān)|r|=0.93判斷相關(guān)類型…對(duì)結(jié)果
Y影響最大的因子,可從點(diǎn)的密集程度判斷
單純通過散點(diǎn)圖分析相關(guān)關(guān)系時(shí)不客觀,因此需要客觀的分析,即可看出相關(guān)程度的指數(shù)(相關(guān)系數(shù)計(jì)算方法等)
相關(guān)系數(shù)計(jì)算方法是從直線的觀點(diǎn)進(jìn)行分析.
曲線關(guān)系時(shí),如果以相關(guān)系數(shù)方法計(jì)算時(shí)會(huì)出現(xiàn)錯(cuò)誤的結(jié)果.判斷相關(guān)類型…對(duì)結(jié)果Y影響最大的因子,可從點(diǎn)的密集程度判斷相關(guān)并不是分析所有的因果關(guān)系!即使證明Y與
X間具有相關(guān),也并不意味著Y的變動(dòng)一定是X的變動(dòng)引起的.可能存在引起X與Y同時(shí)變動(dòng)的第3個(gè)隱藏變量.
兩個(gè)變量間有關(guān)系的結(jié)論并不意味著因果關(guān)系.且樣本相關(guān)系數(shù)的值接近“0”表示
兩個(gè)變量間直線關(guān)系弱
,并不意味著兩個(gè)變量間沒有關(guān)系.相關(guān)的濫用與誤用相關(guān)并不是分析所有的因果關(guān)系!即使證明Y與X間具有相關(guān),也事例分析單板生產(chǎn)過程中,刮刀壓力可能會(huì)影響到焊膏的厚度,為了了解刮刀壓力和焊膏厚度的關(guān)系.為此我們進(jìn)行幾次實(shí)驗(yàn)后得出如下資料.求此資料的散點(diǎn)圖及總體的相關(guān)系數(shù).
打開
A_08.mtw.事例分析單板生產(chǎn)過程中,刮刀壓力可能會(huì)影響到焊膏的厚度,為了Stat>BasicStatistics>Correlation從上面點(diǎn)來看,可以猜測(cè)有強(qiáng)的相關(guān)關(guān)系Stat>BasicStatistics>Corr分析結(jié)果根據(jù)
刮刀壓力和焊膏厚度的相關(guān)系數(shù)為r=0.955,可看出具有強(qiáng)的負(fù)相關(guān).從上述結(jié)果可以得出:為了保證焊膏厚度符合要求.必須監(jiān)控刮刀的壓力.
統(tǒng)計(jì)分析
結(jié)果解釋分析結(jié)果根據(jù)刮刀壓力和焊膏厚度的相關(guān)系數(shù)為統(tǒng)計(jì)分析結(jié)果事例分析下面給出13家上市公司的每股賬面價(jià)值和每股紅利,以1.賬面價(jià)值作為橫軸,畫散點(diǎn)圖2.計(jì)算相關(guān)系數(shù)并解釋公司名稱賬面價(jià)值紅利海爾22.442.40中興23.542.98深科技22.092.06深發(fā)展14.481.09清華同方20.731.96上海一汽19.251.55第一鉛筆20.732.16陜西旅游26.431.60云南白藥12.140.8粵電力23.311.94北大方正16.233.00深彩虹18.051.80咸陽(yáng)偏轉(zhuǎn)12.451.21事例分析下面給出13家上市公司的每股賬面價(jià)值和每股紅利,以公從散點(diǎn)圖我們可以看出什么?相關(guān)系數(shù)可以看出什么?從散點(diǎn)圖我們可以看出什么?相關(guān)系數(shù)可以看出什么?通過它我們可以知道哪個(gè)輸入對(duì)輸出值有多少影響?為了得到想要的輸出值,我們應(yīng)按什么水平管理X的規(guī)格.回歸…尋找“Y”與“X”關(guān)系的方法什么是回歸?描述“Y”與“X”關(guān)系的數(shù)學(xué)方法-創(chuàng)建過程的“模型”。2.回歸分析回歸…尋找“Y”與“X”關(guān)系的方法2.回歸分析
相關(guān)是告訴關(guān)系的程度,回歸分析是找出Y=F(X)的函數(shù)關(guān)系式
回歸分析的種類
單純回歸模型:獨(dú)立變量為一個(gè)
多重回歸模型:獨(dú)立變量為兩個(gè)以上
例
Y=a+bx1+cx2+dx3
單純線性回歸模型:設(shè)定直線關(guān)系后分析
例
Y=a+bx
曲線回歸模型:設(shè)定曲線關(guān)系后分析
例
Y=a+bx+cx2+dx3
Y=a
bx相關(guān)是告訴關(guān)系的程度,回歸分析是找出Y=F(X)的函數(shù)關(guān)系單純線性回歸回歸分析的階段Data收集用散點(diǎn)圖確認(rèn)關(guān)系用最小二乘法推斷總體進(jìn)行方差分析畫直線(LineFitting)分析殘差此章的因子為一個(gè),因子和輸出值(Y)的關(guān)系為直線關(guān)系的單純線性回歸(SimpleLinearRegression)單純線性回歸回歸分析的階段Data收集用散點(diǎn)圖確認(rèn)關(guān)系用最通過樣本推測(cè)的直線未知的真實(shí)直線Yi=+xi+i
(i=1,.…,n)i
是相互獨(dú)立的遵守N(0,2)的概率變量單純線性回歸模型εiei(xi,yi)xy在這里,εi~iidN(0,σ2)Model
定義
一個(gè)獨(dú)立變量(x)與
一個(gè)從屬變量(Y)間的關(guān)系方程式化后顯示的方法通過樣本推測(cè)的直線未知的真實(shí)直線Yi=+xi+將誤差平方和最小化的推斷方法,找出將殘差平方最小化的直線.420410400390380370360350340330320350400450獨(dú)立變量從屬變量最小平方和的單純回歸單純回歸直線與回歸直線的差異(誤差)直線是以“最小平方和推斷法(leastsquareestimation)”的原則畫出的.從資料的點(diǎn)到直線的距離的平方和最小化.將誤差平方和最小化的推斷方法,找出將殘差平方最小化的直線.ebScatterPlotYvs.XwithFittedLineY=a+bX直線的方程式是
Y=a+bXa是
常數(shù),b是斜率.“擬合線”是包括實(shí)際點(diǎn)和直線的平方差的和最小化后形成的直線.
實(shí)際資料的點(diǎn)和直線的差異稱為殘差(residuals(e)).擬合線,回歸方程式構(gòu)造ebScatterPlotYvs.XwithFit殘差(e)是對(duì)誤差的最佳推斷值,是實(shí)際結(jié)果值和回歸方程式推測(cè)的最佳值間的差異.殘差:實(shí)際觀測(cè)值(yi)和推測(cè)值的差殘差越小推斷的回歸式更能說明實(shí)際結(jié)果,殘差是誤差的最好的推斷值.殘差按大小排列或按資料的順序排列時(shí),它們以“0”為軸相對(duì)稱,并且不能存在特別的傾向.殘差(e)是對(duì)誤差的最佳推斷值,是實(shí)際結(jié)果值和回歸方程式推測(cè)大家用MINITAB對(duì)上述數(shù)據(jù)進(jìn)行回歸分析.打開:A13.mtw.下面是對(duì)硅膠強(qiáng)度有重要影響的SiO2使用量的關(guān)系的分析數(shù)據(jù).事例分析大家用MINITAB對(duì)上述數(shù)據(jù)進(jìn)行回歸分析.打開:A13Graph>Plot從散點(diǎn)圖看似乎有一定相關(guān)性!!!那么要進(jìn)一步分析有多少相關(guān)性...
Graph>Plot從散點(diǎn)圖看似乎有一定相關(guān)性!!!Stat>Regression>Regression回歸方程式方差分析Stat>Regression>Regressions: 殘差(誤差)的標(biāo)準(zhǔn)差。殘差為觀測(cè)值-預(yù)測(cè)值。換句話說,指觀測(cè)點(diǎn)至回歸方程式中描述的擬合線的距離。(對(duì)于優(yōu)秀的模型,此值應(yīng)較小)s=MS(error)1/2
R-Sq:由擬合線能夠“解釋”的總變差的百分?jǐn)?shù)。由“X”解釋的變差。(對(duì)于優(yōu)秀的模型,此值應(yīng)較大)
R-Sq(adj):對(duì)過于擬合情況(方程式中的變量過多)的調(diào)整,它將包括模型中的項(xiàng)數(shù)與觀測(cè)值的個(gè)數(shù)進(jìn)行對(duì)比
其中 n=觀測(cè)值數(shù)量
p=模型中項(xiàng)數(shù),包括常數(shù)
判斷的方法News: 殘差(誤差)的標(biāo)準(zhǔn)差。殘差為觀測(cè)值-預(yù)測(cè)值。換句話說,“X”變量的p值-速度
Ho:斜率=0
H1:斜率=0
或者,另一種表達(dá)方式:
Ho:“X”不顯著
H1:“X”顯著常數(shù)的p-值
H0:直線通過原點(diǎn)(0,0)…
(0硬度=0使用量)
H1:直線不通過原點(diǎn)(0,0)…結(jié)果判斷R2越大,模型對(duì)工序模擬得越好New“X”變量的p值-速度常數(shù)的p-值結(jié)果判斷R2越大,SSregression:
由模型中的“X”解釋變量“Y”的變動(dòng)每一X值對(duì)應(yīng)的模型預(yù)測(cè)值和Y的總平均值之差的平方和。SSerror:
未被解釋的“Y”的變差。每個(gè)數(shù)據(jù)點(diǎn)的Y觀測(cè)值和該 數(shù)據(jù)點(diǎn)Y的預(yù)測(cè)值之差的平方和。值越小越好。SStotal: Y值相對(duì)其平均值的總變差。結(jié)果判斷回歸項(xiàng)(的SS和MS)應(yīng)比誤差項(xiàng)的(SS和MS)大通過查看R-Sq,R-Sq(adj),s和p值來評(píng)估模型p-值應(yīng)<0.05,以表示統(tǒng)計(jì)顯著性(良好擬合的方程式)NewSSregression: 由模型中的“X”解釋變量“Stat>Regression>FittedLinePlot(擬合線)R-sq值稱為決定系數(shù),用R2
表示,范圍是0R21,R2
越接近1時(shí)可以說明越接近回歸線.Stat>Regression>FittedLinStat>Regression>FittedLinePlot
殘差分析StorageOprion中選擇Residual和
Fits時(shí),可得出如下數(shù)據(jù).
Stat>Regression>FittedLinStat>Regression>ResidualPlots(殘差圖表)殘差具有多少正態(tài)性條狀圖是鐘型的曲線嗎?要無視(<30)以下的資料.個(gè)別殘差能看出多少傾向?或異常點(diǎn)?是否沒有傾向,對(duì)“0”是隨機(jī)的?Stat>Regression>ResidualP回歸分析結(jié)果解釋
SiO2的使用量(X)與強(qiáng)度(Y)間的推斷回歸式是強(qiáng)度(Y)=3.07+6.9SiO2使用量(X).
且兩個(gè)變量回歸系數(shù)為72%,可以說具有強(qiáng)的關(guān)系.(使用Adj.R-sq)
即,用上述回歸直線可以說明的變動(dòng)量為72%.
觀察方差分析表回歸分析結(jié)果解釋回歸相關(guān)警告-圖表!!!R-Sq.66.2%R-Sq.66.2%R-Sq.66.2%R-Sq.66.2%對(duì)4個(gè)不同的資料群從基本統(tǒng)計(jì)結(jié)果來看似乎一樣,但期間很明顯有差異.總是要用一種以上的方法來看!!!不要忘記憶原始資料(rawdata)!!!→畫散點(diǎn)圖!!!回歸相關(guān)警告-圖表!!!R-Sq.66.2%R-Sq相關(guān)與回歸的概要相關(guān)分析可以作為非常有用的工具活用于實(shí)際生活中.相關(guān)關(guān)系是看出兩個(gè)連續(xù)型變量間相關(guān)性的尺度假定因果關(guān)系時(shí)需要更加注意.回歸模型將變量間的關(guān)系顯示為線型或非線型函數(shù).回歸分析可以從回歸式預(yù)測(cè)期望值.相關(guān)與回歸的概要相關(guān)分析可以作為非常有用的工具活用于實(shí)際生您相信我們的家電所占據(jù)的展示廳面積的大小會(huì)影響銷售量。您已經(jīng)收集了過去12個(gè)月內(nèi),多個(gè)零售點(diǎn)銷售量與總的占地面積方面的數(shù)據(jù)?,F(xiàn)在,您希望分析這些數(shù)據(jù),看占地面積是否確實(shí)與年銷售量存在某種關(guān)系。應(yīng)用所學(xué)的單變量回歸方法。準(zhǔn)備解釋您的答案、以及支持您的結(jié)論的結(jié)果。($K)(平方英尺)New您相信我們的家電所占據(jù)的展示廳面積的大小會(huì)影響銷售量。您已經(jīng)分析階段總結(jié)如果我們的數(shù)據(jù)量比較大,采集數(shù)據(jù)非常容易時(shí),我們可以使用描述型的統(tǒng)計(jì)工具進(jìn)行分析。1.如果想知道變量的分布形狀、平均值
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中國(guó)六位機(jī)械計(jì)數(shù)器市場(chǎng)調(diào)查研究報(bào)告
- 2025年轉(zhuǎn)向中間臂支架項(xiàng)目可行性研究報(bào)告
- 常州2025年江蘇常州市衛(wèi)生健康委員會(huì)直屬事業(yè)單位招聘高層次緊缺專業(yè)人才269人(定期)筆試歷年參考題庫(kù)附帶答案詳解
- 2025年生化儀器項(xiàng)目可行性研究報(bào)告
- 成都2024年四川成都經(jīng)開區(qū)(龍泉驛區(qū))招聘教育人才11人筆試歷年參考題庫(kù)附帶答案詳解
- 2025年智能程序溫控箱項(xiàng)目可行性研究報(bào)告
- 2025至2031年中國(guó)噴灌機(jī)管道行業(yè)投資前景及策略咨詢研究報(bào)告
- 2025年雙色底項(xiàng)目可行性研究報(bào)告
- 2025至2030年中國(guó)袋裝水簡(jiǎn)易連接器數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025年X射線探測(cè)器項(xiàng)目可行性研究報(bào)告
- 2024-2030年中國(guó)免疫細(xì)胞存儲(chǔ)行業(yè)發(fā)展模式及投資戰(zhàn)略分析報(bào)告
- 家庭清潔課件教學(xué)課件
- 湖南財(cái)政經(jīng)濟(jì)學(xué)院《常微分方程》2023-2024學(xué)年第一學(xué)期期末試卷
- 2011年公務(wù)員國(guó)考《申論》真題卷及答案(地市級(jí))
- 《籃球體前變向運(yùn)球技術(shù)》教案(共三篇)
- 多元化評(píng)價(jià)體系構(gòu)建
- 部編版六年級(jí)下冊(cè)道德與法治全冊(cè)教案教學(xué)設(shè)計(jì)
- DBJ04∕T 290-2012 袖閥管注漿加固地基技術(shù)規(guī)程
- GB/T 17775-2024旅游景區(qū)質(zhì)量等級(jí)劃分
- 燈籠彩燈安裝合同范本
- 物流無人機(jī)垂直起降場(chǎng)選址與建設(shè)規(guī)范
評(píng)論
0/150
提交評(píng)論