




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
清華大學建筑學院
參數估計與回歸分析參數估計對于許多要研究的對象(總體)不可能“窮盡”地一一調查測量,只能隨機地抽取一部分“樣本”,根據樣本的數據來估計總體的“真值”。有的情況是知道(分析出)隨機變量的分布形態(tài):泊松分布,正態(tài)分布等,如何根據樣本數據,“估計”出該分布的參數,如泊松分布的λ,正態(tài)分布的μ和σ例:設某炸藥廠一天中發(fā)生著火現象的次數X服從
對于泊松分布,只有一個參數λ要估計。λ的估計值就是樣本平均數:驗證一下:k=0樣本計算p=75/250=0.3;公式計算:0.295k=1樣本計算p=90/250=0.36;公式計算:0.360k=2樣本計算p=54/250=0.216;公式計算:0.220k=3樣本計算p=22/250=0.088;公式計算:0.089e-λ=e-1.22
=0.29523
對于正態(tài)分布,有兩個參數μ和σ要估計。μ的估計值就是樣本平均數,σ的估計值就是樣本方差的平方根:
這在講概率分布時已經提到。對于二項分布有一個參數p要估計:p的估計值就是樣本平均數:
“十年一遇”,就是根據歷史記錄,發(fā)生該現象的統(tǒng)計平均是p=0.1
區(qū)間估計上面討論的參數估計,是用樣本的數值來估計總體的參數。但是,每一次樣本試驗得到的參數估計值是不同的。例如我們可以認定某個年齡段(10歲)兒童(男童或女童)的身高(作為總體)滿足正態(tài)分布,參數均值μ的估計值可以通過100名兒童身高的測量值的平均數得到。但再測量100名兒童,可能得到不同的值。多次做100名兒童身高的測量得到的值盡管各不相同,但都處于某個區(qū)間范圍之內,把這些值加以平均的到的值(例如6次測量,共600名兒童平均)是否更“可信”一些?比做3次測量是否更可信一些,即“置信度”更高?還有一個問題:對不同的總體(或不同的組分,如男童和女童分開),抽樣得到樣本值離散性可能不同,即計算出的方差σ不同,有的組分(男童)樣本值之間差異?。é倚。?,有的組分(女童)樣本值之間差異大(σ大)。那么試驗次數相同下,得到均值μ的估計值的“可信度”一樣嗎?方差σ大(離散性大)的組分試驗的次數(樣本的數量)是否應當多一些呢?這就要引入統(tǒng)計數據處理的“區(qū)間估計”。
通常,采用95%的置信度,有時也取99%或90%均值的區(qū)間估計已知方差,估計均值1、在總體服從正態(tài)分布的情況下,從某校學生中隨機抽選100人,調查到平均每天鍛煉時間為30分鐘,樣本方差為36。
試以95%的置信度來估計該校學生平均每天鍛煉的時間。解得:[28.81,
31.19]練習:2.某醫(yī)院欲估計一名醫(yī)生花在每個病人身上的平均時間。設要求置信度為95%,允許的誤差范圍在±2分鐘。依以前的經驗看病時間的標準差為6分鐘。
試問需要多大的樣本量(n=35)?解:上一屆同學在《建筑數學》課堂上,每人當場測量自己心律的統(tǒng)計(次/分鐘),共192人。那么,總體分布的平均數標準差在正態(tài)分布表中,置信度90%,即α=0.10,λ=1.65置信度95%,即α=0.05,λ=1.96置信度99%,即α=0.01,λ=2.58回歸分析
英國著名人類學家FranicsGalton
高爾頓(1822-1911)于1885年發(fā)表論文《身高遺傳向平均數方向的回歸》,分析兒童身高與父母身高之間的關系,發(fā)現父母的身高可以預測子女的身高,當父母越高或越矮時,子女的身高會比一般兒童高或矮,他將兒子與父母身高的這種現象擬合出一種線形關系。但他還發(fā)現,當父母非常高(或非常矮),其子女的身高不會象父母那樣非常高(或非常矮),而是比其父母更接近平均身高。高爾頓選用“回歸”(regression)一詞。高爾頓和他的學生K.Pearson觀察了1078對夫婦,分析出兒子的身高y與父親的身高x大致可歸結為以下關系:
y
=
0.516
x
+
33.73
(單位為英寸)
回歸分析(regressionanalysis)是確定兩種或兩種以上變數間相互依賴的定量關系的一種統(tǒng)計分析方法。在調查觀察中,會得到各種變量的樣本值,會發(fā)現某種變量與另一種變量之間有“相關”性。例如,住宅面積與經濟指數,經濟狀況好(指數高),住宅建設面積就大。能否用定量化的函數來表示兩者間的依賴關系?
首先觀察到樣本散點圖近似于一條直線,可以用一個線性函數來擬合:y=a+bx稱為線性回歸。需要確定a和b兩個參數。如果按圖中紅線來擬合,所有樣本點xi的擬合值都大于樣本值yi,如果按圖中藍線來擬合,所有樣本點xi的擬合值都小于樣本值yi,兩者都不合適。顯然,擬合的直線應“貫穿”于散點之中,如圖中黑線所示,以做到各樣本點的樣本值yi與擬合值
的差值:的平方和最小。即構建一個以回歸系數a和b為變量的誤差函數:按函數的微分極值原理,求其在取極小值時的a和b的取值,就可得到線性回歸方程y=a+bx。此為最小二乘法。
相關系數0.95,表示住宅建設面積與經濟指數確實相關。具體計算方法見下表:計算x的平均數、y的平均數,∑x2、∑y2和∑xy,即可計算回歸系數a和b。
相關系數r:0<|r|<1,r為正值即正相關,x增,y也增;r為負值即負相關,x增,y減。|r|接近1,表示y與x有很強的相關性,樣本值散點分布接近直線;|r|接近0,表示y與x相關性弱,樣本值散點分布很分散。高斯最小二乘法計算谷神星軌道
1801年,高斯用數學方預測出一顆小行星的軌道。天文學家在高斯指出的位置發(fā)現了小行星,后來被命名為谷神星(Ceres)。高斯8年后系統(tǒng)地完善了相關的數學理論,才將他的方法公布于眾,即“最小二乘法”。一元非線性回歸當因變量Y與自變量x之間沒有線性關系時,一般用回歸曲線y=
f
(x)來描述它們之間的關系。但是通常可以采用簡單的變量變換,把非線性回歸的問題轉化為線性回歸來處理。
幾種常見的曲線方程,化為線性問題的變換公式:(1)列表,數據計算。多元回歸分析1.二元線性回歸方程
實際中,會需研究一個變量與多個變量之間的定量關系,就是多元分析問題。
上式稱為回歸平面,β0是常數,β1
,β2為回歸系數。
設隨機變量Y,自變量x1和x2,有:
有n
組觀測值:由多元函數極值原理,有:即整理得到:由第3式,得:代入第1,2式,消去β0得:其中:解得:例1:某公司的商品在15地區(qū)銷量y和人口數x1、戶均總收入x2資料見表。試求銷量對人口數、戶均總收入的回歸方程。按計算公式所求回歸方程:西安機場航空客運量與國民生產的總值和旅游游客量二元回歸。根據1980-1994年陜西省的GNP(X1)和旅游游客量(X2)的數據,與西安機場年旅客吞吐量(y),作二元回歸,得到回歸方程。再了解了陜西省人大制定的十年經濟發(fā)展計劃和旅游事業(yè)規(guī)劃的數據,預測未來10年的航空客運量。
年旅客吞吐量y與GNP指數x1和旅游游客量指數x2的二元回歸方程:根據1980~1993年的實際數據(樣本數據),求算回歸系數:β0β1β2
上述二元相關分析的航空客運量的實際值
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度房地產項目增資入股投資協議
- 二零二五年度辦公室文員聘用與企業(yè)文化融合協議
- 二零二五年度新能源汽車碰撞責任免除合同
- 2025年度現代農業(yè)病蟲害防治藥害賠償協議書
- 二零二五年度勞動局標準合同:養(yǎng)老服務業(yè)員工就業(yè)保障協議范本
- 2025年度賬戶變更補充服務協議
- 高性能計算中心設備采購及安裝合同
- 企業(yè)辦公室裝飾設計與施工服務合同
- 教育培訓行業(yè)線上課程開發(fā)與運營計劃書
- 電氣設備安裝工程施工合同新
- 2《中國老年糖尿病診療指南(2024年版)》解讀
- 國自科項目申報協議書模板
- 行政或后勤崗位招聘筆試題及解答(某大型國企)2025年
- 2024年北京中考地理試卷
- 四川蜀道集團筆試題
- 零食門市轉讓協議書范本
- 電氣自動化工程師考試題庫
- 小學利潤問題應用題100道附答案(完整版)
- 醫(yī)院智能化系統(tǒng)內網、外網及設備網系統(tǒng)拓撲圖-可編輯課件
- 小學生心理健康主題家長會
- 社交禮儀-儀態(tài)禮儀
評論
0/150
提交評論