數(shù)學(xué)建模中的統(tǒng)計學(xué)_第1頁
數(shù)學(xué)建模中的統(tǒng)計學(xué)_第2頁
數(shù)學(xué)建模中的統(tǒng)計學(xué)_第3頁
數(shù)學(xué)建模中的統(tǒng)計學(xué)_第4頁
數(shù)學(xué)建模中的統(tǒng)計學(xué)_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、數(shù)學(xué)建模中的統(tǒng)計學(xué)描述性數(shù)據(jù)分析假設(shè)檢驗主成分分析線性回歸模型1描述性數(shù)據(jù)分析直方圖、條形圖概括統(tǒng)計量(平均數(shù)、中位數(shù)、眾數(shù)、百分位數(shù)和四分位數(shù)、方差和標(biāo)準(zhǔn)差、極值與四分位間距、變異系數(shù)、相關(guān)系數(shù)、學(xué)生氏化)2直方圖和條形圖3 序號 組 頻數(shù) 頻率 1 (987,990 2 0.067 2 (990,993 1 0.038 3 (993,996 3 0.100 4 (996,999 5 0.167 5 (999,1002 7 0.233 6(1002,1005 6 0.200 7(1005,1008 3 0.100 8(1008,1011 1 0.033 9(1011,1014 1 0.033

2、 10(1014,1017 1 0.0334例:一分鐘內(nèi)碰撞某宇宙裝置的宇宙粒子,連續(xù)記錄40分鐘,得如右數(shù)據(jù):宇宙粒子個數(shù) 頻數(shù) 頻率 0 13 0.325 1 13 0.325 2 8 0.200 3 5 0.125 4 1 0.0255 條形圖6統(tǒng) 計 量它反映了總體均值的信息它反映了總體方差的信息7它反映了總體k 階矩的信息它反映了總體k 階中心矩的信息8異常點檢驗在正態(tài)分布中代表標(biāo)準(zhǔn)差,代表均值x=即為圖像的對稱軸三原則即為數(shù)值分布在(,+)中的概率為0.6826數(shù)值分布在(2,+2)中的概率為0.9544數(shù)值分布在(3,+3)中的概率為0.9974如果在一組數(shù)據(jù)中,數(shù)值落在樣本均值

3、的三倍標(biāo)準(zhǔn)差以外,我們認(rèn)為該數(shù)據(jù)是異常值,需要剔除。如今年的全國賽A題 9假設(shè)檢驗10兩類錯誤概率能否同時控制得很???11單個正態(tài)總體的均值檢驗斷言:在座的各位平均身高是170cm。要檢驗這句話正確與否,我們可以采用單正態(tài)總體的均值檢驗。12單正態(tài)總體下的抽樣分布13單正態(tài)總體均值檢驗14獨立性檢驗 列聯(lián)表獨立性檢驗是卡方擬合優(yōu)度檢驗的一個特例,人們將兩個或多個特征分類數(shù)據(jù)即交叉分類數(shù)據(jù)以表格形式列出即列聯(lián)表,從而利用這些數(shù)據(jù)用來研究兩種或多種分類之間是否有某種聯(lián)系。 15 1976-1977 年美國佛羅里達(dá)州29 個地區(qū)發(fā)生兇殺案中被告人判死刑的情況,白人參與兇殺案中被判死刑的比例要比黑人參

4、與兇殺案中被判死刑的比例要高,那是不是在美國社會就不存在兇殺案判罰上的種族問題呢? 16 在兇殺案的判罰上,不僅僅要看被告人的膚色,還要看被害人的膚色。我們把情況分為四種情況:分別為白人殺害黑人,黑人殺害黑人,白人殺害白人,黑人殺害白人,一般來說后兩種情況被告人被判死刑的概率要比前兩種情況大得多,這是美國社會的種族歧視在其中所起的作用。17主成分分析主要用于變量降維,主成分分析經(jīng)常用減少數(shù)據(jù)集的維數(shù),同時保持?jǐn)?shù)據(jù)集的對方差貢獻(xiàn)最大的特征。這是通過保留低階主成分,忽略高階主成分做到的。PCA的數(shù)學(xué)定義是:一個正交化線性變換,把數(shù)據(jù)變換到一個新的坐標(biāo)系統(tǒng)中,使得這一數(shù)據(jù)的任何投影的第一大方差在第一

5、個坐標(biāo)(稱為第一主成分)上,第二大方差在第二個坐標(biāo)(第二主成分)上,依次類推1819 回歸分析簡述20 函數(shù)關(guān)系表達(dá)的是變量之間數(shù)量上的確定性關(guān)系,設(shè)x為自變量,y為因變量,則x與y之間的函數(shù)關(guān)系為: 21 變量之間具有密切關(guān)聯(lián)而又不能由一個或某一些變量唯一確定另外一個變量的關(guān)系稱為變量之間的相關(guān)關(guān)系.22(a) 函數(shù)關(guān)系00(b) 統(tǒng)計關(guān)系23 “回歸”名稱的由來,統(tǒng)計史上一般歸功于英國生物學(xué)家兼統(tǒng)計學(xué)家F.高爾頓(F.Galton,1822-1911)及他的學(xué)生現(xiàn)代統(tǒng)計學(xué)家的奠基者之一K.皮爾遜(K.Pearson).24這1078對夫婦平均身高為英寸,而子代平均身高(單位:英寸)他們在研

6、究父母身高與其子女身高的遺傳問題時,觀察了1078對夫婦,以每對夫婦的平均身高作為x,而取他們的一個成年兒子的身高作為y,將結(jié)果在平面直角坐標(biāo)系上給出散點圖,發(fā)現(xiàn)趨勢近于一直線,并計算得回歸直線25四 回歸方程的顯著性檢驗回歸方程的假設(shè)檢驗包含兩個內(nèi)容:(一)檢驗變量之間的總體線性關(guān)系是否顯著,即檢驗自變量與應(yīng)變量之間的關(guān)系能否用一個適當(dāng)?shù)幕貧w模型來表示。(二)檢驗回歸參數(shù),即檢驗回歸模型中每一自變量對因變量對影響程度是否顯著。26 這兩種檢驗在次序上不能顛倒的,因為只有當(dāng)回歸模型所代表的變量之間的線性關(guān)系通過檢驗后,進(jìn)一步檢驗?zāi)P椭械膫€別回歸參數(shù)才有意義。如果某個回歸模型本身是個錯誤的模型,那就沒有必

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論