數(shù)學(xué)建模中的統(tǒng)計(jì)學(xué)_第1頁(yè)
數(shù)學(xué)建模中的統(tǒng)計(jì)學(xué)_第2頁(yè)
數(shù)學(xué)建模中的統(tǒng)計(jì)學(xué)_第3頁(yè)
數(shù)學(xué)建模中的統(tǒng)計(jì)學(xué)_第4頁(yè)
數(shù)學(xué)建模中的統(tǒng)計(jì)學(xué)_第5頁(yè)
已閱讀5頁(yè),還剩23頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)學(xué)建模中的統(tǒng)計(jì)學(xué)描述性數(shù)據(jù)分析假設(shè)檢驗(yàn)主成分分析線性回歸模型1描述性數(shù)據(jù)分析直方圖、條形圖概括統(tǒng)計(jì)量(平均數(shù)、中位數(shù)、眾數(shù)、百分位數(shù)和四分位數(shù)、方差和標(biāo)準(zhǔn)差、極值與四分位間距、變異系數(shù)、相關(guān)系數(shù)、學(xué)生氏化)2直方圖和條形圖3 序號(hào) 組 頻數(shù) 頻率 1 (987,990 2 0.067 2 (990,993 1 0.038 3 (993,996 3 0.100 4 (996,999 5 0.167 5 (999,1002 7 0.233 6(1002,1005 6 0.200 7(1005,1008 3 0.100 8(1008,1011 1 0.033 9(1011,1014 1 0.033

2、 10(1014,1017 1 0.0334例:一分鐘內(nèi)碰撞某宇宙裝置的宇宙粒子,連續(xù)記錄40分鐘,得如右數(shù)據(jù):宇宙粒子個(gè)數(shù) 頻數(shù) 頻率 0 13 0.325 1 13 0.325 2 8 0.200 3 5 0.125 4 1 0.0255 條形圖6統(tǒng) 計(jì) 量它反映了總體均值的信息它反映了總體方差的信息7它反映了總體k 階矩的信息它反映了總體k 階中心矩的信息8異常點(diǎn)檢驗(yàn)在正態(tài)分布中代表標(biāo)準(zhǔn)差,代表均值x=即為圖像的對(duì)稱軸三原則即為數(shù)值分布在(,+)中的概率為0.6826數(shù)值分布在(2,+2)中的概率為0.9544數(shù)值分布在(3,+3)中的概率為0.9974如果在一組數(shù)據(jù)中,數(shù)值落在樣本均值

3、的三倍標(biāo)準(zhǔn)差以外,我們認(rèn)為該數(shù)據(jù)是異常值,需要剔除。如今年的全國(guó)賽A題 9假設(shè)檢驗(yàn)10兩類錯(cuò)誤概率能否同時(shí)控制得很?。?1單個(gè)正態(tài)總體的均值檢驗(yàn)斷言:在座的各位平均身高是170cm。要檢驗(yàn)這句話正確與否,我們可以采用單正態(tài)總體的均值檢驗(yàn)。12單正態(tài)總體下的抽樣分布13單正態(tài)總體均值檢驗(yàn)14獨(dú)立性檢驗(yàn) 列聯(lián)表獨(dú)立性檢驗(yàn)是卡方擬合優(yōu)度檢驗(yàn)的一個(gè)特例,人們將兩個(gè)或多個(gè)特征分類數(shù)據(jù)即交叉分類數(shù)據(jù)以表格形式列出即列聯(lián)表,從而利用這些數(shù)據(jù)用來(lái)研究?jī)煞N或多種分類之間是否有某種聯(lián)系。 15 1976-1977 年美國(guó)佛羅里達(dá)州29 個(gè)地區(qū)發(fā)生兇殺案中被告人判死刑的情況,白人參與兇殺案中被判死刑的比例要比黑人參

4、與兇殺案中被判死刑的比例要高,那是不是在美國(guó)社會(huì)就不存在兇殺案判罰上的種族問(wèn)題呢? 16 在兇殺案的判罰上,不僅僅要看被告人的膚色,還要看被害人的膚色。我們把情況分為四種情況:分別為白人殺害黑人,黑人殺害黑人,白人殺害白人,黑人殺害白人,一般來(lái)說(shuō)后兩種情況被告人被判死刑的概率要比前兩種情況大得多,這是美國(guó)社會(huì)的種族歧視在其中所起的作用。17主成分分析主要用于變量降維,主成分分析經(jīng)常用減少數(shù)據(jù)集的維數(shù),同時(shí)保持?jǐn)?shù)據(jù)集的對(duì)方差貢獻(xiàn)最大的特征。這是通過(guò)保留低階主成分,忽略高階主成分做到的。PCA的數(shù)學(xué)定義是:一個(gè)正交化線性變換,把數(shù)據(jù)變換到一個(gè)新的坐標(biāo)系統(tǒng)中,使得這一數(shù)據(jù)的任何投影的第一大方差在第一

5、個(gè)坐標(biāo)(稱為第一主成分)上,第二大方差在第二個(gè)坐標(biāo)(第二主成分)上,依次類推1819 回歸分析簡(jiǎn)述20 函數(shù)關(guān)系表達(dá)的是變量之間數(shù)量上的確定性關(guān)系,設(shè)x為自變量,y為因變量,則x與y之間的函數(shù)關(guān)系為: 21 變量之間具有密切關(guān)聯(lián)而又不能由一個(gè)或某一些變量唯一確定另外一個(gè)變量的關(guān)系稱為變量之間的相關(guān)關(guān)系.22(a) 函數(shù)關(guān)系00(b) 統(tǒng)計(jì)關(guān)系23 “回歸”名稱的由來(lái),統(tǒng)計(jì)史上一般歸功于英國(guó)生物學(xué)家兼統(tǒng)計(jì)學(xué)家F.高爾頓(F.Galton,1822-1911)及他的學(xué)生現(xiàn)代統(tǒng)計(jì)學(xué)家的奠基者之一K.皮爾遜(K.Pearson).24這1078對(duì)夫婦平均身高為英寸,而子代平均身高(單位:英寸)他們?cè)谘?/p>

6、究父母身高與其子女身高的遺傳問(wèn)題時(shí),觀察了1078對(duì)夫婦,以每對(duì)夫婦的平均身高作為x,而取他們的一個(gè)成年兒子的身高作為y,將結(jié)果在平面直角坐標(biāo)系上給出散點(diǎn)圖,發(fā)現(xiàn)趨勢(shì)近于一直線,并計(jì)算得回歸直線25四 回歸方程的顯著性檢驗(yàn)回歸方程的假設(shè)檢驗(yàn)包含兩個(gè)內(nèi)容:(一)檢驗(yàn)變量之間的總體線性關(guān)系是否顯著,即檢驗(yàn)自變量與應(yīng)變量之間的關(guān)系能否用一個(gè)適當(dāng)?shù)幕貧w模型來(lái)表示。(二)檢驗(yàn)回歸參數(shù),即檢驗(yàn)回歸模型中每一自變量對(duì)因變量對(duì)影響程度是否顯著。26 這兩種檢驗(yàn)在次序上不能顛倒的,因?yàn)橹挥挟?dāng)回歸模型所代表的變量之間的線性關(guān)系通過(guò)檢驗(yàn)后,進(jìn)一步檢驗(yàn)?zāi)P椭械膫€(gè)別回歸參數(shù)才有意義。如果某個(gè)回歸模型本身是個(gè)錯(cuò)誤的模型,那就沒有必

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論