數(shù)理統(tǒng)計(jì)課件:數(shù)理統(tǒng)計(jì)介紹_第1頁
數(shù)理統(tǒng)計(jì)課件:數(shù)理統(tǒng)計(jì)介紹_第2頁
數(shù)理統(tǒng)計(jì)課件:數(shù)理統(tǒng)計(jì)介紹_第3頁
數(shù)理統(tǒng)計(jì)課件:數(shù)理統(tǒng)計(jì)介紹_第4頁
數(shù)理統(tǒng)計(jì)課件:數(shù)理統(tǒng)計(jì)介紹_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

數(shù)理統(tǒng)計(jì)緒論

數(shù)理統(tǒng)計(jì)介紹1.1.1數(shù)理統(tǒng)計(jì)學(xué)的任務(wù)自然界現(xiàn)象分為兩大類確定性現(xiàn)象隨機(jī)現(xiàn)象用隨機(jī)變量(向量)描述但是,在許多實(shí)際問題中,描述隨機(jī)現(xiàn)象的隨機(jī)變量的概率分布完全未知或不完全知道.此時(shí),如何研究隨機(jī)現(xiàn)象中的有關(guān)問題呢?隨機(jī)變量的概率分布不確定,

是數(shù)理統(tǒng)計(jì)研究的第一前提!統(tǒng)計(jì)學(xué)的任務(wù)是研究如何有效地收集、整理和分析帶有隨機(jī)性影響的數(shù)據(jù),從而對所考慮的問題作出一定結(jié)論的方法和理論.研究統(tǒng)計(jì)學(xué)方法中理論基礎(chǔ)問題那部分構(gòu)成數(shù)理統(tǒng)計(jì)的內(nèi)容.統(tǒng)計(jì)學(xué)是數(shù)據(jù)科學(xué),用數(shù)據(jù)(事實(shí))說話:有理有據(jù)說理.解決實(shí)際問題的過程對隨機(jī)現(xiàn)象進(jìn)行試驗(yàn)或觀測,以有效的方式收集、整理和分析帶有隨機(jī)性影響的數(shù)據(jù),以便對所考察的問題作出推斷和預(yù)測,直至為采取一定的決策和行動(dòng)提供依據(jù)和建議.數(shù)據(jù)帶有隨機(jī)性是數(shù)理統(tǒng)計(jì)研究的第二前提!收集數(shù)據(jù)的方法全面調(diào)查抽樣調(diào)查安排試驗(yàn)有效的收集數(shù)據(jù)1下面通過例子詳細(xì)說明例1.1.1人口普查和抽樣調(diào)查普查又稱全面調(diào)查,因普查費(fèi)用高、時(shí)間長,不常使用,破壞性檢查(如燈泡壽命試驗(yàn))更不會(huì)使用.只有在少數(shù)重要場合才會(huì)使用普查.如我國規(guī)定每十年進(jìn)行一次人口普查,期間九年中每年進(jìn)行一次人口抽樣調(diào)查.抽樣調(diào)查在全面調(diào)查不可靠時(shí)的一種補(bǔ)充方法.如何安排抽樣調(diào)查,是有效收集數(shù)據(jù)的一個(gè)重要問題.——抽樣調(diào)查方法例1.1.2考察某地區(qū)10000戶農(nóng)戶的經(jīng)濟(jì)狀況若該地區(qū)分為平原和山區(qū)兩部分,平原較富,占該地區(qū)農(nóng)戶的70%,而占30%的山區(qū)農(nóng)戶較窮.抽樣方案規(guī)定在抽取的100戶中,從平原地區(qū)抽70戶,山區(qū)抽30戶,之后在各自范圍內(nèi)用隨機(jī)化方法抽取.從中挑選100戶做抽樣調(diào)查.收集數(shù)據(jù)中,數(shù)據(jù)必須帶有隨機(jī)性例1.1.2中,隨機(jī)性:抽樣的100戶農(nóng)戶是從10000戶農(nóng)戶中按照一定的方式“隨機(jī)抽取”的;代表性:平原和山區(qū)按照比例抽取.假如只在該地區(qū)富裕的那部分農(nóng)戶中挑選,得到的數(shù)據(jù)就不具有代表性,更談不上有效.例1.1.2中,有效收集數(shù)據(jù)是通過合理的設(shè)計(jì)抽樣方案實(shí)現(xiàn).例1.1.3.(提高某化工產(chǎn)品轉(zhuǎn)化率的試驗(yàn))某種化工產(chǎn)品的轉(zhuǎn)化率可能與反應(yīng)溫度A、反應(yīng)時(shí)間B、某兩種原料配比C、真空度D有關(guān).為尋找最優(yōu)的生產(chǎn)條件,以提高該化工產(chǎn)品的轉(zhuǎn)化率,因此考慮對A、B、C、D這四個(gè)因素進(jìn)行試驗(yàn),根據(jù)以往經(jīng)驗(yàn),確定每個(gè)因素只需考慮三個(gè)水平,數(shù)據(jù)如下表所示.

水平因素123反應(yīng)溫度A607080反應(yīng)時(shí)間B2.53.03.5原料配比C

1.1:11.15:11.2:1真空度D500550600理想的做法:各種因素所有水平搭配下都做試驗(yàn),4個(gè)因素,每個(gè)因素3個(gè)水平,共需要做34=81次試驗(yàn).提出要求:如何通過盡可能少的試驗(yàn)獲得盡可能多的信息.設(shè)計(jì)試驗(yàn):選81種搭配的一部分,每個(gè)因素的每個(gè)水平都出現(xiàn),且能反映出交互作用,以獲得最佳或較好的試驗(yàn)條件.不現(xiàn)實(shí):耗時(shí)、耗力、耗經(jīng)費(fèi)數(shù)理統(tǒng)計(jì)的另一個(gè)分支——試驗(yàn)設(shè)計(jì)它主要利用現(xiàn)成的規(guī)范化的表——正交表來科學(xué)的安排試驗(yàn)方案和分析試驗(yàn)結(jié)果.優(yōu)點(diǎn)在很多試驗(yàn)方案(試驗(yàn)條件)中挑選出代表性很強(qiáng)的少數(shù)試驗(yàn)方案,并通過對少數(shù)試驗(yàn)方案試驗(yàn)結(jié)果的分析,推斷出最優(yōu)方案.例1.1.3中,有效收集數(shù)據(jù)是通過科學(xué)安排試驗(yàn)的方法實(shí)現(xiàn).例1.1.3中,數(shù)據(jù)的隨機(jī)性是由試驗(yàn)誤差體現(xiàn).化工產(chǎn)品的轉(zhuǎn)化率除了受溫度、時(shí)間和原料配比影響外還受一些無法控制,甚至仍未被人們認(rèn)識(shí)的因素影響.如:每次試驗(yàn)中受試驗(yàn)材料產(chǎn)地的影響、所使用儀器設(shè)備精度的影響和操作者水平的影響等.這些因素?zé)o法或者不便加以完全控制,從而對試驗(yàn)結(jié)果產(chǎn)生隨機(jī)性的影響,因此帶來不確定性.有效的使用數(shù)據(jù)2獲取數(shù)據(jù)后,需要利用有效的方法去集中和提取數(shù)據(jù)中的有關(guān)信息,對所研究的問題作出一定的結(jié)論,統(tǒng)計(jì)上稱之為推斷.——統(tǒng)計(jì)推斷1用算術(shù)平均值計(jì)算該村農(nóng)戶年均收入如下例1.1.4某農(nóng)村有100戶農(nóng)戶,要調(diào)查此村農(nóng)戶是否脫貧.脫貧的標(biāo)準(zhǔn)是每戶年均收入超過1萬元.經(jīng)調(diào)查此村90戶農(nóng)民年收入5000元,10戶農(nóng)民年收入10萬元,問此村農(nóng)戶是否脫貧?結(jié)論:該村農(nóng)民脫貧.但是90%的農(nóng)戶年均收入只有5000元,事實(shí)未脫貧.2用樣本中位數(shù)計(jì)算該村農(nóng)戶年收入將100戶農(nóng)戶的年收入記為x1,x2,…,x100,將其按照大小排列為樣本中位數(shù)定義為排在最中間兩戶的平均值結(jié)論:該村農(nóng)民未脫貧,與實(shí)際情況相符.例1.1.4說明為有效地使用數(shù)據(jù)進(jìn)行推斷,就要涉及統(tǒng)計(jì)中的一些準(zhǔn)則,以評價(jià)推斷的優(yōu)良性,因此采用合適的統(tǒng)計(jì)方法是有效使用數(shù)據(jù)的一個(gè)重要方面.隨機(jī)現(xiàn)象的統(tǒng)計(jì)規(guī)律性隨機(jī)變量及其概率分布全面描述分布函數(shù)F(x)密度函數(shù)f(x)分布律pi概率論:已知隨機(jī)變量的分布,可求得:

某個(gè)隨機(jī)事件發(fā)生的概率,隨機(jī)變量落在某個(gè)區(qū)間的

概率,隨機(jī)變量的數(shù)字特征如均值,方差,協(xié)方差,

相關(guān)系數(shù)等.推理的方向:知道原因,推出結(jié)果.概率論1.1.2數(shù)理統(tǒng)計(jì)與概率論的關(guān)系在許多實(shí)際問題中,描述隨機(jī)現(xiàn)象的隨機(jī)變量的概率分布可能完全不知道或者是不完全知道.我們通過對所研究的隨機(jī)變量進(jìn)行重復(fù)獨(dú)立的觀察得到許多觀察值,對這些數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,從而對所研究的隨機(jī)變量的分布作出推斷.數(shù)理統(tǒng)計(jì):已知隨機(jī)變量的取值(數(shù)據(jù)),去求隨機(jī)變量的分布,或一些數(shù)字特征如均值,方差,協(xié)方差,相關(guān)系數(shù)等.推理的方向:知道結(jié)果,推斷原因.數(shù)理統(tǒng)計(jì)

概率論是數(shù)理統(tǒng)計(jì)的基礎(chǔ),而數(shù)理統(tǒng)計(jì)是概率論的重要應(yīng)用.

但它們是兩個(gè)并列的數(shù)學(xué)分支學(xué)科,并無從屬關(guān)系.統(tǒng)計(jì)的結(jié)果不是必然的,會(huì)帶有誤差或犯錯(cuò)誤.所以,統(tǒng)計(jì)推斷要盡可能地減少誤差,盡可能地減少犯錯(cuò)誤的概率.統(tǒng)計(jì)思想,統(tǒng)計(jì)方法,統(tǒng)計(jì)理論.怎么辦?統(tǒng)計(jì)推斷屬于歸納推理方法.數(shù)理統(tǒng)計(jì)學(xué)的研究內(nèi)容非常豐富,且形成了多個(gè)分支,如回歸分析、抽樣調(diào)查、試驗(yàn)設(shè)計(jì)、可靠性統(tǒng)計(jì)、多元統(tǒng)計(jì)分析、非參數(shù)統(tǒng)計(jì)和貝葉斯(Bayes)統(tǒng)計(jì)等.由于隨機(jī)現(xiàn)象無處不在,因此其應(yīng)用越來越廣泛深入,在國民經(jīng)濟(jì)和科學(xué)技術(shù)中的地位越來越重要.目前,數(shù)理統(tǒng)計(jì)學(xué)已經(jīng)涉及到金融、經(jīng)濟(jì)、生物、工程技術(shù)、醫(yī)學(xué)、工農(nóng)業(yè)生產(chǎn)、地質(zhì)、質(zhì)量控制、航天航空等諸多領(lǐng)域.無論是自然科學(xué)還是社會(huì)科學(xué)都離不開統(tǒng)計(jì).1.1.3數(shù)理統(tǒng)計(jì)的應(yīng)用領(lǐng)域只要一個(gè)實(shí)際問題有數(shù)據(jù),我們就可以用數(shù)理統(tǒng)計(jì)的方法去分析并解決該實(shí)際問題.數(shù)理統(tǒng)計(jì)方法所處理的只是在各種專門學(xué)科中帶普遍性(共性)且受隨機(jī)性影響的數(shù)據(jù)收集、整理和推斷問題,而不涉及各種專門學(xué)科中的具體問題.這種帶共性的問題既然是從專門領(lǐng)域中提煉出來,就可以用數(shù)學(xué)的方法去研究,這就是數(shù)理統(tǒng)計(jì)的研究任務(wù).數(shù)理統(tǒng)計(jì)方法有很廣泛的實(shí)用性,與很多專門學(xué)科有關(guān).統(tǒng)計(jì)方法只是從事物外在數(shù)量上的表現(xiàn)去推斷事物可能的規(guī)律性.統(tǒng)計(jì)方法本身不能說明何以會(huì)有這個(gè)規(guī)律性.例如:用統(tǒng)計(jì)方法分析得到吸煙與某些呼吸系統(tǒng)的疾病有關(guān).這純粹是從吸煙者和不吸煙者的發(fā)病率的對比分析得到結(jié)論.它不能解釋吸煙何以會(huì)增加患這類疾病的危險(xiǎn)性,這是醫(yī)學(xué)這個(gè)專門學(xué)科的任務(wù).2015年,首次提出“國家大數(shù)據(jù)戰(zhàn)略”,旨在全面推進(jìn)我國大數(shù)據(jù)發(fā)展和應(yīng)用,加快建設(shè)數(shù)據(jù)強(qiáng)國,推動(dòng)數(shù)據(jù)資源開放共享,大數(shù)據(jù)戰(zhàn)略上升為國家戰(zhàn)略。2017年,國務(wù)院印刷《新一代人工智能

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論