概率論與數(shù)理統(tǒng)計(jì)基礎(chǔ)知識課件_第1頁
概率論與數(shù)理統(tǒng)計(jì)基礎(chǔ)知識課件_第2頁
概率論與數(shù)理統(tǒng)計(jì)基礎(chǔ)知識課件_第3頁
概率論與數(shù)理統(tǒng)計(jì)基礎(chǔ)知識課件_第4頁
概率論與數(shù)理統(tǒng)計(jì)基礎(chǔ)知識課件_第5頁
已閱讀5頁,還剩81頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

概率論與數(shù)理統(tǒng)計(jì)基礎(chǔ)

概率論與數(shù)理統(tǒng)計(jì)基礎(chǔ)概率論概述

數(shù)學(xué)作為一門工具性學(xué)科在我們的日常生活以及科學(xué)研究中扮演著極其重要的角色。概率論與數(shù)理統(tǒng)計(jì)作為數(shù)學(xué)的一個重要組成部分,在生活中的應(yīng)用也越來越廣泛。概率論是研究隨機(jī)現(xiàn)象數(shù)量規(guī)律的數(shù)學(xué)分支。在一定條件下,在個別試驗(yàn)或觀察中呈現(xiàn)不確定性,但在大量重復(fù)試驗(yàn)或觀察中其結(jié)果又具有一定規(guī)律性的現(xiàn)象,稱為隨機(jī)現(xiàn)象。亦即事前不可預(yù)言的現(xiàn)象,即在相同條件下重復(fù)進(jìn)行試驗(yàn),每次結(jié)果未必相同,或知道事物過去的狀況,但未來的發(fā)展卻不能完全肯定。如:以同樣的方式拋置硬幣卻可能出現(xiàn)正面向上也可能出現(xiàn)反面向上;走到某十字路口時,可能正好是紅燈,也可能正好是綠燈。研究這類現(xiàn)象的數(shù)學(xué)工具便是概率論和數(shù)理統(tǒng)計(jì)。概率論概述隨機(jī)試驗(yàn):

每次試驗(yàn)究竟出現(xiàn)哪個結(jié)果不能事先肯定,則稱其為一個隨機(jī)試驗(yàn),簡稱試驗(yàn),常用字母E表示.樣本點(diǎn):.在概率論中,把隨機(jī)試驗(yàn)的每個可能的基本結(jié)果稱為樣本點(diǎn)(SamplePoint),樣本空間:把樣本點(diǎn)的全體稱為該試驗(yàn)的樣本空間(SampleSpace),隨機(jī)試驗(yàn):事件的包含與相等

如果事件A發(fā)生必然導(dǎo)致事件B發(fā)生,即A的每個樣本點(diǎn)都是B的樣本點(diǎn),則稱B包含A,記作.從事件的集合表示看,事件B包含事件A就是樣本空間的子集B包含子集A對任何事件A,總有如果,同時,則稱事件A和事件B相等,記為A=B,即,A與B含有相同的樣本點(diǎn)事件間的關(guān)系事件間的關(guān)系事件的互斥

如果事件A和B不可能同時發(fā)生,即A與B沒有公共樣本點(diǎn),則稱A與B是互斥的(MutuallyExclusive)或互不相容的,換句話說,兩個事件A與B互斥就是樣本空間兩個子集A與B不相交事件的互斥事件的互逆如果事件A和B中必有一個發(fā)生但又不可能同時發(fā)生,則稱A與B是互逆(MutuallyInverse)或?qū)α⒌?,稱B為A的逆事件(或?qū)α⑹录?,事件的互逆事件間的運(yùn)算和事件對事件A和B,定義它們的和事件為=“A發(fā)生或B發(fā)生”=“A和B中至少有一個發(fā)生”積事件定義事件與的積事件為AB=“A和B同時發(fā)生”差事件定義事件A與B的差事件為“A-B=A發(fā)生且B不發(fā)生”=“A與同時發(fā)生”事件間的運(yùn)算隨機(jī)事件的概率

一個事件的概率(記為)就是能刻畫該事件發(fā)生的可能性大小的一個數(shù)值.在大量的重復(fù)試驗(yàn)或觀察中,事件發(fā)生的可能性卻可呈現(xiàn)出一定的統(tǒng)計(jì)規(guī)律,并且隨著試驗(yàn)或觀察次數(shù)的增加,這種規(guī)律會表現(xiàn)得愈加明顯.

顯然,在重復(fù)試驗(yàn)或觀察中,要反映一個事件發(fā)生的可能性大小,最直觀的一個量就是頻率(Frequency),其定義是:若在n次試驗(yàn)中,事件A發(fā)生了次,則A在n次試驗(yàn)中發(fā)生的頻率:隨機(jī)事件的概率我們知道,頻率越大(或?。?,事件A發(fā)生的可能性就越大(或?。?,即,A的概率就越大(或?。?可見,頻率是概率的一個很好反映.但是,頻率卻不能因此作為概率,因?yàn)楦怕蕬?yīng)當(dāng)是一個確定的量,不應(yīng)象頻率那樣隨重復(fù)試驗(yàn)和重復(fù)次數(shù)的變化而變化.不過,即使這樣,頻率還是可以作為概率的一個估計(jì),而且是一個有客觀依據(jù)的估計(jì),這個依據(jù)就是所謂的頻率穩(wěn)定性:當(dāng)試驗(yàn)或觀察次數(shù)n較大時,事件A發(fā)生的頻率會在某個確定的常數(shù)p附近擺動,并漸趨穩(wěn)定.根據(jù)頻率穩(wěn)定性,我們可以對概率給出一個客觀描述,這就是概率的統(tǒng)計(jì)定義:一個事件A的概率就是該事件的頻率穩(wěn)定值p,即我們知道,頻率越大(或?。?,一、個體、母體與子樣在統(tǒng)計(jì)分析中,構(gòu)成研究對象的每一個最基本的單位稱為個體。進(jìn)行統(tǒng)計(jì)分析,通常是從母體中隨機(jī)地選擇一部分樣品,稱為子樣(又稱樣本)。用它來代表母體進(jìn)行觀察、研究、檢驗(yàn)、分析,取得數(shù)據(jù)后加以整理,得出結(jié)論

例如,我們可將一個編號水泥看成是母體,每一包水泥看成是個體,通過隨機(jī)取樣(連續(xù)取樣或從20個以上不同部位取樣),所取出的12kg檢驗(yàn)樣品可稱為子樣,通過檢驗(yàn)分析,即可判斷該編號水泥(母體)的質(zhì)量狀況。常見的數(shù)理統(tǒng)計(jì)方式一、個體、母體與子樣常見的數(shù)理統(tǒng)計(jì)方式二、數(shù)據(jù)、計(jì)量值與計(jì)數(shù)值數(shù)據(jù)通過測試或調(diào)查母體所得的數(shù)字或符號記錄,稱為數(shù)據(jù)。計(jì)量值凡具有連續(xù)性或可以利用各種計(jì)量分析一起、量具測出的數(shù)據(jù)。如長度、質(zhì)量、溫度、化學(xué)成分、強(qiáng)度等,多屬于計(jì)量值數(shù)據(jù)。計(jì)量值也可以是整數(shù),也可以是小數(shù),具有連續(xù)性。計(jì)數(shù)值凡不能用測量工具和一起進(jìn)行測量,而是用計(jì)數(shù)的方法得到的非連續(xù)性數(shù)據(jù)。如合格率,廢品個數(shù)等,數(shù)據(jù)計(jì)數(shù)值數(shù)據(jù)。計(jì)數(shù)值是不連續(xù)的、間斷的,以離散狀態(tài)出現(xiàn)。二、數(shù)據(jù)、計(jì)量值與計(jì)數(shù)值三、頻數(shù)、頻率與概率隨機(jī)變量是一種隨著機(jī)會而改變其數(shù)值并且具有一定規(guī)律性的變量。如測定水泥的強(qiáng)度,每一袋水泥的試驗(yàn)結(jié)果不可能完全相同,即使一袋水泥,抽取幾組試樣,其試驗(yàn)結(jié)果也不可能完全一致,但是在一定的范圍內(nèi)波動,這是由于水泥的均勻性及試驗(yàn)誤差等因素的影響,使得每次試驗(yàn)結(jié)果都是一個隨機(jī)變量。頻數(shù)、頻率測定的一組數(shù)據(jù)中某一數(shù)值重復(fù)出現(xiàn)的次數(shù)或在某一范圍內(nèi)數(shù)值重復(fù)出現(xiàn)的次數(shù)為頻數(shù)。頻率為頻數(shù)占數(shù)據(jù)總數(shù)的百分比。概率概率的統(tǒng)計(jì)定義,就是把概率理解為頻率的穩(wěn)定值;在條件基本相同的大量重復(fù)試驗(yàn)中,隨著試驗(yàn)總次數(shù)不斷增加,頻率總是在某一常數(shù)附近波動,相對地穩(wěn)定下來,這就是頻率的相對穩(wěn)定性。這個常數(shù)表現(xiàn)為該頻率的相對穩(wěn)定值,稱為概率。三、頻數(shù)、頻率與概率四、數(shù)據(jù)統(tǒng)計(jì)特征數(shù)算術(shù)平均值我們從總體抽了一個樣本(子樣),得到一批數(shù)據(jù)X1、X2、X3……Xn在處理這批數(shù)據(jù)時,經(jīng)常用算術(shù)平均值X來代表這個總體的平均水平。統(tǒng)計(jì)中稱這個算術(shù)平均值為“樣平均值”。中位數(shù)把數(shù)據(jù)按大小順序排列,排在正中間的一個數(shù)即為中位數(shù)。當(dāng)數(shù)據(jù)的個數(shù)n為奇數(shù)時,中位數(shù)就是正中間的數(shù)值,當(dāng)n為偶數(shù)時,則中位數(shù)為中間兩個數(shù)的算術(shù)平均值。極差R極差就是數(shù)據(jù)中最大值和最小值的差,又稱全距,用符號R表示。R=Xmax-Xmin式中Xmax—數(shù)據(jù)中的最大值

Xmin—數(shù)據(jù)中的最小值四、數(shù)據(jù)統(tǒng)計(jì)特征數(shù)標(biāo)準(zhǔn)偏差(子樣S,母體O)標(biāo)準(zhǔn)偏差是人們總結(jié)和推導(dǎo)出來的一個衡量總體分散程度的度量值,又稱為均方根差。其推導(dǎo)過程是:設(shè)有n個數(shù)據(jù),先技術(shù)出算術(shù)平均值X,將總體中各個數(shù)據(jù)減去平均值,即得離差。離差可能是正數(shù),也可能是負(fù)數(shù)或零。如果將全部離差相加,其代數(shù)和將會為零。為此先將各離差平方,計(jì)算出離差的平方和。并除以數(shù)據(jù)的個數(shù)n,則求得各離差平方的算是平均值(即方差)。子樣的標(biāo)準(zhǔn)偏差用S表示,母樣的標(biāo)準(zhǔn)偏差用O表示。變異系數(shù)CV用極差和標(biāo)準(zhǔn)偏差都只反映數(shù)據(jù)波動的絕對大小。當(dāng)測量單位不同或測量單位相同,但不同組的平均數(shù)相差很大時,用標(biāo)準(zhǔn)偏差來衡量離散程度的大小是不合理的,必須用相對標(biāo)準(zhǔn)偏差(即變異系數(shù))來表示離散程度。如在做水泥均勻性試驗(yàn)時,就要求計(jì)算變異系數(shù),通過變異系數(shù)就可以比較不同企業(yè)的水泥質(zhì)量波動情況。標(biāo)準(zhǔn)偏差(子樣S,母體O)五、定量分析中的誤差定量分析中,反省結(jié)果應(yīng)具有一定的準(zhǔn)確度,因?yàn)椴粶?zhǔn)確的分析結(jié)果會導(dǎo)致產(chǎn)品報廢,資源浪費(fèi),甚至得出錯誤的結(jié)論。但是在分析過程中,即使是技術(shù)很熟練的人,用同一方法對同一試樣仔細(xì)地進(jìn)行多次分析,也不能得到完全一致的分析結(jié)果,而是分析結(jié)果在一定的范圍內(nèi)波動。這就是說,分析過程中誤差是客觀存在的。因此要善于判斷分析結(jié)果的準(zhǔn)確性,查出產(chǎn)生誤差的原因,進(jìn)一步研究減小誤差的方法,以不斷提高分析結(jié)果的準(zhǔn)確程度。準(zhǔn)確度與誤差準(zhǔn)確度是分析結(jié)果與真實(shí)值相符合的程度,通過用誤差的大小來表示。誤差越小。分析結(jié)果的準(zhǔn)確度越高。誤差有兩種表示方法:絕對誤差和相對誤差。絕對誤差是測定值與真實(shí)值之差,相對誤差是絕對誤差在真實(shí)值中所占的百分率,即絕對值=測定值—真實(shí)值絕對誤差相對誤差=——————X100%真實(shí)值由于一般分析測定中誤差的數(shù)值是相當(dāng)小的,因此有時也用測定結(jié)果代替真實(shí)值,即相對誤差近視地等于絕對誤差與測定結(jié)果之比,再乘以100%

五、定量分析中的誤差精密度與偏差精密度是指在相同條件下幾次平行測定的結(jié)果相互接近的程度。通常用偏差的大小來表示。偏差越小,分析結(jié)果的精密度越高。偏差也有絕對偏差和相對偏差之分。測定結(jié)果(Xi)與平均值(X)之差為絕對偏差(d),即個別測定的絕對偏差;絕對偏差在平均值中所占的百分率為相對偏差(dr),即個別測定的相對偏差。因此絕對值=測定值–n次測定值的算術(shù)平均值絕對偏差相對偏差=———————X100%算術(shù)平均值

精密度與偏差誤差的來源根據(jù)誤差的性質(zhì),可將誤差分為兩類。即系統(tǒng)誤差和偶然誤差。系統(tǒng)誤差系統(tǒng)誤差又稱可定誤差或可測誤差。這是由于測定過程中某些經(jīng)常性的原因所造成的誤差,它影響分析結(jié)果的準(zhǔn)確度。偶然誤差偶然誤差又稱非確定誤差或隨機(jī)誤差。這是由一些難以控制的偶然因素所造成的誤差,沒有一定的規(guī)律性。雖然操作者仔細(xì)操作,外界條件也盡量保持一直,但測得的一系列數(shù)據(jù)仍有差別,并且所得數(shù)據(jù)誤差的正負(fù)不定、大小不定。產(chǎn)生這類誤差的原因常常難于覺察,可能是由于室溫、氣壓、溫度等檢驗(yàn)條件的偶然波動所引起;或是因使用的砝碼偶然缺損,試劑質(zhì)量或濃度改變所造成;也可能由于個人一時辨別的差異使讀書不一致。誤差的來源減少系統(tǒng)誤差的方法選擇合適的分析方法。這是減少系統(tǒng)誤差的根本途徑。對不同種類的試樣應(yīng)采取不同的分析步驟,防止不明成分的干擾。采用對比檢驗(yàn)方法。即用標(biāo)樣進(jìn)行對比分析或用標(biāo)準(zhǔn)方法進(jìn)行對比分析。

利用標(biāo)準(zhǔn)樣來檢查和校正分析結(jié)果消除系統(tǒng)誤差的方法,在實(shí)際工作中應(yīng)用得較為普遍。通常應(yīng)取用與分析樣品的組成比較接近的標(biāo)準(zhǔn)樣進(jìn)行對比分析。記錄及計(jì)算上的錯誤等等。都會對檢驗(yàn)結(jié)果帶來嚴(yán)重影響,必須避免。但操作錯誤不是誤差,如果已發(fā)現(xiàn)錯誤的測定結(jié)果,應(yīng)予剔除,不得報出或參加平均值的計(jì)算.減少系統(tǒng)誤差的方法實(shí)例1

拋擲骰子,觀察出現(xiàn)的點(diǎn)數(shù).S={1,2,3,4,5,6}樣本點(diǎn)本身就是數(shù)量(不需要數(shù)量轉(zhuǎn)化)恒等變換且有則有隨機(jī)變量的定義實(shí)例1拋擲骰子,觀察出現(xiàn)的點(diǎn)數(shù).S={1,2,3,4,定義實(shí)例2

隨機(jī)變量X為“測量某零件尺寸時的測量誤差”.則X的取值范圍為(a,b).定義實(shí)例2隨機(jī)變量X為“測量某零件尺寸時的測量則X隨機(jī)變量的分類(1)離散型隨機(jī)變量所取的可能值是有限多個或無限可列個,叫做離散型隨機(jī)變量.(2)連續(xù)型

隨機(jī)變量所取的可能值可以連續(xù)地充滿某個區(qū)間,叫做連續(xù)型隨機(jī)變量.隨機(jī)變量的分類(1)離散型隨機(jī)變量所取的可能值是有限多個隨機(jī)過程的基本概念及分類例1

用X(t)表示某手機(jī)在大年初一早上從8:00開始經(jīng)過t時刻收到的短信數(shù)。例2

設(shè)質(zhì)點(diǎn)Q在一直線上移動,每單位時間移動一次,且只能在整數(shù)點(diǎn)上移動。用X(t)表示t時刻該質(zhì)點(diǎn)所處的位置。隨機(jī)過程的基本概念及分類

隨機(jī)過程的定義(,F,P)為一概率空間,T(,+)為參數(shù)集。若對任一tT,有一個定義在(,F,P)隨機(jī)變量X(t,)(或Xt()),,與之對應(yīng),則稱{X(t,),tT}為隨機(jī)過程(StochasticProcesses)。簡記{X(t),tT}(或{Xt,tT})(s.p.)?;蛘?/p>

X(t,)是一個二元函數(shù):固定t,X(t,)是一個隨機(jī)變量;(隨機(jī)過程在t時刻的狀態(tài))固定,X(t,)是一個實(shí)值函數(shù);(隨機(jī)過程的樣本函數(shù)或樣本曲線、現(xiàn)實(shí)或軌道)隨機(jī)過程的定義(,F,P)為一概率空間,T隨機(jī)變量(randomvariable):簡單的隨機(jī)現(xiàn)象,如某班一天學(xué)生出勤人數(shù),是靜態(tài)的。隨機(jī)過程(stochasticprocess):隨機(jī)現(xiàn)象的動態(tài)變化過程。動態(tài)的。如某一時期各個時刻的狀態(tài)隨機(jī)變量(randomvariable):簡單的隨機(jī)現(xiàn)象,概率論與數(shù)理統(tǒng)計(jì)基礎(chǔ)知識課件樣本及抽樣分布一、總體與樣本

一個統(tǒng)計(jì)問題總有它明確的研究對象.1、總體與個體研究對象的全體稱為總體,總體中所包含的個體的個數(shù)稱為總體的容量.總體中每個成員稱為個體樣本及抽樣分布一、總體與樣本一個統(tǒng)計(jì)問題總有它明確的研究對2、樣本

總體中抽出若干個體而成的集體,稱為樣本。樣本中所含個體的個數(shù),稱為樣本容量。

抽樣分布1.統(tǒng)計(jì)量

不含任何未知參數(shù)的樣本的函數(shù)稱為統(tǒng)計(jì)量.它是完全由樣本決定的量.2、樣本總體中抽出若干個體而成的集體,稱為

幾個常見統(tǒng)計(jì)量樣本平均值它反映了總體均值的信息樣本方差它反映了總體方差的信息樣本標(biāo)準(zhǔn)差幾個常見統(tǒng)計(jì)量樣本平均值它反映了樣本方差它反映了總體樣本它反映了總體k階矩的信息樣本k階原點(diǎn)矩樣本k階中心矩

k=1,2,…它反映了總體k階中心矩的信息樣本k階原點(diǎn)矩樣本k階中心矩k=1,2,…它反映了總體k

二、統(tǒng)計(jì)三大抽樣分布t分布F分布二、統(tǒng)計(jì)三大抽樣分布t分布F分布

參數(shù)估計(jì)1參數(shù)估計(jì)的一般問題2一個總體參數(shù)的區(qū)間估計(jì)3兩個總體參數(shù)的區(qū)間估計(jì)4樣本容量的確定參數(shù)估計(jì)1參數(shù)估計(jì)的一般問題估計(jì)量:用于估計(jì)總體參數(shù)的隨機(jī)變量如樣本均值,樣本比例、樣本方差等例如:樣本均值就是總體均值的一個估計(jì)量參數(shù)用表示,估計(jì)量用表示估計(jì)值:估計(jì)參數(shù)時計(jì)算出來的統(tǒng)計(jì)量的具體值如果樣本均值x

=80,則80就是的估計(jì)值估計(jì)量與估計(jì)值

(estimator&estimatedvalue)估計(jì)量:用于估計(jì)總體參數(shù)的隨機(jī)變量估計(jì)量與估計(jì)值

(est點(diǎn)估計(jì)

(pointestimate)用樣本的估計(jì)量直接作為總體參數(shù)的估計(jì)值例如:用樣本均值直接作為總體均值的估計(jì)例如:用兩個樣本均值之差直接作為總體均值之差的估計(jì)2. 沒有給出估計(jì)值接近總體參數(shù)程度的信息點(diǎn)估計(jì)的方法有矩估計(jì)法、順序統(tǒng)計(jì)量法、最大似然法、最小二乘法等點(diǎn)估計(jì)

(pointestimate)用樣本的估計(jì)量直接區(qū)間估計(jì)

(intervalestimate)在點(diǎn)估計(jì)的基礎(chǔ)上,給出總體參數(shù)估計(jì)的一個區(qū)間范圍,該區(qū)間由樣本統(tǒng)計(jì)量加減抽樣誤差而得到的根據(jù)樣本統(tǒng)計(jì)量的抽樣分布能夠?qū)颖窘y(tǒng)計(jì)量與總體參數(shù)的接近程度給出一個概率度量比如,某班級平均分?jǐn)?shù)在75~85之間,置信水平是95%

樣本統(tǒng)計(jì)量

(點(diǎn)估計(jì))置信區(qū)間置信下限置信上限區(qū)間估計(jì)

(intervalestimate)在點(diǎn)估計(jì)的由樣本統(tǒng)計(jì)量所構(gòu)造的總體參數(shù)的估計(jì)區(qū)間稱為置信區(qū)間統(tǒng)計(jì)學(xué)家在某種程度上確信這個區(qū)間會包含真正的總體參數(shù),所以給它取名為置信區(qū)間用一個具體的樣本所構(gòu)造的區(qū)間是一個特定的區(qū)間,我們無法知道這個樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值我們只能是希望這個區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個,但它也可能是少數(shù)幾個不包含參數(shù)真值的區(qū)間中的一個置信區(qū)間

(confidenceinterval)由樣本統(tǒng)計(jì)量所構(gòu)造的總體參數(shù)的估計(jì)區(qū)間稱為置信區(qū)間置信區(qū)間無偏性

(unbiasedness)無偏性:估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)P(

)BA無偏有偏無偏性

(unbiasedness)無偏性:估計(jì)量抽樣分布的有效性

(efficiency)有效性:對同一總體參數(shù)的兩個無偏點(diǎn)估計(jì)量,有更小標(biāo)準(zhǔn)差的估計(jì)量更有效

AB

的抽樣分布

的抽樣分布P(

)有效性

(efficiency)有效性:對同一總體參數(shù)的兩個一致性

(consistency)一致性:隨著樣本容量的增大,估計(jì)量的值越來越接近被估計(jì)的總體參數(shù)AB較小的樣本容量較大的樣本容量P(

)一致性

(consistency)一致性:隨著樣本容量的增大方差分析和回歸分析 一、單因素方差分析二、一元線性回歸三、回歸診斷

方差分析和回歸分析 一、單因素方差分析方差分析(Analysisofvariance,簡稱:ANOVA),是由英國統(tǒng)計(jì)學(xué)家費(fèi)歇爾(Fisher)在20世紀(jì)20年代提出的,可用于推斷兩個或兩個以上總體均值是否有差異的顯著性檢驗(yàn).方差分析(Analysisofvariance,簡稱:單因素方差分析僅考慮有一個因素A對試驗(yàn)指標(biāo)的影響.假如因素A有r個水平,分別在第i水平下進(jìn)行了多次獨(dú)立觀測,所得到的試驗(yàn)指標(biāo)的數(shù)據(jù)單因素方差分析僅考慮有一個因素A對試驗(yàn)指標(biāo)的影響.假如因一元線性回歸一、確定性關(guān)系:當(dāng)自變量給定一個值時,就確定應(yīng)變量的值與之對應(yīng)。如:在自由落體中,物體下落的高度h與下落時間t之間有函數(shù)關(guān)系:

變量與變量之間的關(guān)系一元線性回歸一、確定性關(guān)系:變量與變量之間的關(guān)系二、相關(guān)性關(guān)系:

變量之間的關(guān)系并不確定,而是表現(xiàn)為具有隨機(jī)性的一種“趨勢”。即對自變量x的同一值,在不同的觀測中,因變量Y可以取不同的值,而且取值是隨機(jī)的,但對應(yīng)x在一定范圍的不同值,對Y進(jìn)行觀測時,可以觀察到Y(jié)隨x的變化而呈現(xiàn)有一定趨勢的變化。為統(tǒng)一記號,后面一律用y表示因變量。二、相關(guān)性關(guān)系:概率論與數(shù)理統(tǒng)計(jì)基礎(chǔ)

概率論與數(shù)理統(tǒng)計(jì)基礎(chǔ)概率論概述

數(shù)學(xué)作為一門工具性學(xué)科在我們的日常生活以及科學(xué)研究中扮演著極其重要的角色。概率論與數(shù)理統(tǒng)計(jì)作為數(shù)學(xué)的一個重要組成部分,在生活中的應(yīng)用也越來越廣泛。概率論是研究隨機(jī)現(xiàn)象數(shù)量規(guī)律的數(shù)學(xué)分支。在一定條件下,在個別試驗(yàn)或觀察中呈現(xiàn)不確定性,但在大量重復(fù)試驗(yàn)或觀察中其結(jié)果又具有一定規(guī)律性的現(xiàn)象,稱為隨機(jī)現(xiàn)象。亦即事前不可預(yù)言的現(xiàn)象,即在相同條件下重復(fù)進(jìn)行試驗(yàn),每次結(jié)果未必相同,或知道事物過去的狀況,但未來的發(fā)展卻不能完全肯定。如:以同樣的方式拋置硬幣卻可能出現(xiàn)正面向上也可能出現(xiàn)反面向上;走到某十字路口時,可能正好是紅燈,也可能正好是綠燈。研究這類現(xiàn)象的數(shù)學(xué)工具便是概率論和數(shù)理統(tǒng)計(jì)。概率論概述隨機(jī)試驗(yàn):

每次試驗(yàn)究竟出現(xiàn)哪個結(jié)果不能事先肯定,則稱其為一個隨機(jī)試驗(yàn),簡稱試驗(yàn),常用字母E表示.樣本點(diǎn):.在概率論中,把隨機(jī)試驗(yàn)的每個可能的基本結(jié)果稱為樣本點(diǎn)(SamplePoint),樣本空間:把樣本點(diǎn)的全體稱為該試驗(yàn)的樣本空間(SampleSpace),隨機(jī)試驗(yàn):事件的包含與相等

如果事件A發(fā)生必然導(dǎo)致事件B發(fā)生,即A的每個樣本點(diǎn)都是B的樣本點(diǎn),則稱B包含A,記作.從事件的集合表示看,事件B包含事件A就是樣本空間的子集B包含子集A對任何事件A,總有如果,同時,則稱事件A和事件B相等,記為A=B,即,A與B含有相同的樣本點(diǎn)事件間的關(guān)系事件間的關(guān)系事件的互斥

如果事件A和B不可能同時發(fā)生,即A與B沒有公共樣本點(diǎn),則稱A與B是互斥的(MutuallyExclusive)或互不相容的,換句話說,兩個事件A與B互斥就是樣本空間兩個子集A與B不相交事件的互斥事件的互逆如果事件A和B中必有一個發(fā)生但又不可能同時發(fā)生,則稱A與B是互逆(MutuallyInverse)或?qū)α⒌?,稱B為A的逆事件(或?qū)α⑹录?,事件的互逆事件間的運(yùn)算和事件對事件A和B,定義它們的和事件為=“A發(fā)生或B發(fā)生”=“A和B中至少有一個發(fā)生”積事件定義事件與的積事件為AB=“A和B同時發(fā)生”差事件定義事件A與B的差事件為“A-B=A發(fā)生且B不發(fā)生”=“A與同時發(fā)生”事件間的運(yùn)算隨機(jī)事件的概率

一個事件的概率(記為)就是能刻畫該事件發(fā)生的可能性大小的一個數(shù)值.在大量的重復(fù)試驗(yàn)或觀察中,事件發(fā)生的可能性卻可呈現(xiàn)出一定的統(tǒng)計(jì)規(guī)律,并且隨著試驗(yàn)或觀察次數(shù)的增加,這種規(guī)律會表現(xiàn)得愈加明顯.

顯然,在重復(fù)試驗(yàn)或觀察中,要反映一個事件發(fā)生的可能性大小,最直觀的一個量就是頻率(Frequency),其定義是:若在n次試驗(yàn)中,事件A發(fā)生了次,則A在n次試驗(yàn)中發(fā)生的頻率:隨機(jī)事件的概率我們知道,頻率越大(或小),事件A發(fā)生的可能性就越大(或小),即,A的概率就越大(或?。?可見,頻率是概率的一個很好反映.但是,頻率卻不能因此作為概率,因?yàn)楦怕蕬?yīng)當(dāng)是一個確定的量,不應(yīng)象頻率那樣隨重復(fù)試驗(yàn)和重復(fù)次數(shù)的變化而變化.不過,即使這樣,頻率還是可以作為概率的一個估計(jì),而且是一個有客觀依據(jù)的估計(jì),這個依據(jù)就是所謂的頻率穩(wěn)定性:當(dāng)試驗(yàn)或觀察次數(shù)n較大時,事件A發(fā)生的頻率會在某個確定的常數(shù)p附近擺動,并漸趨穩(wěn)定.根據(jù)頻率穩(wěn)定性,我們可以對概率給出一個客觀描述,這就是概率的統(tǒng)計(jì)定義:一個事件A的概率就是該事件的頻率穩(wěn)定值p,即我們知道,頻率越大(或?。?,一、個體、母體與子樣在統(tǒng)計(jì)分析中,構(gòu)成研究對象的每一個最基本的單位稱為個體。進(jìn)行統(tǒng)計(jì)分析,通常是從母體中隨機(jī)地選擇一部分樣品,稱為子樣(又稱樣本)。用它來代表母體進(jìn)行觀察、研究、檢驗(yàn)、分析,取得數(shù)據(jù)后加以整理,得出結(jié)論

例如,我們可將一個編號水泥看成是母體,每一包水泥看成是個體,通過隨機(jī)取樣(連續(xù)取樣或從20個以上不同部位取樣),所取出的12kg檢驗(yàn)樣品可稱為子樣,通過檢驗(yàn)分析,即可判斷該編號水泥(母體)的質(zhì)量狀況。常見的數(shù)理統(tǒng)計(jì)方式一、個體、母體與子樣常見的數(shù)理統(tǒng)計(jì)方式二、數(shù)據(jù)、計(jì)量值與計(jì)數(shù)值數(shù)據(jù)通過測試或調(diào)查母體所得的數(shù)字或符號記錄,稱為數(shù)據(jù)。計(jì)量值凡具有連續(xù)性或可以利用各種計(jì)量分析一起、量具測出的數(shù)據(jù)。如長度、質(zhì)量、溫度、化學(xué)成分、強(qiáng)度等,多屬于計(jì)量值數(shù)據(jù)。計(jì)量值也可以是整數(shù),也可以是小數(shù),具有連續(xù)性。計(jì)數(shù)值凡不能用測量工具和一起進(jìn)行測量,而是用計(jì)數(shù)的方法得到的非連續(xù)性數(shù)據(jù)。如合格率,廢品個數(shù)等,數(shù)據(jù)計(jì)數(shù)值數(shù)據(jù)。計(jì)數(shù)值是不連續(xù)的、間斷的,以離散狀態(tài)出現(xiàn)。二、數(shù)據(jù)、計(jì)量值與計(jì)數(shù)值三、頻數(shù)、頻率與概率隨機(jī)變量是一種隨著機(jī)會而改變其數(shù)值并且具有一定規(guī)律性的變量。如測定水泥的強(qiáng)度,每一袋水泥的試驗(yàn)結(jié)果不可能完全相同,即使一袋水泥,抽取幾組試樣,其試驗(yàn)結(jié)果也不可能完全一致,但是在一定的范圍內(nèi)波動,這是由于水泥的均勻性及試驗(yàn)誤差等因素的影響,使得每次試驗(yàn)結(jié)果都是一個隨機(jī)變量。頻數(shù)、頻率測定的一組數(shù)據(jù)中某一數(shù)值重復(fù)出現(xiàn)的次數(shù)或在某一范圍內(nèi)數(shù)值重復(fù)出現(xiàn)的次數(shù)為頻數(shù)。頻率為頻數(shù)占數(shù)據(jù)總數(shù)的百分比。概率概率的統(tǒng)計(jì)定義,就是把概率理解為頻率的穩(wěn)定值;在條件基本相同的大量重復(fù)試驗(yàn)中,隨著試驗(yàn)總次數(shù)不斷增加,頻率總是在某一常數(shù)附近波動,相對地穩(wěn)定下來,這就是頻率的相對穩(wěn)定性。這個常數(shù)表現(xiàn)為該頻率的相對穩(wěn)定值,稱為概率。三、頻數(shù)、頻率與概率四、數(shù)據(jù)統(tǒng)計(jì)特征數(shù)算術(shù)平均值我們從總體抽了一個樣本(子樣),得到一批數(shù)據(jù)X1、X2、X3……Xn在處理這批數(shù)據(jù)時,經(jīng)常用算術(shù)平均值X來代表這個總體的平均水平。統(tǒng)計(jì)中稱這個算術(shù)平均值為“樣平均值”。中位數(shù)把數(shù)據(jù)按大小順序排列,排在正中間的一個數(shù)即為中位數(shù)。當(dāng)數(shù)據(jù)的個數(shù)n為奇數(shù)時,中位數(shù)就是正中間的數(shù)值,當(dāng)n為偶數(shù)時,則中位數(shù)為中間兩個數(shù)的算術(shù)平均值。極差R極差就是數(shù)據(jù)中最大值和最小值的差,又稱全距,用符號R表示。R=Xmax-Xmin式中Xmax—數(shù)據(jù)中的最大值

Xmin—數(shù)據(jù)中的最小值四、數(shù)據(jù)統(tǒng)計(jì)特征數(shù)標(biāo)準(zhǔn)偏差(子樣S,母體O)標(biāo)準(zhǔn)偏差是人們總結(jié)和推導(dǎo)出來的一個衡量總體分散程度的度量值,又稱為均方根差。其推導(dǎo)過程是:設(shè)有n個數(shù)據(jù),先技術(shù)出算術(shù)平均值X,將總體中各個數(shù)據(jù)減去平均值,即得離差。離差可能是正數(shù),也可能是負(fù)數(shù)或零。如果將全部離差相加,其代數(shù)和將會為零。為此先將各離差平方,計(jì)算出離差的平方和。并除以數(shù)據(jù)的個數(shù)n,則求得各離差平方的算是平均值(即方差)。子樣的標(biāo)準(zhǔn)偏差用S表示,母樣的標(biāo)準(zhǔn)偏差用O表示。變異系數(shù)CV用極差和標(biāo)準(zhǔn)偏差都只反映數(shù)據(jù)波動的絕對大小。當(dāng)測量單位不同或測量單位相同,但不同組的平均數(shù)相差很大時,用標(biāo)準(zhǔn)偏差來衡量離散程度的大小是不合理的,必須用相對標(biāo)準(zhǔn)偏差(即變異系數(shù))來表示離散程度。如在做水泥均勻性試驗(yàn)時,就要求計(jì)算變異系數(shù),通過變異系數(shù)就可以比較不同企業(yè)的水泥質(zhì)量波動情況。標(biāo)準(zhǔn)偏差(子樣S,母體O)五、定量分析中的誤差定量分析中,反省結(jié)果應(yīng)具有一定的準(zhǔn)確度,因?yàn)椴粶?zhǔn)確的分析結(jié)果會導(dǎo)致產(chǎn)品報廢,資源浪費(fèi),甚至得出錯誤的結(jié)論。但是在分析過程中,即使是技術(shù)很熟練的人,用同一方法對同一試樣仔細(xì)地進(jìn)行多次分析,也不能得到完全一致的分析結(jié)果,而是分析結(jié)果在一定的范圍內(nèi)波動。這就是說,分析過程中誤差是客觀存在的。因此要善于判斷分析結(jié)果的準(zhǔn)確性,查出產(chǎn)生誤差的原因,進(jìn)一步研究減小誤差的方法,以不斷提高分析結(jié)果的準(zhǔn)確程度。準(zhǔn)確度與誤差準(zhǔn)確度是分析結(jié)果與真實(shí)值相符合的程度,通過用誤差的大小來表示。誤差越小。分析結(jié)果的準(zhǔn)確度越高。誤差有兩種表示方法:絕對誤差和相對誤差。絕對誤差是測定值與真實(shí)值之差,相對誤差是絕對誤差在真實(shí)值中所占的百分率,即絕對值=測定值—真實(shí)值絕對誤差相對誤差=——————X100%真實(shí)值由于一般分析測定中誤差的數(shù)值是相當(dāng)小的,因此有時也用測定結(jié)果代替真實(shí)值,即相對誤差近視地等于絕對誤差與測定結(jié)果之比,再乘以100%

五、定量分析中的誤差精密度與偏差精密度是指在相同條件下幾次平行測定的結(jié)果相互接近的程度。通常用偏差的大小來表示。偏差越小,分析結(jié)果的精密度越高。偏差也有絕對偏差和相對偏差之分。測定結(jié)果(Xi)與平均值(X)之差為絕對偏差(d),即個別測定的絕對偏差;絕對偏差在平均值中所占的百分率為相對偏差(dr),即個別測定的相對偏差。因此絕對值=測定值–n次測定值的算術(shù)平均值絕對偏差相對偏差=———————X100%算術(shù)平均值

精密度與偏差誤差的來源根據(jù)誤差的性質(zhì),可將誤差分為兩類。即系統(tǒng)誤差和偶然誤差。系統(tǒng)誤差系統(tǒng)誤差又稱可定誤差或可測誤差。這是由于測定過程中某些經(jīng)常性的原因所造成的誤差,它影響分析結(jié)果的準(zhǔn)確度。偶然誤差偶然誤差又稱非確定誤差或隨機(jī)誤差。這是由一些難以控制的偶然因素所造成的誤差,沒有一定的規(guī)律性。雖然操作者仔細(xì)操作,外界條件也盡量保持一直,但測得的一系列數(shù)據(jù)仍有差別,并且所得數(shù)據(jù)誤差的正負(fù)不定、大小不定。產(chǎn)生這類誤差的原因常常難于覺察,可能是由于室溫、氣壓、溫度等檢驗(yàn)條件的偶然波動所引起;或是因使用的砝碼偶然缺損,試劑質(zhì)量或濃度改變所造成;也可能由于個人一時辨別的差異使讀書不一致。誤差的來源減少系統(tǒng)誤差的方法選擇合適的分析方法。這是減少系統(tǒng)誤差的根本途徑。對不同種類的試樣應(yīng)采取不同的分析步驟,防止不明成分的干擾。采用對比檢驗(yàn)方法。即用標(biāo)樣進(jìn)行對比分析或用標(biāo)準(zhǔn)方法進(jìn)行對比分析。

利用標(biāo)準(zhǔn)樣來檢查和校正分析結(jié)果消除系統(tǒng)誤差的方法,在實(shí)際工作中應(yīng)用得較為普遍。通常應(yīng)取用與分析樣品的組成比較接近的標(biāo)準(zhǔn)樣進(jìn)行對比分析。記錄及計(jì)算上的錯誤等等。都會對檢驗(yàn)結(jié)果帶來嚴(yán)重影響,必須避免。但操作錯誤不是誤差,如果已發(fā)現(xiàn)錯誤的測定結(jié)果,應(yīng)予剔除,不得報出或參加平均值的計(jì)算.減少系統(tǒng)誤差的方法實(shí)例1

拋擲骰子,觀察出現(xiàn)的點(diǎn)數(shù).S={1,2,3,4,5,6}樣本點(diǎn)本身就是數(shù)量(不需要數(shù)量轉(zhuǎn)化)恒等變換且有則有隨機(jī)變量的定義實(shí)例1拋擲骰子,觀察出現(xiàn)的點(diǎn)數(shù).S={1,2,3,4,定義實(shí)例2

隨機(jī)變量X為“測量某零件尺寸時的測量誤差”.則X的取值范圍為(a,b).定義實(shí)例2隨機(jī)變量X為“測量某零件尺寸時的測量則X隨機(jī)變量的分類(1)離散型隨機(jī)變量所取的可能值是有限多個或無限可列個,叫做離散型隨機(jī)變量.(2)連續(xù)型

隨機(jī)變量所取的可能值可以連續(xù)地充滿某個區(qū)間,叫做連續(xù)型隨機(jī)變量.隨機(jī)變量的分類(1)離散型隨機(jī)變量所取的可能值是有限多個隨機(jī)過程的基本概念及分類例1

用X(t)表示某手機(jī)在大年初一早上從8:00開始經(jīng)過t時刻收到的短信數(shù)。例2

設(shè)質(zhì)點(diǎn)Q在一直線上移動,每單位時間移動一次,且只能在整數(shù)點(diǎn)上移動。用X(t)表示t時刻該質(zhì)點(diǎn)所處的位置。隨機(jī)過程的基本概念及分類

隨機(jī)過程的定義(,F,P)為一概率空間,T(,+)為參數(shù)集。若對任一tT,有一個定義在(,F,P)隨機(jī)變量X(t,)(或Xt()),,與之對應(yīng),則稱{X(t,),tT}為隨機(jī)過程(StochasticProcesses)。簡記{X(t),tT}(或{Xt,tT})(s.p.)?;蛘?/p>

X(t,)是一個二元函數(shù):固定t,X(t,)是一個隨機(jī)變量;(隨機(jī)過程在t時刻的狀態(tài))固定,X(t,)是一個實(shí)值函數(shù);(隨機(jī)過程的樣本函數(shù)或樣本曲線、現(xiàn)實(shí)或軌道)隨機(jī)過程的定義(,F,P)為一概率空間,T隨機(jī)變量(randomvariable):簡單的隨機(jī)現(xiàn)象,如某班一天學(xué)生出勤人數(shù),是靜態(tài)的。隨機(jī)過程(stochasticprocess):隨機(jī)現(xiàn)象的動態(tài)變化過程。動態(tài)的。如某一時期各個時刻的狀態(tài)隨機(jī)變量(randomvariable):簡單的隨機(jī)現(xiàn)象,概率論與數(shù)理統(tǒng)計(jì)基礎(chǔ)知識課件樣本及抽樣分布一、總體與樣本

一個統(tǒng)計(jì)問題總有它明確的研究對象.1、總體與個體研究對象的全體稱為總體,總體中所包含的個體的個數(shù)稱為總體的容量.總體中每個成員稱為個體樣本及抽樣分布一、總體與樣本一個統(tǒng)計(jì)問題總有它明確的研究對2、樣本

總體中抽出若干個體而成的集體,稱為樣本。樣本中所含個體的個數(shù),稱為樣本容量。

抽樣分布1.統(tǒng)計(jì)量

不含任何未知參數(shù)的樣本的函數(shù)稱為統(tǒng)計(jì)量.它是完全由樣本決定的量.2、樣本總體中抽出若干個體而成的集體,稱為

幾個常見統(tǒng)計(jì)量樣本平均值它反映了總體均值的信息樣本方差它反映了總體方差的信息樣本標(biāo)準(zhǔn)差幾個常見統(tǒng)計(jì)量樣本平均值它反映了樣本方差它反映了總體樣本它反映了總體k階矩的信息樣本k階原點(diǎn)矩樣本k階中心矩

k=1,2,…它反映了總體k階中心矩的信息樣本k階原點(diǎn)矩樣本k階中心矩k=1,2,…它反映了總體k

二、統(tǒng)計(jì)三大抽樣分布t分布F分布二、統(tǒng)計(jì)三大抽樣分布t分布F分布

參數(shù)估計(jì)1參數(shù)估計(jì)的一般問題2一個總體參數(shù)的區(qū)間估計(jì)3兩個總體參數(shù)的區(qū)間估計(jì)4樣本容量的確定參數(shù)估計(jì)1參數(shù)估計(jì)的一般問題估計(jì)量:用于估計(jì)總體參數(shù)的隨機(jī)變量如樣本均值,樣本比例、樣本方差等例如:樣本均值就是總體均值的一個估計(jì)量參數(shù)用表示,估計(jì)量用表示估計(jì)值:估計(jì)參數(shù)時計(jì)算出來的統(tǒng)計(jì)量的具體值如果樣本均值x

=80,則80就是的估計(jì)值估計(jì)量與估計(jì)值

(estimator&estimatedvalue)估計(jì)量:用于估計(jì)總體參數(shù)的隨機(jī)變量估計(jì)量與估計(jì)值

(e

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論