第四章 環(huán)境統(tǒng)計(jì)的描述性統(tǒng)計(jì)學(xué)_第1頁(yè)
第四章 環(huán)境統(tǒng)計(jì)的描述性統(tǒng)計(jì)學(xué)_第2頁(yè)
第四章 環(huán)境統(tǒng)計(jì)的描述性統(tǒng)計(jì)學(xué)_第3頁(yè)
第四章 環(huán)境統(tǒng)計(jì)的描述性統(tǒng)計(jì)學(xué)_第4頁(yè)
第四章 環(huán)境統(tǒng)計(jì)的描述性統(tǒng)計(jì)學(xué)_第5頁(yè)
已閱讀5頁(yè),還剩118頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

張寶林

內(nèi)蒙古師范大學(xué)化學(xué)與環(huán)境科學(xué)學(xué)院環(huán)境統(tǒng)計(jì)課程主要內(nèi)容第一章緒論第二章環(huán)境統(tǒng)計(jì)調(diào)查和數(shù)據(jù)整理第三章環(huán)境統(tǒng)計(jì)的概率論基礎(chǔ)第四章環(huán)境統(tǒng)計(jì)的描述性統(tǒng)計(jì)學(xué)第五章環(huán)境統(tǒng)計(jì)的推斷性統(tǒng)計(jì)學(xué)第六章常用多元統(tǒng)計(jì)分析及其軟件實(shí)現(xiàn)第七章地統(tǒng)計(jì)學(xué)簡(jiǎn)介第四章環(huán)境統(tǒng)計(jì)的描述性統(tǒng)計(jì)學(xué)收集了感興趣的數(shù)據(jù)集,如何弄清它的意義?整理和總結(jié),使其易于理解。數(shù)據(jù)直觀形象的圖表和描述數(shù)據(jù)某種性質(zhì)的數(shù)值量度,依賴于要描述的數(shù)據(jù)類型(定量的或定性的)。第四章環(huán)境統(tǒng)計(jì)的描述性統(tǒng)計(jì)學(xué)一旦數(shù)據(jù)被收集后,我們必須在它們中尋找所包含的信息。在數(shù)據(jù)文件中可以直接看到數(shù)據(jù),但是如果數(shù)據(jù)很多,我們無(wú)法全部理解。必須用一定的方法使我們能夠從數(shù)據(jù)中提取信息,并轉(zhuǎn)化成可用的形式。數(shù)據(jù)分析通常包括圖、表和計(jì)算。三者均包含一定程度的數(shù)據(jù)簡(jiǎn)化。如計(jì)算平均值,10個(gè)女孩的年齡求平均,10個(gè)數(shù)字變成了一個(gè)。簡(jiǎn)化使得數(shù)據(jù)理解和從數(shù)據(jù)中提取新型信息變得容易多了。第四章環(huán)境統(tǒng)計(jì)的描述性統(tǒng)計(jì)學(xué)簡(jiǎn)化的不利之處,,不能夠再恢復(fù)最初的觀測(cè)數(shù)據(jù),當(dāng)我們分析數(shù)據(jù)時(shí),幾乎總會(huì)丟失某些信息,好的統(tǒng)計(jì)學(xué)家在這2個(gè)相互矛盾的考慮中尋求平衡。強(qiáng)調(diào)重要信息而忽略噪音,同時(shí)不想丟失感興趣的細(xì)節(jié)。(足球比賽的結(jié)果和過(guò)程)。如何描述數(shù)據(jù)通常依賴于我們進(jìn)行怎樣的分析-即在哪里用它、由誰(shuí)用,目的是什么?第四章環(huán)境統(tǒng)計(jì)的描述性統(tǒng)計(jì)學(xué)描述性統(tǒng)計(jì)問(wèn)題4要素感興趣的總體或樣本被研究的一個(gè)或多個(gè)變量(總體或樣本單位的特征)表格、圖形或者數(shù)字概括工具確定數(shù)據(jù)類型推斷性統(tǒng)計(jì)問(wèn)題5要素感興趣的總體被研究的一個(gè)或多個(gè)變量(實(shí)驗(yàn)單位特征)實(shí)驗(yàn)單位樣本基于包含在樣本中的信息對(duì)總體的推斷推斷的可靠性度量第四章環(huán)境統(tǒng)計(jì)的描述性統(tǒng)計(jì)學(xué)統(tǒng)計(jì)圖已經(jīng)有200多年歷史了。但出現(xiàn)圖的歷史要遠(yuǎn)遠(yuǎn)晚于其它重要的數(shù)學(xué)發(fā)現(xiàn)。最初,圖非常罕見(jiàn),人工繪制,很不精確。現(xiàn)在,計(jì)算機(jī)軟件,作圖簡(jiǎn)單而準(zhǔn)確,很少手工畫圖。過(guò)多依賴計(jì)算機(jī),可能會(huì)出現(xiàn)壞圖。大眾媒體中,報(bào)紙新聞雜志和電視,圖代表的信息大量出現(xiàn)。第四章環(huán)境統(tǒng)計(jì)的描述性統(tǒng)計(jì)學(xué)圖的種類最簡(jiǎn)單的,根據(jù)一個(gè)變量概括數(shù)據(jù),如性別、年齡或IQ,只包含數(shù)據(jù)文件中的一列。較復(fù)雜的圖根據(jù)2個(gè)變量概括數(shù)據(jù),包含數(shù)據(jù)的2列。三個(gè)或多的變量作圖比較困難。統(tǒng)計(jì)圖是用點(diǎn)、線、面、體來(lái)形象地表達(dá)數(shù)量資料的1種方式,常用的統(tǒng)計(jì)圖有條圖(棒圖)、圓圖(餅圖)、統(tǒng)計(jì)地圖、線圖、直方圖、散點(diǎn)圖等。統(tǒng)計(jì)圖的種類很多,應(yīng)根據(jù)資料的類型和目的選用合適的統(tǒng)計(jì)圖。定性資料可選用的統(tǒng)計(jì)圖有條圖、圓圖、統(tǒng)計(jì)地圖等;定量資料可選用的統(tǒng)計(jì)圖有直方圖(或多邊圖)、普通線圖、半對(duì)數(shù)線圖、散點(diǎn)圖等。不同的統(tǒng)計(jì)圖,以不同的方式或姿態(tài)來(lái)形象化地表達(dá)資料。因此,掌握各種統(tǒng)計(jì)圖的特征,有助于正確選用統(tǒng)計(jì)圖第四章環(huán)境統(tǒng)計(jì)的描述性統(tǒng)計(jì)學(xué)作圖的主要目的:幫助研究者從數(shù)據(jù)中提取信息幫助把信息傳遞給別人。第四章環(huán)境統(tǒng)計(jì)的描述性統(tǒng)計(jì)學(xué)第一節(jié)描述定性數(shù)據(jù)的圖形法和數(shù)值法第二節(jié)描述定量數(shù)據(jù)的圖形法第三節(jié)描述定量數(shù)據(jù)的數(shù)值方法第四節(jié)描述統(tǒng)計(jì)的SAS實(shí)現(xiàn)第一節(jié)描述定性數(shù)據(jù)的圖形法和數(shù)值法

在描述定性觀測(cè)值時(shí)需要的概念類:每個(gè)觀測(cè)值落入一類并且只能落入一類(或組),給出落入每一類的觀測(cè)值個(gè)數(shù)或相對(duì)于觀測(cè)值總數(shù)的比例。對(duì)給定的類,類或組的頻數(shù)是指落入這個(gè)類中的觀測(cè)值的個(gè)數(shù);對(duì)給定的類,類或組的相對(duì)頻率是指落入這個(gè)類中的觀測(cè)值個(gè)數(shù)相對(duì)于觀測(cè)值總數(shù)的比例。第一節(jié)描述定性數(shù)據(jù)的圖形法和數(shù)值法

1977年與能源有關(guān)的死亡事故原因的相對(duì)頻率類(原因)頻數(shù)(事故數(shù))相對(duì)頻率(比例)煤礦坍塌70.156潰壩40.089煤氣爆炸280.622閃電10.022核反應(yīng)堆10.022燃油火災(zāi)40.089總計(jì)451.000第一節(jié)描述定性數(shù)據(jù)的圖形法和數(shù)值法

定性數(shù)據(jù)的描述常用條形圖和餅圖。第一節(jié)描述定性數(shù)據(jù)的圖形法和數(shù)值法

條形圖

用等寬長(zhǎng)條的長(zhǎng)短或高低表示按某一研究指標(biāo)劃分屬性種類或等級(jí)的次數(shù)或頻率分布。如果只涉及一項(xiàng)指標(biāo),則采用單式長(zhǎng)條圖;如果涉及兩個(gè)或兩個(gè)以上的指標(biāo),則采用復(fù)式長(zhǎng)條圖。第一節(jié)描述定性數(shù)據(jù)的圖形法和數(shù)值法

條形圖

在繪制條形圖時(shí),應(yīng)注意以下幾點(diǎn):(1)縱軸尺度從“0”開始,間隔相等,標(biāo)明所表示指標(biāo)的尺度及單位。如果不是從0開始,會(huì)夸大。(2)橫軸是長(zhǎng)條圖的共同基線,應(yīng)標(biāo)明各長(zhǎng)條的內(nèi)容。長(zhǎng)條的寬度要相等,間隔相同。間隔的寬度可與長(zhǎng)條寬度相同或者是其一半。(3)在繪制復(fù)式長(zhǎng)條圖時(shí),將同一屬性種類、等級(jí)的兩個(gè)或兩個(gè)以上指標(biāo)的長(zhǎng)條繪制在一起,各長(zhǎng)條所表示的指標(biāo)用圖例說(shuō)明,同一屬性種類、等級(jí)的各長(zhǎng)條間不留間隔。第一節(jié)描述定性數(shù)據(jù)的圖形法和數(shù)值法

條形圖

易于顯示變量每一個(gè)取值中的觀測(cè)數(shù),在顯示總的觀測(cè)數(shù)時(shí)卻不好。易于顯示整個(gè)的觀測(cè)數(shù)和變量的第一個(gè)類別的觀測(cè)數(shù),顯示其他的類別則不好。第一節(jié)描述定性數(shù)據(jù)的圖形法和數(shù)值法

條形圖

為2個(gè)分類變量作圖72人,32人選聽(tīng)了文學(xué)課后,6人犯了新罪;40人選去了監(jiān)獄,18人在釋放后犯了新罪。堆積條形圖清楚表明聽(tīng)課的人再次犯罪的人較少,到底有多少不是很清楚,因?yàn)椴皇菑?開始第一節(jié)描述定性數(shù)據(jù)的圖形法和數(shù)值法

條形圖

為2個(gè)分類變量作圖72人,32人選聽(tīng)了文學(xué)課后,6人犯了新罪;40人選去了監(jiān)獄,18人在釋放后犯了新罪。簇狀條形圖都從0開始,易看到多少人犯了新罪,但不容易看出多少人選擇了聽(tīng)課第一節(jié)描述定性數(shù)據(jù)的圖形法和數(shù)值法

條形圖

為2個(gè)分類變量作圖72人,32人選聽(tīng)了文學(xué)課后,6人犯了新罪;40人選去了監(jiān)獄,18人在釋放后犯了新罪。百分比堆積條形圖聽(tīng)課的犯人比進(jìn)監(jiān)獄的犯人再次犯罪的比例少,給犯人講課是不是減少犯罪的一種有效途徑?第一節(jié)描述定性數(shù)據(jù)的圖形法和數(shù)值法

餅(圓)圖用于表示計(jì)數(shù)資料、質(zhì)量性狀資料或半定量(等級(jí))資料的構(gòu)成比。所謂構(gòu)成比,就是各類別、等級(jí)的觀測(cè)值個(gè)數(shù)(次數(shù))與觀測(cè)值總個(gè)數(shù)(樣本含量)的百分比。把園圖的全面積看成100%,按各類別、等級(jí)的構(gòu)成比將園面積分成若干分,以扇形面積的大小表分別表示各類別、等級(jí)的比例。第一節(jié)描述定性數(shù)據(jù)的圖形法和數(shù)值法餅(圓)圖分類變量(Categoricalvariable)是指它的任2個(gè)觀測(cè)值或者相同,或者不同。觀測(cè)值不能夠被排序,一個(gè)觀測(cè)值并不比另一個(gè)多什么。如性別,男和女。第一節(jié)描述定性數(shù)據(jù)的圖形法和數(shù)值法餅(圓)圖。72名犯人服刑后1-2年內(nèi)是否犯新罪,24人犯了新罪。易于顯示每一組的相對(duì)大小,表示分類變量較好,因其取值沒(méi)有次序。(園餅的一塊移到其它位置不改變圖的含義)用于表示每一組有多少的觀測(cè)數(shù)時(shí)不是很好。組較多時(shí)也不是很好。第一節(jié)描述定性數(shù)據(jù)的圖形法和數(shù)值法

餅(圓)圖繪制園圖時(shí),應(yīng)注意以下三點(diǎn):(1)圓圖每3.6°園心角所對(duì)應(yīng)的扇形面積為1%。(2)圓圖上各部分按資料順序或大小順序,以時(shí)鐘9時(shí)或12時(shí)為起點(diǎn),順時(shí)針?lè)较蚺帕?。?)圓圖中各部分用線條分開,注明簡(jiǎn)要文字及百分比。第一節(jié)描述定性數(shù)據(jù)的圖形法和數(shù)值法

帕雷托圖將定性變量的類或組按照高度從左向右排列的條形圖。在過(guò)程和質(zhì)量控制中常用。意大利經(jīng)濟(jì)學(xué)家第一節(jié)描述定性數(shù)據(jù)的圖形法和數(shù)值法

統(tǒng)計(jì)地圖第二節(jié)描述定量數(shù)據(jù)的圖形法

定量數(shù)據(jù)是由有某種意義的數(shù)值標(biāo)度的數(shù)據(jù)組成。用于描述、總結(jié)和檢測(cè)數(shù)據(jù),常采用點(diǎn)圖、莖葉圖和直方圖。第二節(jié)描述定量數(shù)據(jù)的圖形法

點(diǎn)線圖(lineplot)優(yōu)點(diǎn):直觀看到數(shù)據(jù)的分布隨變量的取值變化(疏密程度);簡(jiǎn)化數(shù)據(jù),信息無(wú)損失。缺點(diǎn):不適于大數(shù)據(jù)集第二節(jié)描述定量數(shù)據(jù)的圖形法

點(diǎn)線圖(lineplot)水平軸表示定量變量。數(shù)據(jù)集中每次測(cè)量的數(shù)值用位于水平軸上的點(diǎn)表示。當(dāng)數(shù)據(jù)重復(fù)時(shí),點(diǎn)放在另一點(diǎn)之上,在個(gè)數(shù)值位置形成一個(gè)柱。第二節(jié)描述定量數(shù)據(jù)的圖形法

莖葉圖莖為測(cè)量值小數(shù)點(diǎn)左面部分,葉是剩下的小數(shù)點(diǎn)右面的部分。觀測(cè)值很多時(shí)效果不好。第二節(jié)描述定量數(shù)據(jù)的圖形法

莖葉圖構(gòu)造莖葉圖的步驟:1把數(shù)據(jù)集中的每一個(gè)觀測(cè)值分為莖、葉2部分;2將莖依次排成一列,從最小的莖開始到最大的莖結(jié)束;3處理整個(gè)數(shù)據(jù)集,把每一觀測(cè)值的葉放在恰當(dāng)?shù)男猩希詈蒙蚺帕?。第二?jié)描述定量數(shù)據(jù)的圖形法

直方圖(Histogram)英國(guó)統(tǒng)計(jì)學(xué)家KarlPearson1895年在腳注里做了定義。根據(jù)變量的取值范圍來(lái)顯示觀測(cè)數(shù)的最常用的圖。變量的取值被分成了區(qū)間,通常有相同的長(zhǎng)度,每一區(qū)間內(nèi)的觀測(cè)數(shù)用矩形來(lái)表示。觀測(cè)數(shù)?直方圖的形狀第二節(jié)描述定量數(shù)據(jù)的圖形法

直方圖構(gòu)造直方圖的步驟:1計(jì)算極差;2把極差分成5-20個(gè)組。最小的組界比最小值小3計(jì)算組頻數(shù)4計(jì)算組相對(duì)頻率5作圖

確定直方圖中組的個(gè)數(shù)數(shù)據(jù)集中觀測(cè)值的個(gè)數(shù)組的個(gè)數(shù)少于255-625-507-14多于5015-20第二節(jié)描述定量數(shù)據(jù)的圖形法

盒形圖1以畫在上下四分位數(shù)的直線為邊界畫出一個(gè)長(zhǎng)方形,在盒子中以直線標(biāo)出中位數(shù)。2將距離每一關(guān)鍵點(diǎn)1.5IRQ處的點(diǎn)記作數(shù)據(jù)的內(nèi)籬笆,連接關(guān)鍵點(diǎn)和內(nèi)籬笆;3外籬笆3IRQ。第二節(jié)描述定量數(shù)據(jù)的圖形法

做圖:優(yōu)秀的標(biāo)準(zhǔn)(1983)圖優(yōu)性是指:在最短的時(shí)間內(nèi)用最少的筆墨在最小的空間里給觀眾最多的思想第二節(jié)描述定量數(shù)據(jù)的圖形法

有史以來(lái)最好的一幅統(tǒng)計(jì)圖:法國(guó)工程師CharlesJosephMinaral1861年所作。顯示了拿破侖軍隊(duì)在俄國(guó)的可怕命運(yùn)(422000變成1000人)。展示了軍隊(duì)的大小、位置、方向、撤退時(shí)的氣溫。第三節(jié)描述定量數(shù)據(jù)的數(shù)值方法

數(shù)值描述性度量是由數(shù)據(jù)集計(jì)算得到的數(shù)值,常包括:中心趨勢(shì)度量:幫助確定相對(duì)頻率分布中心位置的度量;變異的度量:圍繞中心波動(dòng)的度量;相對(duì)位置的度量:描述數(shù)據(jù)集中一個(gè)觀測(cè)值相對(duì)位置的度量。第三節(jié)描述定量數(shù)據(jù)的數(shù)值方法

中心趨勢(shì)度量:算數(shù)平均、中位數(shù)和眾數(shù);變異的度量:極差、方差和標(biāo)準(zhǔn)差;相對(duì)位置的度量:百分位數(shù)和Z得分。第三節(jié)描述定量數(shù)據(jù)的數(shù)值方法1隨機(jī)變量2誤差3總體和個(gè)體4樣本5概率與頻率6樣本的頻數(shù)分布7參數(shù)和統(tǒng)計(jì)量8正態(tài)分布第三節(jié)描述定量數(shù)據(jù)的數(shù)值方法1隨機(jī)變量隨機(jī)變量(randomvariable)指取值不能事先確定的觀察結(jié)果,通常簡(jiǎn)稱為變量。隨機(jī)變量有一個(gè)共同的特點(diǎn)是不能用一個(gè)常數(shù)來(lái)表示,而且理論上講,每個(gè)變量的取值服從特定的概率分布。隨機(jī)變量可分為兩種類型:離散型變量和連續(xù)型變量。第三節(jié)描述定量數(shù)據(jù)的數(shù)值方法2誤差誤差(error)指實(shí)際觀察值與觀察真值之差、樣本指標(biāo)與總體指標(biāo)之差。誤差可分為系統(tǒng)誤差和隨機(jī)誤差,兩種誤差的區(qū)別見(jiàn)表1-1。第三節(jié)描述定量數(shù)據(jù)的數(shù)值方法3總體和個(gè)體總體:研究對(duì)象的所有可能的觀測(cè)結(jié)果成為總體。個(gè)體:總體中的每一個(gè)觀測(cè)單元。第三節(jié)描述定量數(shù)據(jù)的數(shù)值方法4樣本從總體中隨機(jī)抽取部分觀察單位,其測(cè)量結(jié)果的集合稱為樣本(sample)。樣本應(yīng)具有代表性。所謂有代表性的樣本,是指用隨機(jī)抽樣方法獲得的樣本。

如果有一桶豆子,有紅色、有白色.紅色的豆子到底有多少呢?數(shù)豆子?抓豆子?第三節(jié)描述定量數(shù)據(jù)的數(shù)值方法4樣本內(nèi)在有偏的樣本“1924級(jí)的耶魯畢業(yè)生平均年收入有25111美元?!薄稌r(shí)代》(Time)雜志在評(píng)論紐約《太陽(yáng)》(sun)報(bào)的某篇報(bào)道。抽樣過(guò)程:僅僅代表了1924級(jí)耶魯學(xué)生中可以聯(lián)系到的,并愿意站出來(lái)說(shuō)出所賺數(shù)目的這個(gè)特殊群體。當(dāng)然,它的真實(shí)性還建立在這樣一個(gè)假定基礎(chǔ)之上——這些紳士說(shuō)的都是真話。有3種謊言;謊言,糟糕透頂?shù)闹e言和統(tǒng)計(jì)資料?!狣israeli第三節(jié)描述定量數(shù)據(jù)的數(shù)值方法4樣本內(nèi)在有偏的樣本1936年《文學(xué)文摘》的慘敗。曾經(jīng)準(zhǔn)確頂測(cè)了1932年美國(guó)大選的1000萬(wàn)個(gè)《文學(xué)文摘》的訂閱者對(duì)1936年的大選進(jìn)行了預(yù)測(cè),通過(guò)電話,他們向這個(gè)倒霉的雜志編輯信誓旦旦地保證,蘭登(London)將在競(jìng)選中脫穎而出,并且與羅斯福(Roosevelt)所得的票數(shù)比是370:161。這樣一個(gè)久經(jīng)考驗(yàn)的調(diào)查群體怎么可能產(chǎn)生誤差呢?有3種謊言;謊言,糟糕透頂?shù)闹e言和統(tǒng)計(jì)資料。————Disraeli第三節(jié)描述定量數(shù)據(jù)的數(shù)值方法4樣本最基本的樣本是隨機(jī)樣本,它是指完全遵循隨機(jī)的原則從總體中選出樣本??傮w即形成樣本的母體。從索引卡片檔案中將每隔l0個(gè)的名字抽出來(lái),從許多紙張中任意抽出50張。隨機(jī)樣本的檢驗(yàn)標(biāo)準(zhǔn)是:總體中的每個(gè)名字或事物是否具有相同的幾率被選進(jìn)樣本?純隨機(jī)抽樣是惟一一種能有足夠把握利用統(tǒng)計(jì)理論進(jìn)行檢驗(yàn)的抽樣方法。但它同樣存在著缺陷。第三節(jié)描述定量數(shù)據(jù)的數(shù)值方法4樣本國(guó)家民意調(diào)查中心派出兩組調(diào)查人員對(duì)一個(gè)南方城市的500名黑人進(jìn)行提問(wèn),一組調(diào)查人員由白人組成,另一組是黑人“如果日本占領(lǐng)美國(guó),你認(rèn)為黑人的境況會(huì)得到改善還是變得更糟?”黑人調(diào)查組中,9%的被調(diào)查者回答“變好”,而白人調(diào)查組該比例只有2%?;卮稹白儔摹钡谋壤膊幌嗤?,黑人調(diào)查組是25%,而白人調(diào)查組則是45%。第二個(gè)問(wèn)題是用“納粹分子”替代“日本”,兩組的結(jié)果大體相同。第三個(gè)問(wèn)題試圖探尋被調(diào)查者對(duì)前兩個(gè)問(wèn)題的真正態(tài)度?!澳阏J(rèn)為目前致力于打敗軸心國(guó)比在本國(guó)內(nèi)進(jìn)一步推進(jìn)民主更重要嗎?”黑人調(diào)查組中,選擇“打敗軸心國(guó)”的比例是39%,而白人調(diào)查組則是62%。第三節(jié)描述定量數(shù)據(jù)的數(shù)值方法5概率與頻率概率(probability)又稱幾率,是度量某一隨機(jī)事件A發(fā)生可能性大小的一個(gè)數(shù)值,記為P(A)。0<P(A)<1。在相同的條件下,獨(dú)立重復(fù)做n次試驗(yàn),事件A出現(xiàn)了m次,則比值m/n稱為隨機(jī)事件A在n次試驗(yàn)中出現(xiàn)的頻率(frequency)。當(dāng)試驗(yàn)重復(fù)很多次時(shí)P(A)=m/n。第三節(jié)描述定量數(shù)據(jù)的數(shù)值方法6樣本的頻數(shù)分布第三節(jié)描述定量數(shù)據(jù)的數(shù)值方法6樣本的頻數(shù)分布(1)、求全距(2)、確定組數(shù)(3)、確定組距:組距(i)=全距/組數(shù)(4)、確定組限及組中值(5)、歸組劃線計(jì)數(shù),作次數(shù)分布表第三節(jié)描述定量數(shù)據(jù)的數(shù)值方法6樣本的頻數(shù)分布頻數(shù)表可用于揭示資料的分布特征和分布類型,在文獻(xiàn)中常用于陳述資料,它便于發(fā)現(xiàn)某些特大或特小的可疑值,也便于進(jìn)一步計(jì)算指標(biāo)和統(tǒng)計(jì)分析處理。第三節(jié)描述定量數(shù)據(jù)的數(shù)值方法7參數(shù)和統(tǒng)計(jì)量參數(shù)是總體的測(cè)量值。希臘字母統(tǒng)計(jì)量是樣本的觀測(cè)值。英文字母參數(shù)如總體均數(shù)、總體率等??傮w參數(shù)是固定的常數(shù)。多數(shù)情況下,總體參數(shù)是不易知道的,但可通過(guò)隨機(jī)抽樣抽取有代表性的樣本,用算得的樣本統(tǒng)計(jì)量估計(jì)未知的總體參數(shù)。統(tǒng)計(jì)量(statistic)是指樣本的統(tǒng)計(jì)指標(biāo),如樣本均數(shù)、樣本率等。樣本統(tǒng)計(jì)量可用來(lái)估計(jì)總體參數(shù)??傮w參數(shù)是固定的常數(shù),統(tǒng)計(jì)量是在總體參數(shù)附近波動(dòng)的隨機(jī)變量。第三節(jié)描述定量數(shù)據(jù)的數(shù)值方法7參數(shù)和統(tǒng)計(jì)量重點(diǎn)介紹平均數(shù)(mean)、標(biāo)準(zhǔn)差(standarddeviation)與變異系數(shù)(variationcoefficient)三個(gè)常用統(tǒng)計(jì)量,前者用于反映資料的集中性,即觀測(cè)值以某一數(shù)值為中心而分布的性質(zhì);后兩者用于反映資料的離散性,即觀測(cè)值離中分散變異的性質(zhì)。7參數(shù)和統(tǒng)計(jì)量平均數(shù)統(tǒng)計(jì)學(xué)中最常用的統(tǒng)計(jì)量,用來(lái)表明資料中各觀測(cè)值相對(duì)集中較多的中心位置。平均數(shù)被廣泛用來(lái)描述或比較各種技術(shù)措施的效果、畜禽某些數(shù)量性狀的指標(biāo)等等。平均數(shù)主要包括有算術(shù)平均數(shù)(arithmeticmean)、中位數(shù)(median)、眾數(shù)(mode)、幾何平均數(shù)(geometricmean)及調(diào)和平均數(shù)(harmonicmean)7參數(shù)和統(tǒng)計(jì)量平均數(shù):算術(shù)平均數(shù)算術(shù)平均數(shù)是指資料中各觀測(cè)值的總和除以觀測(cè)值個(gè)數(shù)所得的商,簡(jiǎn)稱平均數(shù)或均數(shù),記為。算術(shù)平均數(shù)可根據(jù)樣本大小及分組情況而采用直接法或加權(quán)法計(jì)算。(一)直接法主要用于樣本含量n≤30以下、未經(jīng)分組資料平均數(shù)的計(jì)算。設(shè)某一資料包含n個(gè)觀測(cè)值:x1、x2、…、xn,則樣本平均數(shù)

可通過(guò)下式計(jì)算:7參數(shù)和統(tǒng)計(jì)量平均數(shù):算術(shù)平均數(shù)某種公牛站測(cè)得10頭成年公牛的體重分別為500、520、535、560、585、600、480、510、505、490(kg),求其平均體重。由于Σx=500+520+535+560+585+600+480+510+505+490=5285,n=107參數(shù)和統(tǒng)計(jì)量平均數(shù):算術(shù)平均數(shù)(二)加權(quán)法對(duì)于樣本含量n≥30以上且已分組的資料,可以在次數(shù)分布表的基礎(chǔ)上采用加權(quán)法計(jì)算平均數(shù):7參數(shù)和統(tǒng)計(jì)量平均數(shù):算術(shù)平均數(shù):(二)加權(quán)法將100頭長(zhǎng)白母豬的仔豬一月窩重(單位:kg)資料整理成次數(shù)分布表如下,求其加權(quán)數(shù)平均數(shù)。7參數(shù)和統(tǒng)計(jì)量平均數(shù):算術(shù)平均數(shù):(二)加權(quán)法計(jì)算若干個(gè)來(lái)自同一總體的樣本平均數(shù)的平均數(shù)時(shí),如果樣本含量不等,也應(yīng)采用加權(quán)法計(jì)算。某牛群有黑白花奶牛1500頭,其平均體重為750kg,而另一牛群有黑白花奶牛1200頭,平均體重為725kg,如果將這兩個(gè)牛群混合在一起,其混合后平均體重為多少?7參數(shù)和統(tǒng)計(jì)量平均數(shù):算術(shù)平均數(shù)基本性質(zhì)1、樣本各觀測(cè)值與平均數(shù)之差的和為零,即離均差之和等于零。2、樣本各觀測(cè)值與平均數(shù)之差的平方和為最小,即離均差平方和為最小。

<7參數(shù)和統(tǒng)計(jì)量平均數(shù):算術(shù)平均數(shù)對(duì)于總體而言,通常用μ表示總體平均數(shù),有限總體的平均數(shù)為:式中,N表示總體所包含的個(gè)體數(shù)。當(dāng)一個(gè)統(tǒng)計(jì)量的數(shù)學(xué)期望等于所估計(jì)的總體參數(shù)時(shí),則稱此統(tǒng)計(jì)量為該總體參數(shù)的無(wú)偏估計(jì)量。統(tǒng)計(jì)學(xué)中常用樣本平均數(shù)(

)作為總體平均數(shù)(μ)的估計(jì)量,并已證明樣本平均數(shù)

是總體平均數(shù)μ的無(wú)偏估計(jì)量。7參數(shù)和統(tǒng)計(jì)量平均數(shù):中位數(shù)將資料內(nèi)所有觀測(cè)值從小到大依次排列,位于中間的那個(gè)觀測(cè)值,稱為中位數(shù),記為Md。當(dāng)觀測(cè)值的個(gè)數(shù)是偶數(shù)時(shí),則以中間兩個(gè)觀測(cè)值的平均數(shù)作為中位數(shù)。中位數(shù)簡(jiǎn)稱中數(shù)。當(dāng)所獲得的數(shù)據(jù)資料呈偏態(tài)分布時(shí),中位數(shù)的代表性優(yōu)于算術(shù)平均數(shù)。中位數(shù)的計(jì)算方法因資料是否分組而有所不同。7參數(shù)和統(tǒng)計(jì)量平均數(shù):中位數(shù)。7參數(shù)和統(tǒng)計(jì)量平均數(shù):中位數(shù)(一)未分組資料中位數(shù)的計(jì)算方法監(jiān)測(cè)分析某試樣中某成分含量(%):1.61,1.65,1.68,1.70,1.72,1.75,1.901.61,1.65,1.68,1.70,1.72,1.73,1.75,1.907參數(shù)和統(tǒng)計(jì)量平均數(shù):中位數(shù)。7參數(shù)和統(tǒng)計(jì)量平均數(shù):中位數(shù)(二)已分組資料中位數(shù)的計(jì)算方法某奶牛場(chǎng)68頭健康母牛從分娩到第一次發(fā)情間隔時(shí)間整理成次數(shù)分布表如表所示,求中位數(shù)。7參數(shù)和統(tǒng)計(jì)量平均數(shù):中位數(shù)。7參數(shù)和統(tǒng)計(jì)量平均數(shù):中位數(shù)i=15,n=68,因而中位數(shù)只能在累加頭數(shù)為36所對(duì)應(yīng)的“57—71”這一組,于是L=57,f=20,C=167參數(shù)和統(tǒng)計(jì)量平均數(shù):幾何平均數(shù)n個(gè)觀測(cè)值相乘之積開n次方所得的方根,稱為幾何平均數(shù),記為G。它主要應(yīng)用于畜牧業(yè)、水產(chǎn)業(yè)的生產(chǎn)動(dòng)態(tài)分析,畜禽疾病及藥物效價(jià)的統(tǒng)計(jì)分析。如畜禽、水產(chǎn)養(yǎng)殖的增長(zhǎng)率,抗體的滴度,藥物的效價(jià),畜禽疾病的潛伏期等,用幾何平均數(shù)比用算術(shù)平均數(shù)更能代表其平均水平。7參數(shù)和統(tǒng)計(jì)量平均數(shù):幾何平均數(shù)為了計(jì)算方便,可將各觀測(cè)值取對(duì)數(shù)后相加除以n,得lgG,再求lgG的反對(duì)數(shù),即得G值,即7參數(shù)和統(tǒng)計(jì)量平均數(shù):幾何平均數(shù)某波爾山羊群1997—2000年各年度的存欄數(shù),試求其年平均增長(zhǎng)率。7參數(shù)和統(tǒng)計(jì)量平均數(shù):眾

數(shù)資料中出現(xiàn)次數(shù)最多的那個(gè)觀測(cè)值或次數(shù)最多一組的組中值,稱為眾數(shù),記為M0。7參數(shù)和統(tǒng)計(jì)量平均數(shù):眾

數(shù)。7參數(shù)和統(tǒng)計(jì)量平均數(shù):眾

數(shù)莎士比亞著作中的眾數(shù)7參數(shù)和統(tǒng)計(jì)量平均數(shù):調(diào)和平均數(shù)資料中各觀測(cè)值倒數(shù)的算術(shù)平均數(shù)的倒數(shù),稱為調(diào)和平均數(shù),記為H。調(diào)和平均數(shù)主要用于反映畜群不同階段的平均增長(zhǎng)率或畜群不同規(guī)模的平均規(guī)模。7參數(shù)和統(tǒng)計(jì)量平均數(shù):調(diào)和平均數(shù)某保種牛群不同世代牛群保種的規(guī)模分別為:0世代200頭,1世代220頭,2世代210頭;3世代190頭,4世代210頭,試求其平均規(guī)模。7參數(shù)和統(tǒng)計(jì)量平均數(shù):調(diào)和平均數(shù)例:據(jù)甲、乙、丙三廠的實(shí)際廢水量和處理率,計(jì)算平均處理率。甲18%

30000t乙23%

25000t丙30%

18000t(30000+18000+25000)(1/0.18)×30000+(1/0.23)×25000+(1/0.30)×150007參數(shù)和統(tǒng)計(jì)量平均數(shù)統(tǒng)計(jì)學(xué)中最常用的統(tǒng)計(jì)量,用來(lái)表明資料中各觀測(cè)值相對(duì)集中較多的中心位置。對(duì)于同一資料,算術(shù)平均數(shù)>幾何平均數(shù)>調(diào)和平均數(shù)。上述五種平均數(shù),最常用的是算術(shù)平均數(shù)。7參數(shù)和統(tǒng)計(jì)量反映數(shù)據(jù)變異程度大小的變異指標(biāo)用平均數(shù)作為樣本的代表,其代表性的強(qiáng)弱受樣本資料中各觀測(cè)值變異程度的影響。如果各觀測(cè)值變異小,則平均數(shù)對(duì)樣本的代表性強(qiáng);如果各觀測(cè)值變異大,則平均數(shù)代表性弱。因而僅用平均數(shù)對(duì)一個(gè)資料的特征作統(tǒng)計(jì)描述是不全面的,還需引入一個(gè)表示資料中觀測(cè)值變異程度大小的統(tǒng)計(jì)量。變異指標(biāo)的應(yīng)用亦根據(jù)資料的不同而選取不同指標(biāo)進(jìn)行描述。常用的變異指標(biāo)有極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差和變異系數(shù),尤其是方差和標(biāo)準(zhǔn)差更為常用。7參數(shù)和統(tǒng)計(jì)量極差極差(range)亦稱全距,即最大值與最小值之差,用于資料的粗略分析,其計(jì)算簡(jiǎn)便但穩(wěn)定性較差。全距(極差)是表示資料中各觀測(cè)值變異程度大小最簡(jiǎn)便的統(tǒng)計(jì)量。全距大,則資料中各觀測(cè)值變異程度大,全距小,則資料中各觀測(cè)值變異程度小。但是全距只利用了資料中的最大值和最小值,并不能準(zhǔn)確表達(dá)資料中各觀測(cè)值的變異程度,比較粗略。當(dāng)資料很多而又要迅速對(duì)資料的變異程度作出判斷時(shí),可以利用全距這個(gè)統(tǒng)計(jì)量。7參數(shù)和統(tǒng)計(jì)量百分位數(shù)與四分位數(shù)間距百分位數(shù)(percentile)是將n個(gè)觀察值從小到大依次排列,再把它們的位次依次轉(zhuǎn)化為百分位。百分位數(shù)用Px表示,0<x<100,如25%位數(shù)表示為P25。四分位數(shù)間距(inter-quartilerange)是由第3四分位數(shù)(Q3=P75)和第1四分位數(shù)(Q1=P25)相減計(jì)算而得,常與中位數(shù)一起使用,描述偏態(tài)分布資料的分布特征,比極差穩(wěn)定。其計(jì)算公式:QR=Q3-Q17參數(shù)和統(tǒng)計(jì)量標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差的意義為了準(zhǔn)確地表示樣本內(nèi)各個(gè)觀測(cè)值的變異程度,人們首先會(huì)考慮到以平均數(shù)為標(biāo)準(zhǔn),求出各個(gè)觀測(cè)值與平均數(shù)的離差,即(

),稱為離均差。離均差?7參數(shù)和統(tǒng)計(jì)量標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差的意義雖然離均差能表達(dá)一個(gè)觀測(cè)值偏離平均數(shù)的性質(zhì)和程度,但因?yàn)殡x均差有正、有負(fù),離均差之和為零,即Σ(

)=0,因而不能用離均差之和Σ(

)來(lái)表示資料中所有觀測(cè)值的總偏離程度。7參數(shù)和統(tǒng)計(jì)量標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差的意義為了解決離均差有正、有負(fù),離均差之和為零的問(wèn)題,可先求離均差的絕對(duì)值并將各離均差絕對(duì)值之和除以觀測(cè)值n求得平均絕對(duì)離差,即Σ|

|/n。雖然平均絕對(duì)離差可以表示資料中各觀測(cè)值的變異程度,但由于平均絕對(duì)離差包含絕對(duì)值符號(hào),使用很不方便,在統(tǒng)計(jì)學(xué)中未被采用。7參數(shù)和統(tǒng)計(jì)量標(biāo)準(zhǔn)差將離均差平方,來(lái)解決離均差有正、有負(fù),離均差之和為零的問(wèn)題。將各個(gè)離均差平方,即(

)2,再求離均差平方和,即Σ,簡(jiǎn)稱平方和,記為SS;由于離差平方和常隨樣本大小而改變,為了消除樣本大小的影響,用平方和除以樣本大小,即Σ

,求出離均差平方和的平均數(shù);為了使所得的統(tǒng)計(jì)量是相應(yīng)總體參數(shù)的無(wú)偏估計(jì)量,統(tǒng)計(jì)學(xué)證明,在求離均差平方和的平均數(shù)時(shí),分母不用樣本含量n,而用自由度n-1,于是,采用統(tǒng)計(jì)量Σ表示資料的變異程度。7參數(shù)和統(tǒng)計(jì)量統(tǒng)計(jì)量Σ

稱為均方(meansquare縮寫為MS),又稱樣本方差,記為S2,即S2=相應(yīng)的總體參數(shù)叫總體方差,記為σ2。對(duì)于有限總體而言,σ2的計(jì)算公式為:σ2

μ)2/N

統(tǒng)計(jì)學(xué)上把樣本方差S2的平方根叫做樣本標(biāo)準(zhǔn)差,記為S,即:7參數(shù)和統(tǒng)計(jì)量標(biāo)準(zhǔn)差7參數(shù)和統(tǒng)計(jì)量標(biāo)準(zhǔn)差相應(yīng)的總體參數(shù)叫總體標(biāo)準(zhǔn)差,記為σ。對(duì)于有限總體而言,σ的計(jì)算公式為:σ=在統(tǒng)計(jì)學(xué)中,常用樣本標(biāo)準(zhǔn)差S估計(jì)總體標(biāo)準(zhǔn)差σ。7參數(shù)和統(tǒng)計(jì)量標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差的計(jì)算方法(一)直接法

對(duì)于未分組或小樣本資料,可直接利用公式來(lái)計(jì)算標(biāo)準(zhǔn)差。計(jì)算10只遼寧絨山羊產(chǎn)絨量:450,450,500,500,500,550,550,550,600,600,650(g)的標(biāo)準(zhǔn)差。7參數(shù)和統(tǒng)計(jì)量標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差的計(jì)算方法(一)直接法

對(duì)于未分組或小樣本資料,可直接利用公式來(lái)計(jì)算標(biāo)準(zhǔn)差。計(jì)算10只遼寧絨山羊產(chǎn)絨量:450,450,500,500,500,550,550,550,600,600,650(g)的標(biāo)準(zhǔn)差。n=10,經(jīng)計(jì)算得:Σx=5400,Σx2=2955000,7參數(shù)和統(tǒng)計(jì)量標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差的計(jì)算方法(二)加權(quán)法

對(duì)于已制成次數(shù)分布表的大樣本資料,可利用次數(shù)分布表,采用加權(quán)法計(jì)算標(biāo)準(zhǔn)差。式中,f為各組次數(shù);x為各組的組中值;Σf=n為總次數(shù)。

7參數(shù)和統(tǒng)計(jì)量標(biāo)準(zhǔn)差7參數(shù)和統(tǒng)計(jì)量標(biāo)準(zhǔn)差的特性(1)標(biāo)準(zhǔn)差的大小,受資料中每個(gè)觀測(cè)值的影響,如觀測(cè)值間變異大,求得的標(biāo)準(zhǔn)差也大,反之則小。(2)在計(jì)算標(biāo)準(zhǔn)差時(shí),在各觀測(cè)值加上或減去一個(gè)常數(shù),其數(shù)值不變。(3)當(dāng)每個(gè)觀測(cè)值乘以或除以一個(gè)常數(shù)a,則所得的標(biāo)準(zhǔn)差是原來(lái)標(biāo)準(zhǔn)差的a倍或

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論