環(huán)境數(shù)理統(tǒng)計-緒論_第1頁
環(huán)境數(shù)理統(tǒng)計-緒論_第2頁
環(huán)境數(shù)理統(tǒng)計-緒論_第3頁
環(huán)境數(shù)理統(tǒng)計-緒論_第4頁
環(huán)境數(shù)理統(tǒng)計-緒論_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、 環(huán)境與生態(tài)統(tǒng)計-R語言的應(yīng)用 Song S. Qian著曾思育譯 高等教育出版社2011年 環(huán)境統(tǒng)計學(xué)與MATLAB應(yīng)用 聶慶華 Keith C. Clarke編著 高等教育出版社 2010年 環(huán)境統(tǒng)計分析 楊曉華 劉瑞民 曾勇編著 北京師范大學(xué)出版社 環(huán)境數(shù)據(jù)統(tǒng)計分析基礎(chǔ) 程子峰等編著 化學(xué)工業(yè)出版社 2006年 數(shù)據(jù)的收集、整理和描述 概率論基本概念和統(tǒng)計學(xué)基礎(chǔ) 總體參數(shù)的估計 總體參數(shù)的假設(shè)性檢驗 非參數(shù)檢驗方法 方差分析 回歸分析(一元線性與非線性回歸) 時間序列分析初步* 你想過下面的問題嗎? 如何通過問卷調(diào)查來得到性別、年齡、職業(yè)、收入等各種因素與公眾對建設(shè)項目的環(huán)境保護的態(tài)度的

2、關(guān)系呢? 如何通過已有的環(huán)境監(jiān)測的歷史數(shù)據(jù)對環(huán)境質(zhì)量未來的發(fā)展趨勢進行預(yù)測呢? 如何才能客觀地反映我們所居住的環(huán)境的質(zhì)量的優(yōu)劣呢? 通過對比國民經(jīng)濟和社會發(fā)展數(shù)據(jù)和環(huán)境質(zhì)量數(shù)據(jù),如何尋找兩者(或多者)之間的聯(lián)系? 統(tǒng)計是什么? 其實,這些都是統(tǒng)計應(yīng)用的例子。這樣的例子太多了,無法一一列舉。因為統(tǒng)計學(xué)可以應(yīng)用于幾乎所有的領(lǐng)域。 上面的例子并沒有明確說出什么是統(tǒng)計。其實很簡單。上面的所有例子都要通過各種直接或間接的手段來收集數(shù)據(jù)(data);都要利用一些方法來整理和分析數(shù)據(jù);最后通過分析得到結(jié)論。 因此,統(tǒng)計學(xué)(statistics)是用以收集數(shù)據(jù)分析數(shù)據(jù)和由數(shù)據(jù)得出結(jié)論的一組概念、原則和方法。

3、現(xiàn)實中的隨機性和規(guī)律性 從中學(xué)起,我們就知道自然科學(xué)的許多定律,例如物理中的牛頓三定律,物質(zhì)不滅定律以及化學(xué)中的各種定律等。 但是在許多領(lǐng)域,很難用如此確定的公式或論述來描述一些現(xiàn)象。比如,人的壽命是很難預(yù)先確定的。一個吸煙、喝酒、不鍛煉的人可能比一個很少得病、生活習(xí)慣良好的人活得長。因此,可以說,活得長短有一定的隨機性(randomness)。這種隨機性可能和人的經(jīng)歷、基因、習(xí)慣等無數(shù)不易說清的因素都有關(guān)系。 但是從總體來說,我國公民的平均預(yù)期壽命卻是非常穩(wěn)定的,而且由于生活水平提高在逐步增長;比如1996年平均預(yù)期壽命為70.80歲,而2000年為71.40歲。這就是規(guī)律性。一個人可能活過

4、這個平均年齡,也可能活不到這個年齡,這是隨機的。但是總體來說,預(yù)期壽命的穩(wěn)定性,卻說明了隨機之中有規(guī)律性。這種規(guī)律就是統(tǒng)計規(guī)律。 概率和機會 你可能經(jīng)常聽到概率(probability)這個名詞。最常見的是在天氣預(yù)報中提到的降水概率。大家都明白,如果降水概率是百分之九十,那就很可能下雨;但如果是百分之十,就不大可能下雨。因此,從某種意義說來,概率描述了某件事情發(fā)生的機會。顯然,這種概率不可能超過百分之百,也不可能少于百分之零。換言之,概率是在0和1之間(也可能是0或1)的一個數(shù),說明某事件發(fā)生的機會有多大。 有些概率是無法精確推斷的。比如你對別人說你下一個周末去公園的概率是百分之八十。有些概率

5、是可以大體知道的。比如擲骰子。這也說明隨機結(jié)果也具有規(guī)律;而且有可能通過試驗等方法來推測其規(guī)律。 變量和數(shù)據(jù) 比如一個班上注冊的學(xué)生有200人,這是一個固定的數(shù)目,稱為常數(shù)(constant)或者常量。但是,如果猜測今天這個班有多少人會來上課,那就沒準(zhǔn)了。這有隨機性??赡苡姓埐〖倩蚴录俚模部赡苡刑诱n的。這樣,就要來上課的人數(shù)是個變量(variable)。 當(dāng)變量按照隨機規(guī)律所取的值是數(shù)量時該變量稱為定量變量或數(shù)量變量(quantitative variable);因為是隨機的,也稱為隨機變量(random variable)。 象性別,觀點之類的取非數(shù)量值的變量就稱為定性變量或?qū)傩宰兞炕蚍诸?/p>

6、變量(qualitative variable,categorical variable)。 什么是數(shù)據(jù) 有了變量的概念,什么是數(shù)據(jù)呢?拿擲骰子來說,擲骰子會得到什么值,是個隨機變量;而每次取得1至6點中任意某點數(shù)的概率在理論上都是六分之一(如果骰子沒有作假)。這依賴于在擲骰子背后的理論或假定;而在實際擲骰子過程中,如果擲100次,會得到100個由1至6點組成的數(shù)字串;再擲100次,又得到一個數(shù)字串,和前一次的結(jié)果多半不一樣。這些試驗結(jié)果就是數(shù)據(jù)。 所以說數(shù)據(jù)是關(guān)于變量的觀測值。 通過數(shù)據(jù)可以驗證有關(guān)的理論或假定。 定量變量間的關(guān)系 19892000年成都市經(jīng)濟增長和水環(huán)境污染水平時間1989

7、19901991199219931994經(jīng)濟增長(元)171519242232278938834854水環(huán)境污染水平0.0770.3110.8180.6921.2800.417時間199519961997199819992000經(jīng)濟增長(元)7388890610224111031189713020水環(huán)境污染水平0.624-0.192-0.040-1.638-0.882-1.470成都市地表水環(huán)境庫茲涅茨曲線水質(zhì)污染程度 人均國民生產(chǎn)總值(元)02000400060008000100001200014000-2.0-1.5-1.0-0.50.00.51.01.5 Y =0.03693+3.014

8、86E-4 X-3.35826E-8 X2R2=0.8014觀測值折線圖擬合的環(huán)境庫茲涅茨曲線 可以看到的: 兩個變量是否有關(guān)系? 如果有關(guān)系,它們的關(guān)系是否顯著? 它是一個什么關(guān)系?(線性/非線性) 這個關(guān)系是否帶有普遍性? 這個關(guān)系是否為因果關(guān)系? 關(guān)系一詞是沒有嚴(yán)格的統(tǒng)計定義的,一個類似的描述術(shù)語叫“相關(guān)”。 定性變量間的關(guān)系 下面是對123人進行關(guān)于某項政策調(diào)查所得結(jié)果的一個簡單的三維表,它顯示了人們的收入和性別對該項政策的觀點。 不同收入和不同性別人群對某項政策的觀點觀點:反對觀點:支持性別低收入中收入高收入低收入中收入高收入男581020105女27925157 統(tǒng)計、計算機與統(tǒng)計

9、軟件 現(xiàn)代生活越來越離不開計算機了。最早使用計算機的統(tǒng)計當(dāng)然更離不開計算機了。事實上,最初的計算機僅僅是為科學(xué)計算而設(shè)計和建造的。 計算機的最早一批用戶就包含統(tǒng)計?,F(xiàn)在,統(tǒng)計仍然是進行數(shù)字計算最多的用戶。 當(dāng)然計算機現(xiàn)在早已脫離了僅有數(shù)字計算功能的單一模式,而成為百姓生活的一部分。計算機的使用,也從過去必須學(xué)會計算機語言到只需要“傻瓜式”地點擊鼠標(biāo)。結(jié)果也從單純的數(shù)字輸出到包括漂亮的表格和圖形在內(nèi)的各種形式。 統(tǒng)計、計算機與統(tǒng)計軟件 統(tǒng)計軟件的發(fā)展,也使得統(tǒng)計從統(tǒng)計學(xué)家的圈內(nèi)游戲變成了大眾的游戲。只要輸入你的數(shù)據(jù),點幾下鼠標(biāo),做一些選項,馬上就得到令人驚嘆的漂亮結(jié)果了。人們可能會問,是否傻瓜式

10、統(tǒng)計軟件的使用可以代替統(tǒng)計課程了?當(dāng)然不是。 數(shù)據(jù)的整理和識別,方法的選用,計算機輸出結(jié)果的理解都不象使用傻瓜相機那樣簡單可靠。有些諸如法律和醫(yī)學(xué)方面的軟件都有不少警告,不時提醒你去咨詢專家。但統(tǒng)計軟件則不那么負責(zé)。只要數(shù)據(jù)格式無誤、選項不矛盾而且不用零作為除數(shù)就一定給你結(jié)果,而且?guī)缀鯖]有任何警告。 統(tǒng)計、計算機與統(tǒng)計軟件 另外,統(tǒng)計軟件輸出的結(jié)果太多;即使是同樣的方法,不同軟件輸出的內(nèi)容還不一樣,有時同樣的內(nèi)容名稱也不一樣。這就使得使用者大傷腦筋。 即使是統(tǒng)計學(xué)家也不一定能解釋所有的輸出。因此,就應(yīng)該特別留神,明白自己是在干什么。不要在得到一堆毫無意義的垃圾之后還沾沾自喜。 統(tǒng)計、計算機與統(tǒng)

11、計軟件 統(tǒng)計軟件的種類很多。有些功能齊全,有些價格便宜;有些容易操作,有些需要更多的實踐才能掌握。還有些是專門的軟件,只處理某一類統(tǒng)計問題。面對太多的選擇往往給決策帶來困難。這里介紹最常見的幾種。 SPSS: 這是一個很受歡迎的統(tǒng)計軟件;它容易操作,輸出漂亮,功能齊全,價格合理。它也有自己的程序語言,但基本上已經(jīng)“傻瓜化”。它對于非專業(yè)統(tǒng)計工作者是很好的選擇。 Excel: 它嚴(yán)格說來并不是統(tǒng)計軟件,但作為數(shù)據(jù)表格軟件,必然有一定統(tǒng)計計算功能。而且凡是有Microsoft Office的計算機,基本上都裝有Excel。 但要注意,有時在裝Office時沒有裝數(shù)據(jù)分析的功能,那就必須裝了才行。當(dāng)

12、然,畫圖功能是已經(jīng)具備的了。對于簡單分析,Excel還算方便,但隨著問題的深入,Excel就不那么“傻瓜”,需要使用宏命令來編程;這時就沒有相應(yīng)的簡單選項了。 多數(shù)專門一些的統(tǒng)計推斷問題還需要其他專門的統(tǒng)計軟件來處理。 SAS: 這是功能非常齊全的軟件;盡管價格相當(dāng)不菲,許多公司,特別是美國制藥公司都在使用,這多半因為其功能眾多和某些美國政府機構(gòu)一些人的偏愛。盡管現(xiàn)在已經(jīng)盡量“傻瓜化”,但仍然需要一定的訓(xùn)練才可以進入。也可以對它編程;但對于基本統(tǒng)計課程則不那么方便。 MATLAB: 這也是應(yīng)用于各個領(lǐng)域的以編程為主的軟件,在工程上應(yīng)用廣泛。不僅由于其功能齊全,而且由于其強大而又方便的編程功能,使得研究人員可以編制他們的程序來實現(xiàn)其自己創(chuàng)造的理論和方法。但是統(tǒng)計函數(shù)不多。 R語言 這是一款專用于數(shù)理統(tǒng)計和數(shù)據(jù)處理的自由軟件,由專業(yè)人員維護。 不僅由于其功能齊全,而且由于其強大而又方便的編程功能,使得研究人員可以編制他們的程序來實現(xiàn)其自己創(chuàng)造的理論和方法。 使用上對R語言有一定要求,比商業(yè)軟件的使用復(fù)雜,有難度。 下載地址:/ 這一章主要描述了統(tǒng)計領(lǐng)域的輪廓,還說明了隨機性所可能包含的規(guī)律性。概率是對不確定性的度量。統(tǒng)計研究的對象是變量。有了變量,特別是隨機變量,才能夠有目的地收集與該變量有關(guān)的數(shù)據(jù),對數(shù)據(jù)進行分析,并且得到人們感興趣

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論