隨機效應模型用于污水數據分析_第1頁
隨機效應模型用于污水數據分析_第2頁
隨機效應模型用于污水數據分析_第3頁
隨機效應模型用于污水數據分析_第4頁
隨機效應模型用于污水數據分析_第5頁
已閱讀5頁,還剩4頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨機效應模型用于污水數據分析 摘 要:縱向數據分析在生物,醫(yī)學,經濟,金融等領域具有廣泛的應用,是近年來統計學的熱點課題之一,隨機效應模型是縱向數據分析中最常用的模型之一,在過去的十年中對縱向數據隨機效應模型的統計分析已經引起統計學家的關注。在本文中應用固定效應模型、隨機效應模型分析一組污水氨氮含量的數據,并分析組件交互作用。 關鍵詞:縱向數據;固定效應;隨機效應;aic;bic;氨氮 縱向數據longitudinal data(或panel data)是用來描述一個總體中給定樣本在一段時間的情況,并對樣本中每一個樣本單位都進行多重觀察。這種多重觀察既包括對樣本單位在某一時刻上多個特性進行觀察

2、,也包括對該樣本單位的這些特性在一段時間的連續(xù)觀察,連續(xù)觀察將得到數據集稱為縱向數據。而時間序列數據是一維數據,是變量按時間得到的數據,截面數據是變量在截面空間上的數據。數據是同時在時間和截面空間上取得的二維數據。從橫截面(cross section)上看,是由若干個體在某一時刻構成的截面觀測值,從縱剖面上看是一個時間序列。時間序列數據與縱向數據的顯著差別是時間序列數據研究的是很少的個體(通常只有一個個體)和重復測量許多次,且數據具有序列相關性。而縱向數據研究的是很多個體,重復測量次數并不多。但它們存在共性,重復測量是相關的,且相鄰數據相關性很大,而離得較遠的數據也就是隨著時間間隔增大,相關性

3、減小??v向數據通常用雙下標或多下標變量表示。某城市家庭及住宿業(yè)的污水中的氨氮含量數據,每個個體測量了三天每天測量三次。這里 表示第個i個體第t個時刻的氨氮含量。 一、固定效應模型 在現實世界中,存在著大量的這樣的情況:兩個變量x,y有一些依賴關系。比如身高和體重,身高x大時的體重y也傾向于大的,但是x也不能嚴格的決定y值。變量之間的這種關系稱為“相關關系”,回歸模型是研究相關關系的一個有力工具。我們設想y的值由兩部分組成:一部分是由x能夠決定的部分,它是x的函數,這個函數關系是線性的或者是近似線性的 (1) 這里的參數0,1分別為固定的截距和斜率,yij代表第i個個體第j個時刻的觀測,xij代

4、表協變量,ij表示隨機誤差,并且認為它服從正態(tài)分布。我們稱這個線性回歸模型為固定效應模型。在這里 , 測量值的方差為2,協方差為0。 我們看到同一個體的不同時刻的測量值之間是不相關的,但是這與實際情況不符,當我們對總體的均值感興趣,并且不關心個體之間差別的時候可以應用這個模型。但是有些情況我們不但關心總體的均值,而且關心個體之間的差別,因此我們將模型改良引入下面的隨機截距模型。 二、隨機截距模型 進一步考查簡單模型(1),引進隨機效應項。則模型為 且 因為 這里xij=1,1是固定效應截距項,1+bi為第i個個體的均值。因為隨機效應bi的均值為零,那么bi代表第i個個體的截距與總體截距的偏差。

5、yij的邊緣協方差由它與邊緣均值的偏差決定。對有隨機截距項的模型來說邊緣方差為 同一個個體不同時刻的協方差為 因為bi與ij相互獨立的,所以我們看到邊緣協方差陣有對稱的形式 由此我們得到同一個個體不同時刻響應變量的相關系數相關系數反映了隨機截距模型的一個重要方面:隨機效應項bi可以看成重復測量值間的相關量。我們看到協方差陣為對稱陣,這就意味著測量值之間的相關性不隨時間間隔的增加而變化,而實際情況是測量值之間的相關性是隨時間間隔的增加而減小的。所以隨機截距模型可以進一步改進,比如增加時間效應。 用向量、矩陣來表示這個模型則有 這里 為(p *1)的固定效應向量,bi是(q*1)的隨機效應向量,

6、xi是()的協變量陣,zi是一個()的協變量陣()。模型中的隨機效應項bi與測量誤差ei都看作是服從正態(tài)分布的。則有 響應yij的邊緣均值, 條件均值 方差 若 是一個對角矩陣,則 顯然具有非零的非對角元,這樣我們就看到了縱向數據研究中同一個體重復測量間的相關性。 三、污水數據處理 (一)9次重復測量 1.隨機截距模型。將所有數據拉直后進行分析,每個個體測量了9次,對數據開平方使之接近正態(tài)分布如表2,應用隨機截距模型來擬和數據,個體隨機效應為變量“來源”。 則模型為 i=1,2 j=120 k =19 yijk表示來自第。分別表示組效應,個體效應,時間效應;為組與時刻的交互;ij表示組與個體的

7、交互,ijk表示隨機誤差。在這里且相互獨立。 應用sas分析得到如下結果 效應 f值 prf group 3.09 0.0809 t 1.63 0.122 group*t 6.37 cov parm cov p1 cov p2 個體 0.8854 -0.00168 殘差 -0.00168 0.05564 從分析結果中看到組間差異近似顯著但是時刻差異不顯著,組與時刻交互非常顯著。隨機效應方差的極大似然估計為: 2.5994 標準差為0.941=sqrt0.8854;測量方差: 2.0015標準差 0.2359=sqrt0.05564 。 二者之間的協方差為:-0.00618, 近似于零, 另外,

8、 2.5994/0.941=2.761.96, 2.0015/0.2359=8.481.96, 所以拒絕這些方差為0的假設。 aic (smaller is better) 663.0 bic (smaller is better) 665.0) 2.固定效應模型。如果不考慮隨機截距項, 僅擬和固定效應的模型。 yijk表示來自第。分別表示組效應,個體效應,時間效應;為組與時刻的交互;ijk表示隨機誤差。 有如下結果: 效應 f prf group 17.06 t 0.71 0.6845 group*t 2.93 0.0044 aic (smaller is better) 750.1 bic

9、 (smaller is better) 762.0) 這時組間差異顯著,時刻差異仍不顯著,組與時刻交互仍顯著。但是比較兩者的aic&bic,傾向于選擇帶有隨機截距想的模型. 生活污水和住宿業(yè)污水氨氮的含量一天中隨不同的時刻變化,但是兩者的高峰期不一樣。另外,這種隨時刻的變化似乎和天沒有關系,。所以將一天中的時刻1, 時刻2, 時刻3合并起來進行分析。 (二)按天3次重復測量 1.隨機效應模型 i=1,2 j=120 k =1,2,3 yijk表示來自第。分別表示組效應,個體效應,時間效應;為組與時刻的交互;ij表示組與個體的交互,ijk表示隨機誤差。在這里 且相互獨立。 sas分析結果以及分

10、組圖像如下 效應 f prf group 3.42 0.0725 day 1.52 0.2314 group*day 0.49 0.6179 cov parm cov p1 cov p2 個體 8.1103 -0.1066 殘差 -0.1066 0.3199 這里組間的差異不明顯顯著而時間的差異,組與時間的交互都不顯著。從結果上看污水中氨氮含量與天沒有關系。那么時刻對污水氨氮含量的影響是怎樣的呢?下面再將時刻1,2,3按照天合并,即為一天中三個時刻。分析時刻之間的差別。 三、按時刻3次重復測量 模型形式與上一目相同,應用sas分析結果以及分組圖像如下。 效應 f prf group 3.20

11、0.0820 time 2.02 0.1477 group*time 14.78 cov parm cov p1 cov p2 個體 8.1640 -0.2407 殘差 -0.2407 0.7222 從結果看出, 時刻差異不顯著, 組間差異也不是一個非常顯著的變量, 但是它們的交互項非常顯著(p1.96。所以拒絕方差為零的假設。 aic (smaller is better) 275.5 bic (smaller is better) 277.5 天宇國際 天宇西域 雪林家園 天寶小區(qū) 雨荷家園 伊諾小區(qū) 地震局 科研貝貝小區(qū) 佳霖飯店 茉莉花飯店 元寶山賓館 開心賓館 可可同賓館 青山賓館

12、口口鄉(xiāng)賓館 亞明賓館 如家賓館 遠東賓館 林麟賓館 源和賓館 如果將個體效應看成固定的則有如下結果 效應 f prf group 7.49 0.0084 time 0.67 0.5182 group*day 4.87 0.0113 aic (smaller is better) 298.1 aicc (smaller is better) 298.2 相比之下增加隨機效應項的結果更好, 另外aic &bic也比有隨機效應項的模型大。所以在某城市污水氨氮含量數據分析的過程中,發(fā)現隨機效應模型分析縱向數據優(yōu)于固定效應模型。 參考文獻: 1陳希孺,陳桂景,吳啟光,趙林城,線性模型的參數估計理論 m,科學出版社,北京,1985. 2王松桂,史建紅,尹素菊,吳密霞,線性模型引論,科學出版社,北京,2004. 3roderick j. a little & donald b. rubin 著,孫山譯,耿直審,缺失數據統計分析美,1987. 4茆詩松主編,高等數理統計,施普林格出版社. 5孫燕,柴根象,縱向數據的隨機效應模型,同濟大學

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論