半?yún)?shù)核估計理論及應用_第1頁
半?yún)?shù)核估計理論及應用_第2頁
半?yún)?shù)核估計理論及應用_第3頁
半?yún)?shù)核估計理論及應用_第4頁
半?yún)?shù)核估計理論及應用_第5頁
已閱讀5頁,還剩33頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 本科畢業(yè)論文(設計)題目: 半?yún)?shù)核估計理論及應用 姓 名: 高華 學號: 20111114487 院(系): 信工學院 專業(yè): 測繪工程 指導教師: 梁新美 職稱: 教授 評 閱 人: 潘 雄 職稱: 教授 2015 年 02 月學位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的論文是本人在導師的指導下獨立進行研究所取得的研究成果。除了文中特別加以標注引用的內容外,本論文不包含任何其他個人或集體已經發(fā)表或撰寫的成果作品。本人完全意識到本聲明的法律后果由本人承擔。作者簽名: 年 月 日 學位論文版權使用授權書本學位論文作者完全了解學校有關保障、使用學位論文的規(guī)定,同意學校保留并向有關學位論文管理部門或

2、機構送交論文的復印件和電子版,允許論文被查閱和借閱。本人授權省級優(yōu)秀學士學位論文評選機構將本學位論文的全部或部分內容編入有關數(shù)據(jù)庫進行檢索,可以采用影印、縮印或掃描等復制手段保存和匯編本學位論文。本學位論文屬于1 保密 ,在_年解密后適用本授權書。2 不保密 。(請在以上相應方框內打“”)作者簽名: 年 月 日 導師簽名: 年 月 日 摘 要 現(xiàn)代科學技術的飛速發(fā)展,為測繪科學提供了一個良好的發(fā)展機遇,同時也對測繪科學提出了更高的要求。首先由于現(xiàn)代測量儀器發(fā)展和觀測數(shù)據(jù)的復雜性,測繪學界對測量數(shù)據(jù)處理的精度要求越來越高,但是整個測量平差系統(tǒng)是由眾多因素共同確定的,其中一些影響因素與觀測值函數(shù)關

3、系并不明確,得到的一些復雜的觀測數(shù)據(jù)導致經典最小二乘準則失效,最終導致沒有明確了解的觀測值部分系統(tǒng)誤差影響無法消除等。半?yún)?shù)模型包含一個參數(shù)分量和一個非參數(shù)分量,對于與觀測值函數(shù)關系已知部分的參數(shù)采取與最小二乘估計類似的方法,即將這部分參數(shù)完全參數(shù)化;對于函數(shù)關系未知或難以用函數(shù)關系表達的因素不采用任何具體函數(shù)表達,而是采用抽象的函數(shù)給與表達,即事先不規(guī)定具體函數(shù)形式,其函數(shù)關系形式可以任意的,具體應用時,根據(jù)實際情況不同構造不同函數(shù),其可以克服參數(shù)和非參數(shù)模型表達不完善的部分,彌補了參數(shù)模型和非參數(shù)模型的不足,能夠解決許多的實際問題,具有更強的模型解釋能力和適應能力。大量的研究表明半?yún)?shù)模型

4、在處理觀測量與待估參數(shù)之間的復雜關系時有很明顯的優(yōu)點,因此在很多領域得到了研究與應用。半?yún)?shù)模型估計能夠很好的處理系統(tǒng)誤差和粗差,并且能分離出系統(tǒng)誤差和粗差,提供更加可靠的解算成果。半?yún)?shù)核估計包括偏核光滑估計、偏殘差估計、近鄰核估計、最小二乘核估計以及N-W核估計等。本文主要研究半?yún)?shù)的最小二乘核估計和偏核光滑估計,通過解算其參數(shù)分量和非參數(shù)分量及推導其期望、偏差、方差及均方誤差等統(tǒng)計性質,研究窗寬參數(shù)的選取,并通過模擬算例證明和對比最小二乘核估計和偏核光滑估計各自在參數(shù)和非參數(shù)分量估計以及估計系統(tǒng)誤差等方面的有效性和可行性,并將半?yún)?shù)核估計應用到平面坐標轉換中。本論文共分為五章,第一章緒論

5、主要闡述了半?yún)?shù)模型在統(tǒng)計領域的研究現(xiàn)狀及半?yún)?shù)回歸模型在測量數(shù)據(jù)處理應用的兩種主要方法:補償最小二乘法和基于外延預測預測的核估計;著重介紹了半?yún)?shù)核估計理論方面的國內國外研究現(xiàn)以及本文研究的內容。半?yún)?shù)核估計包括偏核光滑估計、偏殘差估計、近鄰核估計、最小二乘核估計以及N-W核估計等,本文主要研究半?yún)?shù)最小二乘法和偏核光滑估計法。第二章主要研究半?yún)?shù)核估計的理論,包括核權函數(shù)和核函數(shù)的選取問題;介紹了核估計的兩種方法,即最小二乘核估計和偏核光滑估計,分析了這兩種方法的各自特點,并解算了其參數(shù)和非參數(shù)分量;同時討論了窗寬參數(shù)在核估計中的重要作用,在小樣本估計中,樣本的大小,核函數(shù)的選取以及窗寬參

6、數(shù)共同決定了核估計性能的好壞。第三章主要是推導了半?yún)?shù)核估計量(即參數(shù)分量和非參數(shù)分量)的統(tǒng)計性質,其估計性質包括期望、方差、偏差、均方誤差。同時也討論了窗寬參數(shù)的選取問題,窗寬參數(shù)是一個非常重要的光滑參數(shù),它對曲線的擬合程度和光滑程度起平衡作用,實際上是起到一個平滑因子的角色,它的選擇好壞對估計量的性質影響很大。窗寬越小,則核估計的偏差越小,但估計的方差卻越大。在窗寬參數(shù)的選取中,討論了最小均方誤差法和經典的CV和GCV法等等。窗寬的變化,不可能使核估計的偏差和方差同時變小。因此,最佳窗寬選擇的標準必須在核估計的偏差和方差之間進行權衡。第四章對測量誤差進行了概述,介紹了系統(tǒng)誤差相關特性。通過

7、模擬算例證明半?yún)?shù)核估計在估計參數(shù)分量,剔除粗差和分離系統(tǒng)誤差方面的可行性,通過半?yún)?shù)核估計可明顯提高估計效果。將半?yún)?shù)核估計理論應用到平面坐標轉換,此前,并未有過用核估計進行坐標轉換,本章通過實際算例證明了核估計在高低精度坐標系轉換之間可以消除系統(tǒng)誤差,取得較高精度。關鍵詞:半?yún)?shù)模型,核估計,統(tǒng)計性質,系統(tǒng)誤差,坐標轉換AbstractThe rapid development of modern science and technology not only provides a good opportunity for the development of surveying and

8、mapping science, but also a higher requirement on Surveying and Mapping .First, as the development of modern measuring instruments and the complexity of observational data ,the precision of the measurement data processing becomes increasingly demanding, but the entire survey adjustment system is det

9、ermined by numerous factors, some of which affect the observation function not clearly.The complex observational data lead classical least squares criterion to failure, resulting in some systematic error can not be eliminated and so on. Semi-parametric model contains a parameter component and a non-

10、parametric component, for a function with the observed values of the parameters of the known part of the pre-squares estimation taken a similar approach, some parameters about which fully parameterized; For the function is unknown or difficult to use the function relationship factor expression expre

11、ssion does not use any specific function, instead of using abstract functions give expression, that does not require prior specific functional form, which can be any function of the form, the specific application, different configurations according to the actual situation of different functions, and

12、 its can overcome the parametric and non-parametric models expressing the imperfect parts, make up the parameters of the model and the lack of non-parametric model that can solve many practical problems, with more models to explain and adaptability. Numerous studies indicate that semi-parametric mod

13、el in dealing with the concept of measurement parameters to be estimated when the complex relationship between the obvious advantages, so in many fields research and application. Semi-parametric estimation model can well handle system errors and outliers, and can be isolated from system errors and g

14、ross errors, provide more reliable solver results.Semi-parametric kernel estimation including migraine kernel smooth estimation, partial residuals estimated neighbor kernel estimation, least squares estimation and NW kernel kernel estimation. This paper studies the migraine kernel smooth estimation

15、and least squares estimation, solves parametric component and non-parametric components, derives their expectations, deviation, variance and mean square error,discuss the problem of window width parameter selection , find the model scope;and through simulations and comparative examples demonstrate t

16、hat kernel smooth estimation and least squares estimation is effective and feasible in parametric and non-parametric estimation,namely we can estimate the system error. The thesis is divided into five chapters, first chapter mainly describes the research of semi-parametric models in the field of sta

17、tistics and two methods that semi-parametric regression model applies in the measurement data processing: Compensation based on least squares method and the epitaxial Forecast Forecast kernel estimation; highlights the semi-parametric estimation theoretical aspects of kernel research at home and abr

18、oad ,and the contents of this paper are: semi-parametric kernel estimation including migraine kernel smooth estimation, partial residuals estimated neighbor kernel estimation, least squares estimation and NW kernel estimation, this paper mainly studies migraine kernel smooth estimation and least squ

19、ares estimation. The second chapter studies the theory of semi-parametric kernel estimation.including kernel weight functions and kernel function selection roduces two kernel estimation method, namely migraine kernel smooth estimation and least squares estimation,analysis of the character

20、istics of each of these two methods,and extract forget their parametric and nonparametric component.in a small sample estimates, the sample size, the selection of kernel function and window width parameters together determine the kernel estimation performance quality.Finally, numerical examples demo

21、nstrates that the component parameters of two methods is correct and we compare the result. The third chapter is to derive a semi-parametric kernel estimation (parametric and non-parametric component component) of the statistical properties, according to which We can infer the scope of application o

22、f the model.The properties includes its estimated expectation, variance, bias, mean square error. It also discusses the problem of the window width parameter selection, window width is an important parameter smoothing parameter, It Plays a balancing role on the degree of curve fitting and smoothness

23、,in fact, it is to play a role as a smoothing factor,that it is good or not influences the properties of the estimation,.The smaller Window width is, the smaller the kernel estimation bias is, but the greater estimates of the variance is. In the window width parameter selection, we discuss minimum m

24、ean square error method and classic GCV method and so on.When window width changes, it is impossible to make kernel estimation bias and variance simultaneously smaller. Therefore, the optimal window width selection criteria must be balanced in the kernel trade-off between bias and variance. This cha

25、pter provides an overview of the measurement error and introduces the related characteristics of systematic errors . Through simulation examples and examples of measurements, it Proves that semi-parametric kernel estimation is feasible in removing outliers and separating system errors.applying the s

26、emi-parametric kernel estimation theory to the gravity measurements,through the practical examples given in this chapter, we prove that kernel estimation is effective in Coordinate transformation.KeyWords: Semi-parametric model, Kernel estimation,Statistical properties,Systematic errors, Coordinate

27、transformation目錄第一章 緒論1§1.1 引言1§1.2 半?yún)?shù)核估計理論應用研究現(xiàn)狀5第二章 半?yún)?shù)核估計方法7§2.1 半?yún)?shù)核估計理論7§2.2 最小二乘核估計10§2.3 半?yún)?shù)偏核光滑估計11第三章 估計量的統(tǒng)計性質和窗寬參數(shù)的選取13§3.1 最小二乘核估計估計量的性質13§3.2 半?yún)?shù)偏核光滑估計量的性質16§3.3 半?yún)?shù)核估計中窗寬參數(shù)的選取193.3.1 最小均方誤差法193.3.2 CV和GCV法19第四章 算例分析21§4.1 模擬算例21§4.2 在坐標

28、系換算中的應用25第五章 結論與展望27致謝28參考文獻29302013.6 中國地質大學(武漢)學士學位論文 第一章 緒論§1.1 引言 半?yún)?shù)模型是八十年代發(fā)展起來的一種重要的統(tǒng)計模型,它既含有參數(shù)分量,描述了觀測量中已知函數(shù)關系;又包含有非參數(shù)分量,用來表示函數(shù)關系中未知的的系統(tǒng)誤差和模型偏差,因此可以概括和描述眾多實際問題,因而引起測繪界的廣泛關注;在統(tǒng)計領域中,處理數(shù)據(jù)的半?yún)?shù)模型是將我們常用的參數(shù)回歸模型和非參數(shù)回歸模型結合在一起,這樣就為我們求解系統(tǒng)誤差或者模型誤差提供了思路,但它并不僅僅是這兩種模型的疊加,半?yún)?shù)模型比一般的回歸模型都更為復雜,其解算也更加困難。所以,

29、半?yún)?shù)模型在測繪領域是一種既有用又充滿挑戰(zhàn)性的理論。目前,一些學者對半?yún)?shù)模型已經做了一些研究,并取得了一定的成果:Engle1,Green&Silverman(1994)2,Heckman(1986)3等人對樣條光滑估計的內容做了研究;Robinson(1988)對基于半?yún)?shù)的回歸模型做了深入探討;在此基礎上Severini&Staniswalis(1994)4、Härdle,Mammen&Müller(1998)5等學者對廣義的半?yún)?shù)回歸模型做了研究;Eubank(1990)7對于半?yún)?shù)模型中的三角級數(shù)估計法做了研究;由David等學者編著的書S

30、emi-paremetric Regression對半?yún)?shù)回歸模型做了詳細介紹;還有一些學者對基于大樣本的半?yún)?shù)模型中的分量性質做了深入研究。我國對于半?yún)?shù)回歸的研究,主要在統(tǒng)計領域內,其中主要研究內容包括:洪圣巖13對于半?yún)?shù)回歸模型中的一系列估計理論做了研究;柴根象和孫平14對于大樣本估計的性質和半?yún)?shù)中估計量的性質做了研究;朱仲義(1999)15用統(tǒng)計的方法對于半?yún)?shù)非線性模型做了系統(tǒng)的研究;曾林蕊(2004)18對廣義的半?yún)?shù)模型中的統(tǒng)計診斷方法做了研究;其中,柴根象、洪圣巖(1995)17的著作-半?yún)?shù)回歸模型對于半?yún)?shù)中的理論與方法做了系統(tǒng)的介紹和研究?;诎?yún)?shù)模型較于參數(shù)模型和

31、非參數(shù)模型不可替代的優(yōu)點,半?yún)?shù)模型近幾年來被廣泛地運用到工業(yè)、農業(yè)、經濟、醫(yī)藥、金融等各種不同領域:基于半?yún)?shù)統(tǒng)計模型的中長期電量負荷預測應用,中外股票市場聯(lián)動性的非參數(shù)與半?yún)?shù)建模研究,中國人口預測的具有外生變量的半?yún)?shù)回歸模型等。從以上內容分析可以看出,對于半?yún)?shù)回歸模型國內外的研究主要有以下幾個方面:一、在模型基礎上,研究各種不同方法求解參數(shù)和非參數(shù)的估計量,以及不同誤差情況下,估計量的一些大樣本性質分析;二、將半?yún)?shù)模型引入到測量數(shù)據(jù)處理中進行參數(shù)估計處理系統(tǒng)誤差,并有效的探測粗差;三、在統(tǒng)計中的應用,即將半?yún)?shù)模型引入到CPI的研究中去,分析居民的消費結構及分析框架;四、在經濟中的

32、應用,半?yún)?shù)模型應用于通貨膨脹、商品房價格指數(shù)、市場風險度量以及人口預測等方面。近些年來學者將半?yún)?shù)模型應用到在測繪領域,利用半?yún)?shù)回歸模型來解決實際測量數(shù)據(jù)中含有系統(tǒng)信號的問題,與參數(shù)平差模型、非參數(shù)平差模型相比,半?yún)?shù)平差模型能利用其參數(shù)信號和非參數(shù)信號解決參數(shù)平差模型、非參數(shù)平差模型等單一解決方法不能解決的實際問題,并且所得的估計量效果要好一些。Green、Engle et al和Silverman利用半?yún)?shù)模型相比較參數(shù)模型有明顯的優(yōu)點研究了半?yún)?shù)平差模型在解決觀測量與待估參數(shù)之間的復雜關系;Moritz提出了正則化的數(shù)據(jù)平滑處理方法是為了解決重力測量問題;在美國導航協(xié)會技術會議上,M

33、inghaijia(2000)首次提出利用半?yún)?shù)模型中的非參數(shù)分量表示電磁波穿過電離層的系統(tǒng)誤差,分析GPS測量中的多路徑效應的影響等等;陶本藻(1997)23研得出函數(shù)模型誤差和隨機模型誤差之間是可以相互轉化的,并從理論上研究了模型誤差對參數(shù)分量的估值是如何影響的;武大測繪學院的孫海燕、陶本藻、王新洲、張松林、胡宏昌、丁士俊等人把統(tǒng)計領域的半?yún)?shù)模型應用到測量數(shù)據(jù)處理中來:孫海燕(2002)24將半?yún)?shù)模型引入到測量學界,并研究了半?yún)?shù)平差模型的相關算法,證明了半?yún)?shù)平差模型能夠發(fā)現(xiàn)并識別模型誤差或觀測值中的系統(tǒng)誤差,還進一步討論了正規(guī)化矩陣半正定時的計算方法;吳云(2003)30利在研究半

34、參數(shù)模型中的參數(shù)估計時對正則化矩陣的求解運用了數(shù)學中的三次樣條函數(shù);張松林(2003)26在基于最小二乘準則下對線性半?yún)?shù)模型的一系列估計理論做了系統(tǒng)分析,同時也研究了非線性半?yún)?shù)模型中對參數(shù)分量的估計值的求解和推導了參數(shù)分量的統(tǒng)計性質,并將非線性模型運用到實際問題中提取和分離GPS定位中包含的系統(tǒng)誤差;胡宏昌(2004)28對于半?yún)?shù)模型中的附有系統(tǒng)參數(shù)的平差模型做了深入研究,解算出半?yún)?shù)模型中非參數(shù)分量的結果并推導其統(tǒng)計性質,對半?yún)?shù)補償最小二乘法中的關鍵問題如何選取正則矩陣和光滑因子用做了較為系統(tǒng)的研究;潘雄(2005)27主要研究了半?yún)?shù)補償最小二乘法,計算出半?yún)?shù)模型中各估計量的結果

35、并推導出估計量統(tǒng)計性質的計算公式,最后根據(jù)其統(tǒng)計性質判斷出不同平差模型的適用范圍;丁士俊25(2005)在參數(shù)回歸診斷方法的基礎上研究了半?yún)?shù)模型的數(shù)據(jù)診斷方法,提出了穩(wěn)健估計方法并推算出估計量的基本公式,同時探討了半?yún)?shù)平差模型中的廣義最小二乘估計,提出了抗差廣義補償最小二乘估計方法,最后將半?yún)?shù)平差模型應用到GPS變形分析等問題中;王振杰(2006)29基于不同的正則化參數(shù)和正則化矩陣,對半?yún)?shù)補償最小二乘法中的不適定問題做了研究。觀測數(shù)據(jù)是我們進行測繪研究和分析的基礎,然而人們運用各種測量手段得到測量數(shù)據(jù),由于觀測條件、系統(tǒng)誤差、偶然誤差等原因,觀測結果與被觀測量的真實值產生了差異,這就

36、是測量中產生的各種誤差,如何提高觀測數(shù)據(jù)的質量和有效地減小測量中的誤差,最終得到觀測數(shù)據(jù)的最佳平差值,這是測量平差中即測量數(shù)據(jù)處理中,我們所要解決的最重要問題。而我們所用的經典平差模型是高斯一馬爾柯夫模型,具體形式如下: 函數(shù)模型: (1-1) 隨機模型: (1-2)在上述平差模型中,觀測值只包含參數(shù)分量,表現(xiàn)為參數(shù)分量的線性形式,但是這種平差模型求解有一個前提條件:觀測值只含有偶然誤差。在這種理想情況下,偶然誤差的數(shù)學期望為零,運用最小二乘準則,最終解得參數(shù)分量的解,根據(jù)其統(tǒng)計性質可以驗證參數(shù)解的偏差為零,即為無偏估計量。但是隨著科學技術的不斷進步與發(fā)展,先進的觀測技術、精度更高的儀器已經應

37、用到測量數(shù)據(jù)采集中,這樣使得所測數(shù)據(jù)不含有系統(tǒng)誤差或者模型誤差這種理想的情況不存在??偠灾S著測量數(shù)據(jù)的復雜性增加和解算精度要求增高,使得經典的平差模型已經難以處理現(xiàn)代測繪數(shù)據(jù)。一是因為影響觀測值的因素眾多,往往無法全面得考慮到所有的影響因素;其二是由于參數(shù)與觀測量的函數(shù)關系較為復雜,只是用簡單的線性模型來對實際問題進行近似描述往往也是不精確的。最后是隨機模型也會產生難以消除的誤差。所以,經典的高斯平差模型并沒有從根本上消除觀測數(shù)據(jù)中的誤差,也沒有從本質上區(qū)分系統(tǒng)誤差與粗差,當平差模型存在系統(tǒng)誤差或者粗差時,經典平差模型就會失去處理數(shù)據(jù)的能力。綜上所述,對不同的平差模型進行深入研究,更加精

38、確地解算觀測量的最佳估值是現(xiàn)代測量數(shù)據(jù)處理中的基本首要內容。對于較為復雜的測量數(shù)據(jù),一般情況下影響觀測量的因素可分為兩方面:一部分影響因素與的關系表現(xiàn)為是己知的線性關系,并且是觀測值的主要影響項,最終可以用參數(shù)通過數(shù)學關系式或者經驗來表達;而另一部分影響因素與的關系完全是未知的,某些學者將這些因素作為觀測量的干擾項來處理,并不是誤差項的一部分。如果運用參數(shù)模型處理,則忽略了干擾項;但是若采用非參數(shù)模型處理,又會失去觀測值的主要影響項,模型對實際問題的描述能力也明顯降低。為了彌補參數(shù)和非參數(shù)模型的各自不足,測繪學界又將統(tǒng)計領域中的偏線性回歸模型引入到測量數(shù)據(jù)處理中,這就是現(xiàn)在的半?yún)?shù)平差模型,并

39、取得了顯著的研究成果。 半?yún)?shù)回歸模型是統(tǒng)計領域的一種重要的估計模型,形式如下,給我們解決上述問題提供了思路: (1-3)上式中:是表示觀測值函數(shù)關系中的系統(tǒng)誤差量或者是模型誤差,是關于參數(shù)個數(shù)的函數(shù),由于數(shù)據(jù)來源的復雜性,造成了作為模型誤差或系統(tǒng)誤差的的形態(tài)難以用單一的回歸模型進行模擬,不能僅僅只用少數(shù)的參數(shù)表示,所以在這個因個觀測方程中都添加一個未知量,這個未知量組成的維列向量就是半?yún)?shù)模型中的非參數(shù)分量,這樣的形式比一般的平差模型具有更強的求解最佳估計量的特性:一是因為半?yún)?shù)回歸模型克服了傳統(tǒng)平差模型在處理復雜數(shù)據(jù)時的不適應性;二是半?yún)?shù)模型與客觀實際更加趨近;三是在已知觀測值和參數(shù)關系

40、的情況下再運用一定準則對半?yún)?shù)模型進行求解可以分別求出模型中的估計量即參數(shù)分量、非參數(shù)分量、,它們分別代表觀測中的真值、系統(tǒng)誤差、偶然誤差。因此,我們可以將半?yún)?shù)模型與測量中許多方面結合進行系統(tǒng)誤差提取等。 當今統(tǒng)計界對半?yún)?shù)模型的估計方法研究得較多的主要有樣條估計,最小二乘核估計,三角級數(shù)估計和分塊多項式估計,而且參數(shù)部分的模型只適用于線性函數(shù)模型,對于非線性模型研究得較少。在統(tǒng)計領域,關于半?yún)?shù)模型的估計問題被認為是一個帶有無窮維多余形狀參數(shù)的歐氏空間的點估計問題。半?yún)?shù)模型的估計途徑歸納起來有三種:第一種是對函數(shù)空間施加一定的限制;第二是兩步估計,本文主要研究的最小二乘核估計就是典型的兩

41、步估計;第三是兩階段估計。在測量數(shù)據(jù)處理中,目前有研究的主要是基于補償最小二乘準則的光滑樣條估計,而近鄰估計、小波估計、二階段估計、分塊多項式估計、核估計、三角級數(shù)估計等其他估計方法卻沒有進行深入探討。 到目前為止,在測繪界中對半?yún)?shù)平差模型研究具體主要分為以下兩種:(1)附加系統(tǒng)參數(shù)的半?yún)?shù)平差模型: (1-4)上式中,觀測值為維列向量,參數(shù)向量為維列向量,為是經典平差模型中求得唯一解的必需觀測數(shù),代表了參數(shù)分量的關系,是一個列滿秩矩陣,觀測誤差向量為維列向量,維未知向量是描述了模型誤差或者觀測中的系統(tǒng)誤差。其誤差方程的形式為: (1-5)根據(jù)最小二乘準則,求得法方程為: (1-6)在上式中

42、為觀測值的權陣,是一個對稱正定方陣;和是待求參數(shù)分量(個)和非參數(shù)分量(個),但是觀測值方程只有個,因而無法求得唯一解。這時就必須引入新的平差準則對結果進行約束:定義一個光滑因子和矩陣,它們在和之間起平衡作用,通過改變和得出最佳值,具體形式如下: (1-7)(2)基于外延預測的半?yún)?shù)平差模型,其具體表達形式為: (1-9)在上式中:觀測向量為維向量;待估參數(shù)為維向量;模型非參數(shù)部分為維向量,由于它可以表達出與觀測值函數(shù)關系不確定的因素部分,對觀測值進行部分調整,其擬合程度更加精確,使得最終平差值與真實值很接近。,為某一函數(shù)空間上的關系未知函數(shù);為代表了參數(shù)關系,是一個維列滿秩矩陣;觀測誤差向量

43、為維向量。上面這兩種模型的主要區(qū)別是在于解算的過程中:模型(1-4)是先計算非參數(shù)分量再計算參數(shù)分量;模型(1-9)是先計算參數(shù)分量再計算非參數(shù)分量。參數(shù)平差模型中的函數(shù)形式是已知的,而非參數(shù)平差模型中的回歸函數(shù)是未知的,所以參數(shù)模型只是需求解待定參數(shù)。由以上內容分析可知,半?yún)?shù)平差模型的兩個特例是參數(shù)平差模型與非參數(shù)平差模型,當時為非參數(shù)平差模型,將歸入誤差項則為參數(shù)平差模型。§1.2 半?yún)?shù)核估計理論應用研究現(xiàn)狀目前國內外對于核估計已經做了很多研究:在國外,Silverman(1986)對自適應核估計做了研究;M.Hagmann(2007)對非對稱核密度估計進行了研究,并深入討論

44、了如何偏差校正;Scott(1992)、Jones(1995)研究了核光滑估計;Peter M.Robinson(2003)對高階核半?yún)?shù)估計做了研究;T.Alberts、R.J.Karunamuni(2003)對如何運用核密度估計來消除半?yún)?shù)邊界誤差以及交替的核混合密度估計做了研究;Sebastiano Manzan(2005)對基于偏線性相加模型下的核密度估計做了研究;Eva Ferreira(1997)對在不穩(wěn)定情況下的相關誤差,討論了核回歸估計中的曲線如何增長;Tae Yoon Kim(1995)對較強混合過程中的核密度估計做了研究;D.CHAUDHURI(1996)對數(shù)據(jù)驅動密度估計

45、及其相關應用做了研究;Nils Lid Hjort(2000)對核密度估計中的最佳窗寬選取做了研究;Bert van Es(1997)對非光滑核密度估計中的積分均方誤差進行了分析;Yuri Goegebeur(2010)對極值統(tǒng)計中的參數(shù)核估計做了研究; R.J. Karunamuni(2006)對有限混合模型核估計的漸進正態(tài)自適應性做了研究;Fateh Chebana(2006),Michel Carbon,Carlos Tenreiro,Abdelkader Mokkadem,Delaigle等學者均深入研究了核估計。在國內,洪圣巖對如何在核估計中選取最佳窗寬做了研究;薛留根對密度函數(shù)核估

46、計進行了相關問題的研究;趙林城(1984)將核估計同近鄰估計進行了對比,并且通過的自適應估計最終可以得到最優(yōu)收斂速度;秦更生對隨機刪失場合中的部分線性模型的核光滑方法進行了研究;王啟華對隨機刪失情況下概率密度核估計中的光滑Bootstrap逼近進行了分析;朱仲義、李朝暉對最小二乘估計與半?yún)?shù)函數(shù)模型的核進行了研究。將半?yún)?shù)回歸模型同核估計理論相結合并應用到測繪領域,是一種全新的測量平差方法,雖然目前不管在理論研究還是實際應用方面都研究得較少,但是也取得了許多的成就:丁士俊25將詳細分析了偏核光滑估計和偏殘差核估計方法,并對兩種方法的估計性能和效果進行了對比分析;張松林26解算出最小二乘核估計的

47、非參數(shù)分量和參數(shù)分量的公式,對參數(shù)分量的估計結果的有偏性和漸近正態(tài)性進行了證明;潘雄32用半?yún)?shù)模型中的非參數(shù)分量來模擬系統(tǒng)誤差,提出了處理測量中系統(tǒng)誤差的一種新方法等等。第二章 半?yún)?shù)核估計方法§2.1 半?yún)?shù)核估計理論目前,研究半?yún)?shù)平差模型的主要方法有偏樣條估計、最小二乘估計、分塊多項式估計、二階段估計、多項式估計、三角級數(shù)估計、小波估計等,但是目前只有張松林26、丁士俊25等對于半?yún)?shù)平差模型中的核估計進行了研究。 本文所要研究的半?yún)?shù)核估計理論方法,其模型形式為式(1-9)。在本章,主要研究的核估計理論,包括核函數(shù)和核權函數(shù)的定義與選?。唤榻B了偏核光滑估計和最小二乘核估計兩

48、種估計方法。在小樣本的情況下,選取不同的核權函數(shù),不同的核函數(shù),估計結果也就不一樣,不同的核估計方法有不同的特點,因而兩種半?yún)?shù)核估計方法也有各自的適用范圍。在數(shù)理統(tǒng)計學中,我們在判斷和估計一個數(shù)學模型的主要思想就是用從總體樣本中所隨機抽取的部分樣本來對總體進行估計,而本文研究的核估計就是來源于這種思想。在此基礎上,數(shù)理界定義了核估計:設為己知給定樣本空間中獨立同分布的一維隨機變量,且的密度函數(shù)未知,則可以得到一組形式如下的函數(shù): (2-1)其中為定義在()上的一個Borel可測函數(shù),稱為概率密度核權函數(shù),也成為核函數(shù)。窗口參數(shù)>0為常數(shù),稱為窗寬,它是與樣本容量有關的一列正實數(shù),并且當

49、時,。因此,稱這樣的一組為未知函數(shù)的核估計。同非參數(shù)平差模型一樣,一提到半?yún)?shù)核估計理論就不得不引入權函數(shù)。權函數(shù)對于相應變量的空間分布具有較大的影響,在測繪數(shù)據(jù)處理中,使用比較廣泛的權函數(shù)有概率密度權函數(shù)、最小二乘權函數(shù)、丹麥法權函數(shù)、Huber權函數(shù)、Andrews權函數(shù)、Turkey權函數(shù)、Hampel權函數(shù)以及IGG權函數(shù)等等,當然,不同的權函數(shù)所產生的估計結果也就不一樣。模型為(1-9),則的權函數(shù)估計可表示為: =其中為權函數(shù),設是選定的n個依賴于t的 Borel函數(shù),總是的線性組合,一個對應一個,與一般無對應關系,的構造可能與全體或部分的有關,視具體函數(shù)而定,故一般寫為,是整個樣

50、本相對于點的權,它反映了在估計時,樣本作用的大小。在一般的實際問題中,設概率權函數(shù) ,權函數(shù)其滿足下面的條件:, (2-2)滿足以上條件的權函數(shù)為概率權,由不同的權函數(shù)形式衍生出不同的估計方法,核權函數(shù)和近鄰權函數(shù)是最基本的概率密度權函數(shù),由此所產生的相應的半?yún)?shù)估計是核估計和近鄰估計,核估計和近鄰估計理論也是基于平差模型的基礎上的,張松林,柴根象等已對近鄰估計的方法進行過研究。而在本文中要研究的半?yún)?shù)核估計理論中所采用權函數(shù)都是概率密度權函數(shù),基于最小二乘原理下概率密度權函數(shù)參數(shù)估計結果,具有無偏性、有效性、穩(wěn)定性和一致性。 核權函數(shù)是一種最重要的權函數(shù),對于如何選擇適當?shù)臋嗪瘮?shù)以用于特定的

51、問題中,對這個問題可以從大樣本理論的觀點得出一些一般性的指導原則。Watson與Nadaraja(1964)提出了一種適合非參數(shù)模型的核函數(shù),即選定R空間上的核函數(shù)(一般為概率密度),核權函數(shù)的定義為: (2-3)則的權函數(shù)估計可表示為:= (2-4)這種核估計被稱為Waston-Nadaraja核估計,上式中窗寬參數(shù)是一個重要的光滑參數(shù),當以-1,1為其范圍,且是單峰、對稱,是集中在附近一個鄰域的樣本的加權平均值,而正好是該鄰域的寬度。假如較小時,則參與平均的樣本就少,這樣估計量的偏差就小,但是降低了估計的精度;假如較小時,則結果正好相反。除上述核估計之外,還有其他形式的核權函數(shù): = (2

52、-5) = (2-6)在核估計中,如何確定核函數(shù),一般要考慮實際應用情況,是定義在上的概率密度函數(shù),一般為以下九種函數(shù): (2-7) (2-8) (2-9) (2-10) (2-11) (2-12) (2-13) (2-14) (2-15)觀察這九個核函數(shù)的定義式可以分析出核函數(shù)所具有的一般性質:一是核函數(shù)是定義在上的可測實函數(shù),且有上確界;二是核函數(shù)一般為某個隨機變量的關于軸對稱的概率密度函數(shù);三是核函數(shù)都滿足積分和為1。 可以看出,在半?yún)?shù)核估計中隨著核權函數(shù)和核函數(shù)的變化會產生不同的估計結果,因此在解決實際問題進行核估計時,我們要根據(jù)實際情況選擇適當?shù)暮撕瘮?shù)。因為核函數(shù)的選取,對估計結果

53、有很大影響。如果在確定了觀測數(shù)據(jù)樣本和核函數(shù)的基礎上,核估計結果就主要由窗寬參數(shù)決定。單從定義式來看,核估計在每一個觀察點都會一個“碰撞”。而核函數(shù)決定 “碰撞”的形狀,而窗寬參數(shù)則決定的則決定這些“碰撞”的寬度,估計量都是這些“碰撞”的和。如果選擇窗寬參數(shù)太小,核估計會出現(xiàn)比較大的干擾尤其是圖像尾部,這時就會有增大方差的趨勢;相反,如果選擇窗寬參數(shù)太大,經過數(shù)學壓縮變換之后平均化作用就會顯得突出,結果是密度的細節(jié)部分便就淹沒了,我們在實際應用中應該根據(jù)實際情況來適當?shù)倪x擇窗寬參數(shù),來平衡前述討論的兩種不同情況。§2.2 最小二乘核估計 兩步估計的典型例子是最小二乘核估計。首先根據(jù)本章第一節(jié)內

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論