版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第七章有序地質(zhì)量最優(yōu)分割法楊永國中國礦業(yè)大學資源與地球科學學院內(nèi)容提要:第一節(jié)概述第二節(jié)單元有序數(shù)據(jù)的最優(yōu)分割第三節(jié)多元有序數(shù)據(jù)的最優(yōu)分割第四節(jié)最優(yōu)分割法的計算步驟第一節(jié)概述■
地質(zhì)數(shù)據(jù)中有相當多是有序的。這些按一定順序排列的地質(zhì)變量,叫做有序地質(zhì)
量。例如,沿地層露頭剖面采集的巖石標
本;鉆孔取出的巖芯樣品;這類數(shù)據(jù)的特點是樣品的前后次序不能變更。所以,一些不考慮樣品排列順序的
數(shù)學處理方法,對此不適用。有序地質(zhì)量
最優(yōu)分割法,就是對一批有序數(shù)據(jù)(地質(zhì)
體)進行分段的統(tǒng)計方法。第一節(jié)概述
設(shè)有n個按順序排列的樣品,每個樣品測得
p個變量,這批數(shù)據(jù)可用數(shù)據(jù)矩陣的形式表示為其中, 表示第
i個樣品第l個變量的取值。第一節(jié)概述若對以上n個有序樣品進行分割(分段),可能有種劃分方法,每一種分法稱為一種分割。
對n個樣品分段并使組內(nèi)離差平方和最小的分割方法,稱為最優(yōu)分割法。樣品變量總離差平方和的分解式為:T=W+B(7-1)式中,T為總離差平方和;W為組內(nèi)離差平方和;B為組間離差平方和。第一節(jié)概述
由式(7-1)可知,如果n個樣品分為K段,每段的樣品個數(shù)為nk,若每個樣品只取一個變量,則(7-2)■(7-3)第一節(jié)概述因此,尋求最優(yōu)分割,就是用計算的方法找出使組內(nèi)離差平方和(W)最小的那些分割點。這與判別分析中費歇準則相似,
所以有序地質(zhì)量最優(yōu)分割法,有人又稱為
“F-分割法”或“有序樣品的聚類分析”。第二節(jié)單元有序數(shù)據(jù)的最優(yōu)分割主要內(nèi)容:一、最優(yōu)二段分割二、最優(yōu)三段分割三、最優(yōu)K段分割第二節(jié)單元有序數(shù)據(jù)的最優(yōu)分割若有n個有序樣品,每個樣品只取一個變量,則有n個有序數(shù)據(jù)序列,為現(xiàn)在試圖將這n個樣品按順序分割為K段,使段(組)內(nèi)離差平方和盡可能小,而組間離差平方盡可能大。為此,用{xi,xi+1,…,xj}表示從第i個樣品數(shù)據(jù)開始至第j個樣品數(shù)據(jù)為止的某段樣品,其中1≤i≤j≤n該段樣品變量的離差平方和為(7-4)第二節(jié)單元有序數(shù)據(jù)的最優(yōu)分割式中■愈小,表示段內(nèi)各樣品之間差異性愈小;反之, 愈大,表示段內(nèi)各樣品之間的差異愈大。因此,又把 稱為{i,…,j}段的段直徑。第二節(jié)單元有序數(shù)據(jù)的最優(yōu)分割在實際應(yīng)用時,往往事先不知道n個有序樣品客觀上究竟能劃分成幾段。因此,必須從最優(yōu)分成二段、三段、…、K段進行分析。第二節(jié)單元有序數(shù)據(jù)的最優(yōu)分割一、最優(yōu)二段分割若把n個有序樣品{則有如下n-1種不同的分法,即}分為兩段,第二節(jié)單元有序數(shù)據(jù)的最優(yōu)分割在n個有序樣品中,對任意一個j(1≤j≤n-1)都可以確定一個二段分割,即{1,…,j}{j+1,…,n}。若把對n個樣品在第j個樣品處進行的二段分割
的組內(nèi)離差平方和記為式中,n表示被分割的樣品數(shù);2表示把n個樣品分為二段;j表示以第j個樣品為分割點。第二節(jié)單元有序數(shù)據(jù)的最優(yōu)分割二、最優(yōu)三段分為三段,和第j個若把n個有序樣品其中必有兩個分割點。假設(shè)第樣品為分割點,則三段分割為若把三段分割的組內(nèi)離差平方和記為:
其中a1,j為兩個分割點(1≤a1≤j-1,2≤j1),則顯然,如果有 為最優(yōu)三段分割,則 必為最優(yōu)二段分割
。
因此,如果對n個有序數(shù)據(jù)進行最優(yōu)三段分割,必須對任意一個j(2≤j≤n-1),即前j數(shù)據(jù)先求出其最優(yōu)二段分割,為若則前j個樣品的最優(yōu)二段分割為第二節(jié)單元有序數(shù)據(jù)的最優(yōu)分割三、最優(yōu)K段分割若對n個有序樣品數(shù)據(jù)進行最優(yōu)K段分割,可先找出前j(K-1≤j≤n-1)個樣品的最優(yōu)K-1段最優(yōu)分割,即應(yīng)當指出,分割的段數(shù)K一直可做到所要求的段數(shù)K為止;或者可以預(yù)先給定一個小正數(shù)
,使K段分割的組內(nèi)離差平方和后為止。這樣得出的K就是最后的分割的段數(shù)。第二節(jié)單元有序數(shù)據(jù)的最優(yōu)分割
由圖7-1所示組內(nèi)離差平方和是隨分段段數(shù)K的增加而單調(diào)地減少。所以當K=n時,組內(nèi)離差平方和為零。因此,可根據(jù)組內(nèi)離差平方和隨段數(shù)增加而下降到比較穩(wěn)定的時候(即圖中曲線平緩時)再確定分段段數(shù)。圖7-1組內(nèi)離差平方和(W)與分段數(shù)(K)關(guān)系圖第三節(jié)多元有序數(shù)據(jù)的最優(yōu)分割為了分層,有時需要匯集樣品更多的信息,采用多個變量指標。例如,采集n個有序樣品,每個樣品測得p個變量,原始數(shù)據(jù)可構(gòu)成一個階矩陣,為第三節(jié)多元有序數(shù)據(jù)的最優(yōu)分割在多變量情況下,人們自然會聯(lián)想到是否能將單元有序數(shù)據(jù)最優(yōu)分割原理引伸到多元數(shù)據(jù)中來,以此對n個有序樣品進行分割,一般最簡單有效的辦法就是把一段樣品多個變量合并為一個變量來處理,統(tǒng)一定義“段直徑”。但是,為了使不同變量具有共同的數(shù)據(jù)基礎(chǔ),事先要對各個變量進行數(shù)據(jù)規(guī)格化處理,如使數(shù)據(jù)作正規(guī)化變換。原始數(shù)據(jù)矩陣中元素記為: ,則正規(guī)化數(shù)據(jù)為(7-8)第三節(jié)多元有序數(shù)據(jù)的最優(yōu)分割得正規(guī)化數(shù)據(jù)矩陣第三節(jié)多元有序數(shù)據(jù)的最優(yōu)分割
根據(jù)正規(guī)化數(shù)據(jù),將樣品段{i,…,j}的段直徑定義為■(7-9)式中(1≤
i≤j≤n,
β=1,2,…,p)
(7-10)第三節(jié)多元有序數(shù)據(jù)的最優(yōu)分割
若n個有序樣品分為K段,每段內(nèi)有nk個樣品,則多元有序數(shù)據(jù)最優(yōu)分割的原理與單元有序數(shù)據(jù)最優(yōu)分割一樣,使組內(nèi)離差平方和
應(yīng)當指出,樣品的段直徑除了用式(7-9)定義外,還可用其它方法定義。第四節(jié)最優(yōu)分割法的計算步驟1、數(shù)據(jù)正規(guī)化
設(shè)原始數(shù)據(jù)矩陣為第四節(jié)最優(yōu)分割法的計算步驟將X中的元素xil變換為(i=1,2,…,n;l=1,2,…,p)得正規(guī)化數(shù)據(jù)矩陣第四節(jié)最優(yōu)分割法的計算步驟2、計算段直徑矩陣D其中因為第四節(jié)最優(yōu)分割法的計算步驟故只須計算個,得第四節(jié)最優(yōu)分割法的計算步驟3、計算全部分割的組內(nèi)離差平方和(或段直徑和)及各種分段的最優(yōu)分割1)最優(yōu)二段分割由D矩陣對每一個m=n,n-1,…,2計算相應(yīng)的組內(nèi)離差平方和,為找出最小值,確定響應(yīng)的最優(yōu)二段分割點,即第四節(jié)最優(yōu)分割法的計算步驟2)最優(yōu)三段分割根據(jù)D矩陣及最優(yōu)二段分割結(jié)果,對每一個m=n,n-1,…,3計算相應(yīng)的三段分割的組內(nèi)離差平方和,為然后求出最小值,并確定相應(yīng)的最優(yōu)三段分割點,為第四節(jié)最優(yōu)分割法的計算步驟3)最優(yōu)K段分割根據(jù)矩陣D及最優(yōu)K-1段分割計算結(jié)果,對于每一個m=n,n-1,…,K分別計算相應(yīng)的K段分割的組內(nèi)離差平方和,為找出最小值,并確定相應(yīng)的最優(yōu)K段分割點,即第四節(jié)最優(yōu)分割法的計算步驟4繪制W-K曲線在W-K曲線上,選擇曲線拐點對應(yīng)的K值(取整)作為最終分段數(shù)。第四節(jié)最優(yōu)分割法的計算步驟例7-1 某煤礦所采煤層的煤質(zhì)牌號為主焦煤。在煤巷中見一火成巖墻侵入煤層,致使煤質(zhì)發(fā)生變化,為弄清楚煤質(zhì)變化情況,從火成巖附近每隔0.5m依次取一煤樣,獲得6個有序煤樣的鏡煤最大反射率數(shù)據(jù)為試進行最優(yōu)分割。第四節(jié)最優(yōu)分割法的計算步驟此樣本的可能分割法共有25-1=31種,今要在這31種分割中找出一種最優(yōu)的分割(類內(nèi)差別小,類間差別大)。其作法如下:對原始數(shù)據(jù)進行正規(guī)化變換后得正規(guī)化數(shù)據(jù),為計算直徑矩陣D,即第四節(jié)最優(yōu)分割法的計算步驟第四節(jié)最優(yōu)分割法的計算步驟(3)最優(yōu)二段分割。由D對于m=6,5,4,3,2時,計算第四節(jié)最優(yōu)分割法的計算步驟第四節(jié)最優(yōu)分割法的計算步驟第四節(jié)最優(yōu)分割法的計算步驟第四節(jié)最優(yōu)分割法的計算步驟從而得到6個樣品的最優(yōu)二段分割為:其中, 為分割點。(4)最優(yōu)三段分割。即對于m=6,5,4,3時,計算當m=6時,則分割點為:第四節(jié)最優(yōu)分割法的計算步驟第四節(jié)最優(yōu)分割法的計算步驟第四節(jié)最優(yōu)分割法的計算步驟第四節(jié)最優(yōu)分割法的計算步驟(5)最優(yōu)四段分割。即對于m=6,5,4時,計算當m=6時,則第四節(jié)最優(yōu)分割法的計算步驟第四節(jié)最優(yōu)分割法的計算步驟第四節(jié)最優(yōu)分割法的計算步驟(6)最優(yōu)五段分割。即對于m=6,5時,計算第四節(jié)最優(yōu)分割法的計算步驟當m=5時,則其中則其分割點為:第四節(jié)最優(yōu)分割法的計算步驟由組內(nèi)離差平方和(W)與分段段數(shù)(K)的關(guān)系圖(圖7-2)中看出,三段最優(yōu)分割
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年口譯員技能提升及認證服務(wù)合同3篇
- 增強現(xiàn)實工程價款組成詳解
- 家政服務(wù)辦事處招聘協(xié)議
- 民宿建設(shè)施工協(xié)議
- 廣告公司創(chuàng)意人員招聘合同
- 建筑檢測凈化工程協(xié)議
- 2025版電力設(shè)施安裝與環(huán)保驗收服務(wù)協(xié)議3篇
- 高空作業(yè)工具協(xié)議
- 礦山通風管涵施工協(xié)議
- 貸款審批與風險管理
- 重癥患者的營養(yǎng)支持
- 防范非法金融宣傳
- 咨詢經(jīng)理招聘面試題與參考回答(某大型國企)2025年
- 小學語文骨干教師專題講座《自由閱讀-開啟快樂的讀書之門》
- 南京審計大學金審學院《中級財務(wù)會計(上)》2022-2023學年第一學期期末試卷
- 2023年電信運營商液冷技術(shù)白皮書
- 瓷磚店銷售薪酬方案
- 2022年湖南省公務(wù)員錄用考試《申論》真題(縣鄉(xiāng)卷)及答案解析
- 2024年事業(yè)單位招聘考試計算機基礎(chǔ)知識復(fù)習題庫及答案(共600題)
- 西京學院《機械制造技術(shù)基礎(chǔ)》2022-2023學年第一學期期末試卷
- 機場航班信息LED顯示屏方案
評論
0/150
提交評論