地學數(shù)據(jù)處理基礎:3-地質數(shù)據(jù)處理基礎_第1頁
地學數(shù)據(jù)處理基礎:3-地質數(shù)據(jù)處理基礎_第2頁
地學數(shù)據(jù)處理基礎:3-地質數(shù)據(jù)處理基礎_第3頁
地學數(shù)據(jù)處理基礎:3-地質數(shù)據(jù)處理基礎_第4頁
地學數(shù)據(jù)處理基礎:3-地質數(shù)據(jù)處理基礎_第5頁
已閱讀5頁,還剩45頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第三章數(shù)據(jù)的簡單可視化1定類數(shù)據(jù);2定序數(shù)據(jù)3數(shù)值型數(shù)據(jù)1定類數(shù)據(jù)1.列出各類別2.計算各類別的頻數(shù)3.制作頻數(shù)分布表4.用圖形顯示數(shù)據(jù)定類數(shù)據(jù)1.頻數(shù):落在各類別中的數(shù)據(jù)個數(shù)2.比例:某一類別數(shù)據(jù)占全部數(shù)據(jù)的比值3.百分比:將對比的基數(shù)作為100而計算的比值4.比率:不同類別數(shù)值的比值定類數(shù)據(jù)的圖示—條形圖條形圖是用寬度相同的條形的高度或長短來表示數(shù)據(jù)變動的圖形條形圖有單式、復式等形式在表示定類數(shù)據(jù)的分布時,是用條形圖的高度來表示各類別數(shù)據(jù)的頻數(shù)或頻率繪制時,各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖定類數(shù)據(jù)的圖示—條形圖5191610211204080120

334

331

221

121

111

某礦區(qū)礦石的儲量級別分布條形圖333定類數(shù)據(jù)的圖示—餅圖(圓形圖)也稱餅圖,是用圓形及園內(nèi)扇形的面積來表示數(shù)值大小的圖形;主要用于表示總體中各組成部分所占的比例,對于研究結構性問題十分有用;在繪制圓形圖時,總體中各部分所占的百分比用園內(nèi)的各個扇形面積表示,這些扇形的中心角度,是按各部分百分比占3600的相應比例確定的;定類數(shù)據(jù)的圖示—(餅圖)圓形圖

1111.0%

2218.0%

33456.0%

3314.5%

25.5%

1215.8%某礦區(qū)礦石的儲量級別分布餅圖3332定序數(shù)據(jù)(可計算的指標)1.累計頻數(shù):將各類別的頻數(shù)逐級累加2.累計頻率:將各類別的頻率(百分比)逐級累加定序數(shù)據(jù)頻數(shù)分布表

(實例)在鏡下統(tǒng)計某種礦物單體顆粒的分布情況,進行工藝礦相分析。某種礦物單體顆粒的分布的頻數(shù)分布單體類別某光片粒數(shù)百分比(%)向上累積

向下累積

粒數(shù)百分比(%)粒數(shù)百分比(%)

很細粒A

細粒B

一般C

較粗粒D

粗粒E24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合計300100.0————定序數(shù)據(jù)的圖示—累計頻數(shù)分布圖243001322252700100200300400

A

B

C

D

E累積粒數(shù)(a)向下累積27616830300750100200300400

A

B

C

D

E累積粒數(shù)(b)向上累積某種礦物單體顆粒的分布的的累積頻數(shù)分布累計頻數(shù)分布圖在地質數(shù)據(jù)處理經(jīng)常用到,如確定礦石的破碎粒度的大小,土壤的粒度分布等等。定類數(shù)據(jù)的圖示—環(huán)形圖

(環(huán)形圖的制作)環(huán)形圖中間有一個“空洞”,總體中的每一部分數(shù)據(jù)用環(huán)中的一段表示環(huán)形圖與圓形圖類似,但又有區(qū)別圓形圖只能顯示一個總體各部分所占的比例環(huán)形圖則可以同時繪制多個總體的數(shù)據(jù)系列,每一個總體的數(shù)據(jù)系列為一個環(huán)環(huán)形圖可用于進行比較研究環(huán)形圖可用于展示定類和定序的數(shù)據(jù)品質數(shù)據(jù)的圖示—環(huán)形圖8%36%31%15%7%33%26%21%13%10%

A

B

C

D

E

甲乙兩巖體5元素含量分布的差異3數(shù)值型數(shù)據(jù)1.數(shù)據(jù)的分組2.數(shù)值型數(shù)據(jù)的圖示3.頻數(shù)分布的類型編制頻數(shù)分布表的步驟確定組數(shù)編制頻數(shù)分布表的步驟確定組距計算頻數(shù)編制表格頻數(shù)分布表的編制117122124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121某巖體50個樣品的某元素分析結果,試采用單變量值對數(shù)據(jù)進行分組。分組方法分組方法等距分組異距分組單變量值分組組距分組單變量值分組1.將一個變量值作為一組2.適合于離散變量3.適合于變量值較少的情況單變量值分組表某巖體50個樣品的某元素分析結果分組表含量頻數(shù)含量頻數(shù)含量頻數(shù)107108110112113114115117118121211133119120121122123124125126127121443223128129130131133134135137139211122112組距分組

(要點)將變量值的一個區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況必須遵循“不重不漏”的原則可采用等距分組,也可采用不等距分組組距分組

(步驟)確定組數(shù):組數(shù)的確定應以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。在實際分組時,可以按Sturges提出的經(jīng)驗公式來確定組數(shù)K確定各組的組距:組距(ClassWidth)是一個組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定,即

組距=(最大值-最小值)÷組數(shù)

根據(jù)分組整理成頻數(shù)分布表

組距分組

(幾個概念)1.下限:一個組的最小值2.上限:一個組的最大值3.組距:上限與下限之差4.組中值:下限與上限之間的中點值下限值+上限值2組中值=等距分組表

(上下組限重疊)某巖體50個樣品的某元素分析結果分組表按含量分組頻數(shù)頻率(%)105~110110~115115~120120~125125~130130~135135~140358141064610162820128合計50100等距分組表

(上下組限間斷)某巖體50個樣品的某元素分析結果分組表按含量分組頻數(shù)頻率(%)105~109110~114115~119120~124125~129130~134135~139358141064610162820128合計50100等距分組表

(使用開口組)某巖體50個樣品的某元素分析結果分組表按含量分組頻數(shù)頻率(%)110以下110~114115~119120~124125~129130~134135以上358141064610162820128合計50100等距分組與不等距分組

(在表現(xiàn)頻數(shù)分布上的差異)等距分組各組頻數(shù)的分布不受組距大小的影響可直接根據(jù)絕對頻數(shù)來觀察頻數(shù)分布的特征和規(guī)律不等距分組各組頻數(shù)的分布受組距大小不同的影響各組絕對頻數(shù)的多少不能反映頻數(shù)分布的實際狀況需要用頻數(shù)密度(頻數(shù)密度=頻數(shù)/組距)反映頻數(shù)分布的實際狀況分組數(shù)據(jù)—直方圖

(直方圖的制作)用矩形的寬度和高度來表示頻數(shù)分布的圖形,實際上是用矩形的面積來表示各組的頻數(shù)分布;在直角坐標中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應的頻數(shù)就形成了一個矩形,即直方圖(Histogram);直方圖下的總面積等于1。分組數(shù)據(jù)—直方圖

(直方圖的繪制)頻數(shù)1512963105110115120125130135140元素含量直方圖下的面積之和等于1某巖體50個樣品的某元素分析結果分組數(shù)據(jù)—直方圖

(直方圖與條形圖的區(qū)別)1.條形圖是用條形的長度(橫置時)表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的;2.直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,其高度與寬度均有意義;3.直方圖的各矩形通常是連續(xù)排列,條形圖則是分開排列。分組數(shù)據(jù)—折線圖

(折線圖的制作)折線圖也稱頻數(shù)多邊形圖(Frequencypolygon);是在直方圖的基礎上,把直方圖頂部的中點(組中值)用直線連接起來,再把原來的直方圖抹掉;折線圖的兩個終點要與橫軸相交,具體的做法是:第一個矩形的頂部中點通過豎邊中點(即該組頻數(shù)一半的位置)連接到橫軸,最后一個矩形頂部中點與其豎邊中點連接到橫軸;折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布是一致的。1512963105110115120125130135140元素含量頻數(shù)折線圖下的面積與直方圖的面積相等!分組數(shù)據(jù)—折線圖

(折線圖的繪制)某巖體50個樣品的某元素分析結果分組折線圖未分組數(shù)據(jù)—莖葉圖

(莖葉圖的制作)用于顯示未分組的原始數(shù)據(jù)的分布;由“莖”和“葉”兩部分構成,其圖形是由數(shù)字組成的;以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉;對于n(20≤n≤300)個數(shù)據(jù),莖葉圖最大行數(shù)不超過

L=[10×log10n

]

5.莖葉圖類似于橫置的直方圖,但又有區(qū)別:直方圖可大體上看出一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值;莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個原始數(shù)值,保留了原始數(shù)據(jù)的信息。樹莖樹葉7880223477788890012222333344466777889013344579910111213數(shù)據(jù)個數(shù)3132410莖葉圖類似橫置的直方圖未分組數(shù)據(jù)—莖葉圖

(莖葉圖的制作)某巖體50個樣品的某元素分析結果莖葉圖未分組數(shù)據(jù)—箱線圖

(箱線圖的制作)用于顯示未分組的原始數(shù)據(jù)或分組數(shù)據(jù)的分布;箱線圖由一組數(shù)據(jù)的5個特征值繪制而成,它由一個箱子和兩條線段組成;其繪制方法是:首先找出一組數(shù)據(jù)的5個特征值,即最大值、最小值、中位數(shù)Me和兩個四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU);連接兩個四分(位)數(shù)畫出箱子,再將兩個極值點與箱子相連接。未分組數(shù)據(jù)—單批數(shù)據(jù)箱線圖

(箱線圖的構成)中位數(shù)4681012QUQLX最大值X最小值圖3-9簡單箱線圖未分組數(shù)據(jù)—單批數(shù)據(jù)箱線圖

(實例)最小值107最大值139中位數(shù)123下四分位數(shù)117.75上四分位數(shù)128105110115120125130135140某巖體50個樣品的某元素分析結果的箱線圖分布的形狀與箱線圖

對稱分布QL中位數(shù)

QU左偏分布QL中位數(shù)

QU右偏分布QL

中位數(shù)

QU不同分布的箱線圖未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖

(實例)從某巖體中隨機采取11個樣品,分析8個元素的含量,所得結果如表。試繪制各元素含量的比較箱線圖,并分析各元素含量的分布特征某巖體11個樣品的8個元素分析結果元素樣品編號1234567891011ABCDEFGH76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖時間序列數(shù)據(jù)—線圖

(線圖的制作)繪制線圖時應注意以下幾點時間一般繪在橫軸,指標數(shù)據(jù)繪在縱軸;圖形的長寬比例要適當,其長寬比例大致為10:7;一般情況下,縱軸數(shù)據(jù)下端應從“0”開始,以便于比較;數(shù)據(jù)與“0”之間的間距過大時,可以采取折斷的符號將縱軸折斷;時間序列的方法實際上就是一維序列數(shù)據(jù)的問題。時間序列數(shù)據(jù)—線圖

(實例)已知1991~1998年我國城鄉(xiāng)居民家庭的人均收入數(shù)據(jù)如表,試繪制線圖。表3-111991~1998年城鄉(xiāng)居民家庭人均收入年份城鎮(zhèn)居民農(nóng)村居民199119921993199419951996199719981700.62026.62577.43496.24283.04838.95160.35425.1708.6784.0921.61221.01577.71926.12091.12162.0時間序列數(shù)據(jù)020004000600019911992199319941995199619971998城鎮(zhèn)居民農(nóng)村居民收入

(元)

圖3-14城鄉(xiāng)居民家庭人均收入1.雷達圖(RadarChart)是顯示多個變量的常用圖示方法;2.在顯示或對比各變量的數(shù)值總和時十分有用;3.假定各變量的取值具有相同的正負號,總的絕對值與圖形所圍成的區(qū)域成正比;4.可用于研究多個樣本之間的相似程度。多變量數(shù)據(jù)—雷達圖

(要點)設有n組樣本S1,S2,…Sn,每個樣本測得P個變量X1,X2,Xp,要繪制這P個變量的雷達圖,其具體做法是:

1.先做一個圓,然后將圓P等分,得到P個點,令這P個點分別對應P個變量,在將這P個點與圓心連線,得到P個幅射狀的半徑,這P個半徑分別作為P個變量的坐標軸,每個變量值的大小由半徑上的點到圓心的距離表示

2.再將同一樣本的值在P個坐標上的點連線。這樣,n個樣本形成的n個多邊形就是一個雷達圖。多變量數(shù)據(jù)—雷達圖

(雷達圖的制作)多變量數(shù)據(jù)—雷達圖

(實例)兩個巖體的8個元素分析含量,試繪制雷達圖。兩個巖體的8個元素分析含量元素巖體A巖體BABCDEFGH1942.59520.91316.89179.68232.90448.38358.64185.65890.28109.4185.4162.455

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論