版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
報(bào)告人:韓昭核探測器與核電子學(xué)國家重點(diǎn)實(shí)驗(yàn)室(科大部)2013年5月3日1石油地震勘探及其大數(shù)據(jù)快速存儲技術(shù)研究介紹
2石油地震勘探簡介石油地震勘探是指利用儀器檢測、記錄人工激發(fā)地震的反射波、折射波的傳播時(shí)間、振幅、波形等,對地層界面、巖土性質(zhì)、地質(zhì)構(gòu)造進(jìn)行成像分析。人造地震是現(xiàn)在最重要的一種油氣勘探方法。3石油地震勘探簡介地震石油勘探的特點(diǎn)與發(fā)展趨勢:1、在地震數(shù)據(jù)處理中,利用檢波器采集的數(shù)據(jù)對地質(zhì)結(jié)構(gòu)成像分析。地震數(shù)據(jù)有很大的噪聲,檢波器排布越密集,可以得到越準(zhǔn)確的地質(zhì)結(jié)構(gòu)。2、為了勘探更深處的油氣,探測設(shè)備覆蓋的范圍越來越廣。3、因?yàn)樯鲜鲈?,現(xiàn)在地震勘探使用的地震儀器,達(dá)到了萬道量級,有些勘探公司已經(jīng)做到了十萬道,并且提出了百萬道的目標(biāo)。4石油地震勘探中要解決的問題對如此大規(guī)模的地震勘探設(shè)備,在前端的數(shù)據(jù)采集傳輸,后端的數(shù)據(jù)存取都要面臨很多問題1、數(shù)據(jù)采集傳輸中的問題(1)大量節(jié)點(diǎn)的管理(2)數(shù)據(jù)可靠傳輸(3)供電(4)低功耗(5)節(jié)點(diǎn)同步5石油地震勘探中要解決的問題2、數(shù)據(jù)存取處理中的問題(1)近年來處理器的能力隨著半導(dǎo)體工藝的發(fā)展進(jìn)步很快,比如,主流PC的CPU主頻已經(jīng)達(dá)到3GHz以上,服務(wù)器CPU大都達(dá)到十核以上。然而提供數(shù)據(jù)存儲的仍然是傳統(tǒng)的磁介質(zhì)硬盤,它的性能卻提高很有限。很多文獻(xiàn)資料表明IO速度已經(jīng)成為制約數(shù)據(jù)處理過程的一個(gè)瓶頸。(2)地震數(shù)據(jù)采集中,原始數(shù)據(jù)是記錄在磁帶中的,進(jìn)行數(shù)據(jù)處理時(shí),會(huì)將磁帶中的數(shù)據(jù)按一定的格式存儲在硬盤中?,F(xiàn)階段由于檢波器數(shù)目的增大地球物理勘探所產(chǎn)生的數(shù)據(jù)量越來越大,大都達(dá)到了TB甚至PB的量級,這對于后端的大數(shù)據(jù)處理產(chǎn)生了巨大的壓力。在一些地震數(shù)據(jù)處理的過程中數(shù)據(jù)分發(fā)所用的時(shí)間已經(jīng)和數(shù)據(jù)處理所花費(fèi)的時(shí)間基本相當(dāng)。(3)地震數(shù)據(jù)處理的過程中,需要對各種不同的數(shù)據(jù)組合進(jìn)行讀取分析,大部分情況下,這些數(shù)據(jù)都離散的分散在文件中,并不是連續(xù)的,這些離散的數(shù)據(jù)會(huì)導(dǎo)致數(shù)據(jù)獲取的速度大大降低。(4)本人主要工作是解決這一部分的問題。6離散數(shù)據(jù)存取速度慢的原因事實(shí)上,硬盤讀出數(shù)據(jù)的速度并不慢,但受到機(jī)械運(yùn)動(dòng)因素的影響,尋道時(shí)間非常慢。對于8KB數(shù)據(jù),數(shù)據(jù)讀取時(shí)間約為0.05ms平均尋道時(shí)間約為9ms平均尋道時(shí)間>>數(shù)據(jù)讀取時(shí)間對于機(jī)械式硬盤,最影響速度的是隨機(jī)訪問。然而地震的數(shù)據(jù)需要不同的組合,絕大部分是隨機(jī)的小數(shù)據(jù)訪問模式。解決辦法,多硬盤有效并行工作7磁盤陣列磁盤陣列(RedundantArraysofInexpensiveDisksRAID),利用數(shù)組方式來作磁盤組,在一定程度上實(shí)現(xiàn)了數(shù)據(jù)的分布存儲,可以達(dá)到并行,增加IO的作用。8傳統(tǒng)的地震數(shù)據(jù)存取方式以POSIX為代表的基于文件系統(tǒng)的存儲是現(xiàn)在大多數(shù)實(shí)驗(yàn)中大數(shù)據(jù)的存儲模式。地震數(shù)據(jù)按照一定格式存儲在文件中,典型的訪問函數(shù)為open文件,seek到特定的位置,read一定長度的內(nèi)容。POSIX標(biāo)準(zhǔn)是以一種流(stream)的串行的方式來訪問數(shù)據(jù)存儲區(qū)的。9磁盤陣列存在的問題磁盤陣列并沒有拋棄傳統(tǒng)的串行的文件系統(tǒng)存儲方式,每個(gè)硬盤并不知道自己的數(shù)據(jù),這些需要上層的串行命令,并靠RAID控制器分發(fā)實(shí)現(xiàn)。而這一過程是串行的,在硬盤數(shù)量不斷增加的情況下,會(huì)成為阻礙性能的瓶頸。其次,RAID是一種通用的存儲設(shè)備,并不理解數(shù)據(jù)的含義,只是固定長度的切割,這也會(huì)造成性能的下降。因?yàn)榇疟P陣列并沒有實(shí)現(xiàn)硬盤與硬盤之間的完全獨(dú)立,因此很難實(shí)現(xiàn)太大規(guī)模的并行。10Google提出的key-value存儲模式完全拋棄了POSIX的訪問模式,把每一個(gè)數(shù)據(jù)(value)打上一個(gè)key標(biāo)簽,然后作分布式的存儲。需要訪問數(shù)據(jù)的時(shí)候以key為關(guān)鍵字進(jìn)行檢索,可以同時(shí)有很多的客戶端同時(shí)響應(yīng),從而實(shí)現(xiàn)并發(fā)訪問。11Key-value面臨的最大問題因?yàn)榕c傳統(tǒng)的以文件系統(tǒng)為基礎(chǔ)的數(shù)據(jù)存儲方式差異太大,提出的主要應(yīng)用對象是針對數(shù)據(jù)庫的應(yīng)用。很多已經(jīng)成熟的軟件應(yīng)用無法直接使用key-value模式,即使重新移植風(fēng)險(xiǎn)也太大。這是因?yàn)閗ey-value模式與傳統(tǒng)的數(shù)據(jù)存儲方式,底層操作差別太大,需要對原本成熟的應(yīng)用程序進(jìn)行大量修改。12我們提出的iSmartDisk方案基于key-value的思想,提出了iSmartDisk的分布式存儲模式,把實(shí)驗(yàn)數(shù)據(jù)分布的存儲在用internet連接起來的具有CPU控制的硬盤上,訪問時(shí),利用Key-value的方式,向各個(gè)節(jié)點(diǎn)分發(fā)需要的數(shù)據(jù)的標(biāo)簽。所有節(jié)點(diǎn)并行的查找,提供自己的數(shù)據(jù)。在提供快速IO并發(fā)訪問的同時(shí),對現(xiàn)有的大型應(yīng)用程序保持兼容。13iSmartDisk初步測試結(jié)果系統(tǒng)測試結(jié)果,IO性能同節(jié)點(diǎn)數(shù)呈線性增長關(guān)系。在同傳統(tǒng)的建立在RAID的基礎(chǔ)上的文件系統(tǒng)的IO速度相比,在同樣的硬盤數(shù)目下,IO速度提高了8倍!現(xiàn)有RAID速度測試平臺:地空學(xué)院曙光服務(wù)器存儲設(shè)備:服務(wù)器26個(gè)計(jì)算節(jié)點(diǎn)上的硬盤測試方法:將數(shù)據(jù)文件按照相應(yīng)的算法分布存儲在計(jì)算節(jié)點(diǎn)的硬盤上,然后根據(jù)需要讀取數(shù)據(jù)14iSmartDisk的特點(diǎn)iSmartDisk提出了把key-value分布式數(shù)據(jù)庫的存儲思想用于大型實(shí)驗(yàn)數(shù)據(jù)的新存儲概念。實(shí)現(xiàn)了每個(gè)硬盤的完全獨(dú)立,所有的節(jié)點(diǎn)都是并行處理,正因如此,可以支持大量的并行。在key-value的基礎(chǔ)上還提出了通過算法實(shí)現(xiàn)無元數(shù)據(jù)(meta-data)的存儲模式,進(jìn)一步加快隨機(jī)IO速度。利用虛擬文件的技術(shù),在利用iSmartDisk的快速IO能力的同時(shí)保持了應(yīng)用程序級的兼容。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度影視后期制作與剪輯服務(wù)合同范本4篇
- 2025年度專業(yè)樹木種植與生態(tài)旅游開發(fā)合同4篇
- 2025年度夏令營教育成果評估與分析合同4篇
- 把羊包給他人的合同
- 2025年度林業(yè)資源開發(fā)與合作經(jīng)營合同模板3篇
- 2025年度牛只運(yùn)輸與飼料配送綜合性服務(wù)合同4篇
- 2025年度內(nèi)墻涂料工程舊房翻新改造施工合同2篇
- 二零二五年度煤礦資源整合項(xiàng)目合同書4篇
- 2025版民宿布草租賃與民宿客棧特色文化打造合同4篇
- 2025年度股權(quán)轉(zhuǎn)讓與客戶關(guān)系維護(hù)合同范本3篇
- 9.1增強(qiáng)安全意識 教學(xué)設(shè)計(jì) 2024-2025學(xué)年統(tǒng)編版道德與法治七年級上冊
- 《化工設(shè)備機(jī)械基礎(chǔ)(第8版)》全套教學(xué)課件
- 人教版八年級數(shù)學(xué)下冊舉一反三專題17.6勾股定理章末八大題型總結(jié)(培優(yōu)篇)(學(xué)生版+解析)
- 2024屆上海高考語文課內(nèi)古詩文背誦默寫篇目(精校版)
- DL-T5024-2020電力工程地基處理技術(shù)規(guī)程
- 2024年度-美團(tuán)新騎手入門培訓(xùn)
- 初中數(shù)學(xué)要背誦記憶知識點(diǎn)(概念+公式)
- 駕照體檢表完整版本
- 農(nóng)產(chǎn)品農(nóng)藥殘留檢測及風(fēng)險(xiǎn)評估
- 農(nóng)村高中思想政治課時(shí)政教育研究的中期報(bào)告
- 20100927-宣化上人《愣嚴(yán)咒句偈疏解》(簡體全)
評論
0/150
提交評論