下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、中航信人數(shù)據(jù)思考與實(shí)踐【賽迪網(wǎng)訊】我來(lái)自中國(guó)民航信息集團(tuán)公司(以下簡(jiǎn)稱中國(guó)航信)。中國(guó)航信的前身創(chuàng)建于80年代,30年來(lái),一直為中國(guó)民航業(yè)提供信息化服務(wù)。 中國(guó)航信 正式組建于2002年10月,屬國(guó)資委管理的中央企業(yè),現(xiàn)有員工近 4000人,總部 在北京。2000年10月,中國(guó)民航計(jì)算機(jī)信息中心聯(lián)合當(dāng)時(shí)所有國(guó)內(nèi)航空公司發(fā)起成立中國(guó)民航信息網(wǎng)絡(luò)股份有限公司,于2001年2月在香港聯(lián)交所主板掛牌上市交易。2008年7月,中國(guó)民航信息集團(tuán)公司以中國(guó)民航信息網(wǎng)絡(luò)股份有限公司為 主體,完成主營(yíng)業(yè)務(wù)和資產(chǎn)重組并在香港成功整體上市。目前,中國(guó)航信是航空旅游行業(yè)領(lǐng)先的信息技術(shù)及商務(wù)服務(wù)提供商,主要業(yè)務(wù)是航空客
2、運(yùn)業(yè)務(wù)處理、航空旅游電子分銷、機(jī)場(chǎng)旅客處理、航空貨運(yùn)數(shù)據(jù)處理、 航空財(cái)務(wù)結(jié)算清算、IT外包服務(wù)、互聯(lián)網(wǎng)旅游分銷平臺(tái)。包括淘寶、攜程、藝龍 在內(nèi),它們銷售客票的原始數(shù)據(jù)都由中國(guó)航信提供。航信的電子客票服務(wù),可以 讓乘客方便地通過(guò)網(wǎng)絡(luò)購(gòu)買機(jī)票、網(wǎng)上值機(jī),拿著第二代身份證就可以登機(jī)。我曾經(jīng)看到過(guò)這樣一個(gè)報(bào)道:美國(guó)某機(jī)場(chǎng)通過(guò)視頻監(jiān)控發(fā)現(xiàn)一個(gè)旅客把前面旅客的勞力士手表給偷了。隨著服務(wù)細(xì)化以及航信客戶-航空公司的要求越來(lái)越高、越來(lái)越細(xì),中國(guó)航信也會(huì)逐步將圖像、聲音、視頻加入到數(shù)據(jù)庫(kù)當(dāng)中,增加 數(shù)據(jù)庫(kù)的多樣性。目前,航信只是把圖片放到了數(shù)據(jù)庫(kù)中,視頻還沒(méi)有放到其中。中國(guó)航信目前運(yùn)行著超過(guò) 2000臺(tái)硬件設(shè)備
3、,每秒鐘事務(wù)處理能力是11000TNX/S,每天為100萬(wàn)旅客提供訂票離港服務(wù),每天交易量10億元。中航信目前存儲(chǔ)的數(shù)據(jù)大部分為結(jié)構(gòu)化數(shù)據(jù),擁有超過(guò)2PB的存儲(chǔ)系統(tǒng),每年結(jié)構(gòu)化數(shù)據(jù)增長(zhǎng)量為35%中國(guó)航信擁有3個(gè)正在運(yùn)行的數(shù)據(jù)中心,還有兩個(gè)在建數(shù)據(jù)中心,分別是在順義的30000平米數(shù)據(jù)中心以及浙江在嘉興的15000平米數(shù)據(jù)中心。未來(lái),會(huì)根據(jù)客戶需求以及市場(chǎng)驅(qū)動(dòng)等因素,來(lái)決定在結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)的投 資。目前,中航信最緊迫是要滿足航空公司的實(shí)時(shí)票價(jià)計(jì)算需求。實(shí)時(shí)票價(jià),就 是航空公司能夠在在某一時(shí)刻,根據(jù)歷史數(shù)據(jù)、當(dāng)下的需求,來(lái)自動(dòng)決定機(jī)票售 價(jià),既可以讓航空公司的利潤(rùn)最高,又能夠讓消費(fèi)者能夠接受
4、。這個(gè)動(dòng)態(tài)票價(jià)點(diǎn) 需要在幾秒內(nèi)計(jì)算出來(lái),需要結(jié)構(gòu)化大數(shù)據(jù)、并行計(jì)算等技術(shù)來(lái)進(jìn)行支撐。中航 信現(xiàn)采用的傳統(tǒng)teradata關(guān)系數(shù)據(jù)庫(kù),不能支持實(shí)時(shí)計(jì)算。航信成立之后的前20年,中國(guó)航信都是采用傳統(tǒng)的主機(jī)系統(tǒng),設(shè)備都是舊M的UNIX。目前,中國(guó)航信正在從傳統(tǒng)的主機(jī)模式向開放平臺(tái)進(jìn)行轉(zhuǎn)移,目前,酒 店業(yè)務(wù)、貨運(yùn)業(yè)務(wù)、電子客票、機(jī)場(chǎng)離崗等等都在逐步地向開放平臺(tái)進(jìn)行遷移。在開放平臺(tái)上,中國(guó)航信主要應(yīng)用是的Oracle或者M(jìn)ySQL數(shù)據(jù)架構(gòu)之間相互比較獨(dú)立、煙囪式的,每個(gè)系統(tǒng)之間數(shù)據(jù)沒(méi)有物理上的聯(lián)系。而邏輯上的些微 聯(lián)系也是根據(jù)業(yè)務(wù)需求,進(jìn)行的數(shù)據(jù)交換。這些數(shù)據(jù)在物理上是統(tǒng)一存儲(chǔ),我們 在3年前實(shí)現(xiàn)了在開
5、放平臺(tái)上的虛擬化存儲(chǔ)技術(shù),把所有的磁盤、所有的應(yīng)用系 統(tǒng)、主機(jī)都集成到我們的虛擬化云平臺(tái)上,可以根據(jù)需要在幾分鐘內(nèi)就部署一套 系統(tǒng),這在兩年前就完全實(shí)現(xiàn)了。中國(guó)航信在2002年投資一億部署Teradata的數(shù)據(jù)倉(cāng)庫(kù)。這是一個(gè)關(guān)系型數(shù) 據(jù)庫(kù),它能存儲(chǔ)大量數(shù)據(jù),但缺點(diǎn)是反應(yīng)速度慢,沒(méi)法實(shí)時(shí)地為航空公司提供服 務(wù),不能在規(guī)定時(shí)間內(nèi)計(jì)算出票價(jià),這個(gè)需求對(duì)于航空公司、客票代理、購(gòu)票人都是非常有用的。過(guò)長(zhǎng)的等待時(shí)間會(huì)讓該功能失去功用了,因此 Teradata系統(tǒng)不 能用于實(shí)時(shí)的計(jì)算,都是按天為單位來(lái)運(yùn)算的。在 2000年時(shí),覺(jué)得Teradata的 存儲(chǔ)容量很大,可以存儲(chǔ) 12年的數(shù)據(jù),但我們現(xiàn)在存儲(chǔ)半年數(shù)
6、據(jù)就滿了,且管 理成本、運(yùn)維成本、擴(kuò)容成本都是千萬(wàn)級(jí)的,也非常昂貴。根據(jù)預(yù)測(cè),2020年的中國(guó)航空旅客運(yùn)輸量將達(dá)到 7.7億人次左右,年復(fù)合增 長(zhǎng)率為12.27%,并將成為全球第一的航空旅行大國(guó)。航空客運(yùn)銷售代理市場(chǎng)的規(guī) 模將達(dá)到360億元左右,成長(zhǎng)空間巨大??梢灶A(yù)見,支撐這一巨大規(guī)模的IT系統(tǒng)也將是及其復(fù)雜的。止匕外,中航信今天還面臨數(shù)據(jù)多樣性的挑戰(zhàn)。數(shù)據(jù)多樣性,這更多是由客戶 驅(qū)動(dòng),如航空公司、客票代理、旅客對(duì)價(jià)格的理解,對(duì)服務(wù)需求的理解,對(duì)服務(wù) 要求的提高,會(huì)促使中航信決定是不是、何時(shí)應(yīng)用大數(shù)據(jù),是結(jié)構(gòu)化的還是非機(jī) 構(gòu)化的。比如中航信現(xiàn)有數(shù)據(jù)庫(kù)支持圖片,那就可以支持在乘客離崗時(shí)候照一張
7、照片,在登機(jī)口利用照片核對(duì)是否同一人,符合之后才可以登機(jī)。但這里面的數(shù) 據(jù)保密問(wèn)題,對(duì)航空公司、信息服務(wù)提供商、乘客都是一個(gè)很大挑戰(zhàn)。在2011年,中航信就開始研究大數(shù)據(jù),是以事件交易服務(wù)為中心,主要面向旅客、面向航空公司來(lái)做大數(shù)據(jù)的服務(wù)。 并在2011年底對(duì)國(guó)內(nèi)航空公司做了調(diào)研。 航空公司要求航信能夠提供實(shí)時(shí)機(jī)票定價(jià)服務(wù),根據(jù)市場(chǎng)需求,根據(jù)航線情況, 能夠給出旅客能夠接受的最高價(jià)格,比如京滬航線,什么時(shí)候全價(jià)、什么時(shí)候能 夠打八折、八五折、七折,或者更低的折扣,這就要求航信提供很快的服務(wù),能 夠根據(jù)當(dāng)時(shí)的市場(chǎng)需求、以及前幾年的歷史數(shù)據(jù),以及飛機(jī)時(shí)刻,來(lái)計(jì)算出能夠 航空公司所能賣出的最高價(jià)格,
8、同時(shí)也能提高艙位的利用率。同時(shí),也要監(jiān)測(cè)競(jìng)爭(zhēng)對(duì)手是不是有低價(jià),如果競(jìng)爭(zhēng)對(duì)手給出低價(jià),航空公司也要立即跟進(jìn)。這都需 要實(shí)時(shí)數(shù)據(jù)來(lái)支撐。目前,中國(guó)航信在 EMC勺Greenplum上進(jìn)行了大數(shù)據(jù)部署,這是基于事務(wù)性 的、云計(jì)算部署,它解決了結(jié)構(gòu)化數(shù)據(jù)并行計(jì)算問(wèn)題,能夠快速計(jì)算、迅速反應(yīng), 但在圖像存儲(chǔ)上還有待完善。未來(lái),航信最終會(huì)做hadoop,會(huì)采用全開源的NoSQL+X86勺硬件平臺(tái),利用 mapreduce、bigtable、GFS等類似的技術(shù)。特別是對(duì)于證券業(yè)、民航業(yè)、銀行業(yè)等結(jié)構(gòu)化數(shù)據(jù)較多的企業(yè)來(lái)說(shuō), Greenplum 是適用的,因?yàn)樗慕Y(jié)構(gòu)化數(shù)據(jù)+并行處理能力強(qiáng)大。而對(duì)于擁有大量圖像
9、、聲音、 視頻的非機(jī)構(gòu)化數(shù)據(jù),hadoop更加適用。對(duì)企業(yè)來(lái)說(shuō),任何技術(shù)都有好處和缺陷,關(guān)鍵要看企業(yè)客戶需求是什么,客 戶要拿來(lái)做什么。就好比:不可能開著飛機(jī)大炮去打獵,得拿著獵槍。因此,服 務(wù)提供商選擇什么樣的技術(shù)是基于客戶的需求,要選對(duì)工具和技術(shù)去支撐應(yīng)用, 這是最關(guān)鍵的一點(diǎn),看不到這點(diǎn),會(huì)走冤枉路,花冤枉錢。中航信目前在做一個(gè)shopping ,把中航信的酒店、機(jī)票還有價(jià)格放到平臺(tái)上 面,底層用的是mysql,上層是一些Nosql的數(shù)據(jù)庫(kù),這樣能夠快速響應(yīng)。因?yàn)榻y(tǒng) 計(jì)發(fā)現(xiàn),大概每900-1000個(gè)的訪問(wèn)者中只有一人進(jìn)行了購(gòu)買,大部分人是瀏覽。 為了應(yīng)對(duì)這種情況,中航信采用了低成本的mys
10、ql,上面放一個(gè)高速緩存的nosql數(shù)據(jù)庫(kù),上面再架設(shè)一個(gè)網(wǎng)站的方式來(lái)為客戶提供服務(wù)。民航主要用的是微軟數(shù)據(jù)庫(kù)架構(gòu),正逐步走向mapreduce、NoSQL逐步走向開源系統(tǒng)、開放架構(gòu)。由于中國(guó)航信研發(fā)人員比較多,能夠較好地對(duì)開源內(nèi)容進(jìn) 行編制和再創(chuàng)新,但最終還是航空公司和旅客的需求應(yīng)用來(lái)驅(qū)動(dòng)中國(guó)航信的架構(gòu)。比如未來(lái)旅客訂票需要圖像,又如我們提供的預(yù)定酒店服務(wù),可以在網(wǎng)上展 示酒店客房的實(shí)際情況,甚至可以模仿消費(fèi)者在房間里面走,而出現(xiàn)的視覺(jué)變化, 房間的布局、顏色。以及窗外的景色,這就需要大數(shù)據(jù)的支持,必須是非結(jié)構(gòu)化 大數(shù)據(jù)來(lái)支持,傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)是無(wú)法支持的??蛻粼敢饣ㄥX購(gòu)買這個(gè)服務(wù), 或者競(jìng)
11、爭(zhēng)讓這個(gè)服務(wù)以更低的成本得以實(shí)現(xiàn)。比如訂酒店,你可以看到周圍環(huán)境 的布局以及酒店房間里面的情況,這樣消費(fèi)者可以更快地決定是否購(gòu)買。如果其 他商家做不到,那就有獨(dú)特的競(jìng)爭(zhēng)優(yōu)勢(shì)。對(duì)商家來(lái)說(shuō),是否能夠負(fù)擔(dān)這個(gè)成本, 所有東西都取決于客戶的需求以及成本的匹配。在數(shù)據(jù)中心“大數(shù)據(jù)平臺(tái)”發(fā)展路線上,中國(guó)航信規(guī)劃了四個(gè)方面。第一是 基礎(chǔ)的IDC建設(shè),目前建設(shè)了兩個(gè)全新的數(shù)據(jù)中心;第二個(gè)是云存儲(chǔ)、云主機(jī)、 云計(jì)算;第三個(gè)是開放的云應(yīng)用,第四是把這些技術(shù)應(yīng)用到web上,如網(wǎng)上值機(jī)、根據(jù)座位圖來(lái)選擇座位,未來(lái)航信可以提供立體飛機(jī)倉(cāng)位示意圖,讓乘客可以更 直觀地判斷位置的舒適程度等,只要航空公司需要,就可以很快開發(fā)出這些服務(wù)。除了為民航提供服務(wù)之外,中國(guó)航信還對(duì)其他企事業(yè)單位開放,提供包括信 息服務(wù),外
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 買賣房產(chǎn)分期付款合同范例
- 單位內(nèi)部審計(jì)合同范例
- 會(huì)議布展服務(wù)合同范例
- 市場(chǎng)經(jīng)營(yíng)者責(zé)任規(guī)定
- 地下商場(chǎng)非開挖維修合同
- 商業(yè)抵押合同范本
- 產(chǎn)業(yè)園區(qū)物業(yè)委托管理協(xié)議
- 第一章 科學(xué)技術(shù)觀課件
- 深入肌理探究應(yīng)用-2024版《肌理與應(yīng)用》解讀
- 2024年安防監(jiān)控行業(yè)政策法規(guī)解讀
- 02J331地溝及蓋板圖集
- 2019年西藏開發(fā)投資集團(tuán)有限公司招聘試題及答案解析
- HAY崗位管理體系構(gòu)建
- 2023年中級(jí)經(jīng)濟(jì)師考試真題及答案
- SB/T 10895-2012鮮蛋包裝與標(biāo)識(shí)
- GB/T 9115-2010對(duì)焊鋼制管法蘭
- GB/T 2423.3-2006電工電子產(chǎn)品環(huán)境試驗(yàn)第2部分:試驗(yàn)方法試驗(yàn)Cab:恒定濕熱試驗(yàn)
- GB/T 23221-2008烤煙栽培技術(shù)規(guī)程
- GB/T 16900-2008圖形符號(hào)表示規(guī)則總則
- 城市綠地系統(tǒng)規(guī)劃 第9章 工業(yè)綠地規(guī)劃
- 遼寧省遼南協(xié)作校2022-2023學(xué)年高二上學(xué)期期末考試語(yǔ)文答案 Word版含解析
評(píng)論
0/150
提交評(píng)論