版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、運用MongoDB及Spark 實現(xiàn)保險行業(yè)開門紅秒殺大屏MongoDB及Spark在金融保險行業(yè)技術實踐公司介紹中國太平保險集團有限責任公司于1929年在上海創(chuàng)立,1956年根據國家統(tǒng) 一部署,中國保險、太平保險停辦國內業(yè)務,專營港澳和海外保險業(yè)務。1999 年所有境外國有保險機構劃歸中國保險股份有限公司管理。2000年在港交所上 市,是我國首家在境外上市的保險企業(yè)。2001年以太平品牌在境內復業(yè)。2011 年底列入中央管理,升格為副部級金融央企。2013年完成重組改制和整體上市。2018年7月19日,首次進入世界500強。目前,中國太平總保費超過1600億 元,總資產突破6000億元,管理
2、資產規(guī)模突破1萬億元,已經成為一家擁有60余 萬名內外勤員工、24家子公司和2000余家各級營業(yè)機構的大型跨國金融保險集團,經營范圍涉及中國內地、中國香港、中國澳門、北美、歐洲、大洋洲、東 亞及東南亞等國家和地區(qū),業(yè)務范圍涵蓋壽險、財險、養(yǎng)老保險、再保險、再 保險經紀及保險代理、互聯(lián)網保險、資產管理、證券經紀、金融租賃、不動產 投資、養(yǎng)老醫(yī)療健康產業(yè)投資等領域。太平保險開門紅開門紅特點:統(tǒng)計緯度多秒殺并發(fā)大實時要求高存在的痛點實現(xiàn)思路不足使用觸發(fā)器對原始數(shù)據進行裁剪寫入小表延遲大,無法滿足實時要求,當前聚合計算和ETL的時 間延遲4m對寫入到小表的數(shù)據利用存儲過程進行聚合分析,結果 寫入到聚合
3、表存儲過程中的聚合分析無法進行并發(fā)計算,性能空間有 限聚合表數(shù)據通過shareplex的cdc機制將數(shù)據同步到讀庫統(tǒng)缺乏水平可擴展性Spark + MongoDB應用app消息隊列Spark StreamingMongoDB指標大屏實現(xiàn)思路優(yōu)點不足業(yè)務APP將數(shù)據寫入到消息隊列(建議 采用kafka)統(tǒng)計實時性強,延遲5s對業(yè)務系統(tǒng)有一定的改造,業(yè)務系統(tǒng)的數(shù)據 持久化邏輯受影響,需要將數(shù)據直接寫入消 息隊列通過Spark Streaming消費消息隊列中 的數(shù)據,進行總金額的實時累加,實時 反應統(tǒng)計排名系統(tǒng)水平可擴展性高原始數(shù)據快速寫入MongoDB 聚合結果實時寫入MongoDB系統(tǒng)高可用(
4、high availablitity)分片擴展能力Spark高速比hadoop快100倍易用Java, Scala, Python, R, and SQL.通用流式運算、機器學習、圖計算、SQLSpark Streaming數(shù)據采集:用戶使用流式數(shù)據采集工具將數(shù)據流式且實時地采集并傳輸?shù)酱髷?shù)據消息Pub/Sub系統(tǒng),該系 統(tǒng)將為下游流計算提供源源不斷的事件源去觸發(fā)流式計算任務的運行。流式計算:流數(shù)據作為流計算的觸發(fā)源驅動流計算運行。因此,一個流計算任務必須至少使用一個流數(shù)據 作為數(shù)據源。一批進入的數(shù)據流將直接觸發(fā)下游流計算的一次流式計算處理,并針對但批次流式數(shù)據得出計算 結果。數(shù)據集成:流計算
5、將計算的結果數(shù)據直接寫入目的數(shù)據源,這其中包括多種數(shù)據源,包括數(shù)據存儲系統(tǒng)、 消息投遞系統(tǒng),甚至直接對接業(yè)務規(guī)則告警系統(tǒng)發(fā)出告警信息。不同于批量計算,流計算天生自帶數(shù)據集成模 塊,可以將結果數(shù)據直接寫入到目的數(shù)據源。數(shù)據消費:流計算一旦將結果數(shù)據投遞到目的數(shù)據源后,后續(xù)的數(shù)據消費從系統(tǒng)劃分來說,和流計算已經 完全解耦。用戶可以使用數(shù)據存儲系統(tǒng)訪問數(shù)據,使用消息投遞系統(tǒng)進行信息接收,或者直接使用告警系統(tǒng)進 行告警。數(shù)據庫選型關鍵能力描述RDBMSHDFSMongoDB性能與擴展海量數(shù)據處理能力否是是高效查詢效率是否是性能擴展有限(垂直)水平擴展水平擴展模型靈活度數(shù)據模型變更是否靈 活否N/A是支
6、持結構化、半結構、非機構化數(shù)據有限支持支持支持企業(yè)級支撐完整的企業(yè)級運維標 準及工具是否是Why MongoDB?原始交易數(shù)據(高峰10w消息/秒),有重復,要求能夠快速寫入數(shù)據庫并去重(唯一索引),之后Spark Streaming快速讀出數(shù)據處理展示指標緯度多,單一基于key-value的內存數(shù)據庫無法支撐多條件查詢MongoDB Spark connector,支持雙向讀寫;查詢條件下推,利用MongoDB索引過濾無用數(shù)據, 減少數(shù)據傳輸量MongoDB查詢功能強大(Aggregation/范圍/地理位置/JOIN/Key-value/Graph),可以應付今 后的更多場景實際性能功能虛擬機配置數(shù)量Spark集群CPU 4core RAM 16GB5MongoDB集群CPU 4core RAM 16GB3處理數(shù)據量 batch 4s處理時間(秒)是否有延遲25000.2N/A50000.5N/A200003N/A300004N/A400005延遲1s數(shù)據準確度100%注意
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 高跟鞋銷售心得總結
- 電子電器銷售工作總結
- 2024全新酒店集團資產托管合作協(xié)議范本3篇
- 火箭升空課程設計
- 江蘇省高三語文試卷分類匯編文學類文本閱讀專題
- 幼兒美術小課程設計
- 新課標2022科學解讀心得范文(7篇)
- 2024年一件代發(fā)運動器材代理合同3篇
- 接受單位捐款感謝信(8篇)
- 師范生個人求職信范文
- 旅游學概論最新復習題庫與答案
- 土木工程建筑中混凝土裂縫的施工處理技術畢業(yè)論文
- 水電站調速器系統(tǒng)最權威講義課件
- 膠合板生產工藝
- TROXLER3440核子密度儀
- 課程設計--高位自卸汽車的設計
- 初中數(shù)學八年級上《整式的乘法及因式分解》知識點及經典題型
- 天罡儀表CR40系列數(shù)據集中器用戶手冊
- 威尼斯狂歡節(jié)長笛鋼琴伴奏譜PierreAgricolaGeninC
- 古傳五禽戲內功法詳解(圖)
- 普外科電子病歷模板——腹部閉合性損傷
評論
0/150
提交評論