大數(shù)據(jù)概論 課件 第3、4章 大數(shù)據(jù)技術、大數(shù)據(jù)應用_第1頁
大數(shù)據(jù)概論 課件 第3、4章 大數(shù)據(jù)技術、大數(shù)據(jù)應用_第2頁
大數(shù)據(jù)概論 課件 第3、4章 大數(shù)據(jù)技術、大數(shù)據(jù)應用_第3頁
大數(shù)據(jù)概論 課件 第3、4章 大數(shù)據(jù)技術、大數(shù)據(jù)應用_第4頁
大數(shù)據(jù)概論 課件 第3、4章 大數(shù)據(jù)技術、大數(shù)據(jù)應用_第5頁
已閱讀5頁,還剩111頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

P

A

G

EATACHANGEWORLDBIGDATACHA大數(shù)據(jù)概論STAY

SANE

ANDKEEP

THINKING高等職業(yè)教育科普教育系列教材第三章.大數(shù)據(jù)技術BIGDATAC大數(shù)據(jù)概論高等職業(yè)教育科普教育系列教材第三章大數(shù)據(jù)技術P

A

G

EA

T

A

C

H

A

N

G E

3W

.O R

1L

D大數(shù)據(jù)采集技術BBIGDATAC大數(shù)據(jù)概論高等職業(yè)教育科普教育系列教材第三章大數(shù)據(jù)技術P

A

G

EA

T

A

C H

3A N

.G1E W

.O

1R

LD

大數(shù)據(jù)的來源類型B大數(shù)據(jù)概論Meanare(alsentring"transmittableandstorableinformationbywhichcompperformed"isfirstrecorded1946.Data-processingisfroodatabase)"structuredcollectionofdatainacomputer"yisby1970.3.1大數(shù)據(jù)的采集技術大數(shù)據(jù)的來源根據(jù)場景劃分PG第三章大數(shù)據(jù)技術根據(jù)數(shù)據(jù)的結構結構化數(shù)據(jù)、半結構化數(shù)據(jù)、非結構化數(shù)據(jù)大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.3.1大數(shù)據(jù)采集技術獲取互聯(lián)網(wǎng)的數(shù)據(jù)開放數(shù)據(jù)接口網(wǎng)絡爬蟲3.1.2

獲取互聯(lián)網(wǎng)的數(shù)據(jù)PG第三章大數(shù)據(jù)技術PG大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.3.1大數(shù)據(jù)采集技術獲取物聯(lián)網(wǎng)的數(shù)據(jù)傳感器采集數(shù)據(jù)物聯(lián)網(wǎng)平臺采集數(shù)3.1.3

獲取物聯(lián)網(wǎng)的數(shù)據(jù)第三章大數(shù)據(jù)技術據(jù)PG大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.第三章3.1大數(shù)據(jù)采集技術獲取信息系統(tǒng)的數(shù)據(jù)3.1.4 獲取信息系統(tǒng)數(shù)據(jù)工作場景中需要使用不同的信息系統(tǒng),例如ERP企業(yè)流程管理系統(tǒng)、CRM客戶關系管理系統(tǒng)、OA協(xié)同辦公系統(tǒng)等大數(shù)據(jù)技術BIGDATAC大數(shù)據(jù)概論高等職業(yè)教育科普教育系列教材第三章大數(shù)據(jù)技術P

A

G

EA

T

A

C

H

A

N

3G3E.W

O2R L

大D數(shù)據(jù)預處理技術BBIGDATAC大數(shù)據(jù)概論高等職業(yè)教育科普教育系列教材第三章大數(shù)據(jù)技術P

A

G

EA

T

A

C

H

A

N3G

.E

W2O

.R L

1D數(shù)據(jù)的混雜情況BPG大數(shù)據(jù)概論第三章大數(shù)據(jù)技術3.2大數(shù)據(jù)預處理技術數(shù)據(jù)的混雜情況數(shù)據(jù)采集得到的海量原始數(shù)據(jù)存在著很多混雜情況。以銷售數(shù)據(jù)為例,可能會出現(xiàn)的混雜情況有數(shù)據(jù)格式銷售日期有的用“/”分割,有的用“-”分割。Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.數(shù)據(jù)精度銷售金額有些是四舍五入,有些是精確到小數(shù)點后2位數(shù)據(jù)異常銷售金額異常高或異常低;同一個銷售記錄被重復錄入的各類情況。BIGDATACP

A

G

E大數(shù)據(jù)概論高等職業(yè)教育科普教育系列教材第三章大數(shù)據(jù)技術A

T

A

C

H

A

N

3G3E.W

O2R

.LD

2數(shù)據(jù)預處理標準BPG大數(shù)據(jù)概論3.2大數(shù)據(jù)預處理技術數(shù)據(jù)的預處理由國家市場監(jiān)督管理總局、中國國家標準化管理委員會發(fā)布的《信息技術數(shù)據(jù)質(zhì)量評價指標》(GB/T36344-2018),對數(shù)據(jù)生存周期各個階段提供了數(shù)據(jù)質(zhì)量的評價標準。由中華人民共和國國家質(zhì)量監(jiān)督檢驗檢疫總局、中國國家標準化管理委員會發(fā)布的《數(shù)據(jù)管理能力成熟度評估模型》(GB/T36073-2018),給出了數(shù)據(jù)管理能力成熟度評估模型以及相應的成熟度等級,適用于組織和機構對內(nèi)部數(shù)據(jù)管理能力成熟度進行評估。Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.標數(shù)據(jù)清洗數(shù)據(jù)降維準數(shù)據(jù)集成數(shù)據(jù)平滑數(shù)據(jù)變換數(shù)據(jù)歸一化第三章數(shù)據(jù)規(guī)約數(shù)據(jù)聚合大數(shù)據(jù)技術BIGDATACP

A

G

E大數(shù)據(jù)概論高等職業(yè)教育科普教育系列教材第三章大數(shù)據(jù)技術A

T

A

C

H

A

N G

3E

.W.O2R

.LD

3大數(shù)據(jù)預處理技術B大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.3.2大數(shù)據(jù)預處理技術數(shù)據(jù)預處理技術ETL集成工具:kettle(開源)PG第三章大數(shù)據(jù)技術大數(shù)據(jù)概論PG第三章大數(shù)據(jù)技術Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entry

is

by

1970.3.2大數(shù)據(jù)預處理技術數(shù)據(jù)預處理技術Python:豐富的數(shù)據(jù)處理庫,如pandas、NumPy、SciPy等。R語言:專門用于統(tǒng)計分析的編程語言,擁有眾多的統(tǒng)計分析包。SQL:一種結構化查詢語言,用于管理和處理關系型數(shù)據(jù)庫中的數(shù)據(jù)。Java:可編寫MapReduce程序實現(xiàn)數(shù)據(jù)的預處理、清洗、過濾等操作。MapReduce是Hadoop的基本數(shù)據(jù)處理框架。Scala:可編寫Spark程序,實現(xiàn)數(shù)據(jù)預處理和分析。BIGDATAC大數(shù)據(jù)概論高等職業(yè)教育科普教育系列教材第三章大數(shù)據(jù)技術P

A

G

EA

T

A

C

H

A

N

G E

3W

.O R

3L

D大數(shù)據(jù)存儲技術BBBIGDATAC大數(shù)據(jù)概論高等職業(yè)教育科普教育系列教材第三章大數(shù)據(jù)技術P

A

G

EA

T

A

C

H

A

N G

3E

.W O

3R

L.D1關系型數(shù)據(jù)庫大數(shù)據(jù)概論PG第三章大數(shù)據(jù)技術Meaning

"transmittable

and

storable

information

by

which

compareperformed"isfirstrecorded1946.Data-processingisfro(also

database)

"structured

collection

of

data

in

a

computer"entry

is

by

1970.3.3大數(shù)據(jù)存儲技術關系型數(shù)據(jù)庫1.存儲結構關系型數(shù)據(jù)庫是建立在關系模型基礎上的數(shù)據(jù)庫。關系模型可以簡單理解為二維表格模型,用行和列的形式存儲數(shù)據(jù),每個行代表一條數(shù)據(jù)記錄,而每個列代表一種數(shù)據(jù)類型。這些行和列就組合成了一張表,而多張表就組成了數(shù)據(jù)庫。大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.3.3大數(shù)據(jù)存儲技術關系型數(shù)據(jù)庫客戶信息表PG第三章大數(shù)據(jù)技術訂單明細表大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.3.3大數(shù)據(jù)存儲技術關系型數(shù)據(jù)庫國內(nèi):OceanBase、TiDB.openGauss、達夢2.常見品牌國外:Oracle、MySQL、MicrosoftSQLServerPG第三章大數(shù)據(jù)技術大數(shù)據(jù)概論3.3大數(shù)據(jù)存儲技術關系型數(shù)據(jù)庫3.應用場景OracleDatabase:在金融領域,中國銀行將Oracle作為其主要的關系型數(shù)據(jù),支持銀行的核心業(yè)務系統(tǒng),包括賬戶管理、交易管理等。Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.MicrosoftSQLServer:這是一款功能豐富的關系型數(shù)據(jù)庫,廣泛應用于Windows環(huán)境。MySQL:騰訊使用MySQL作為其主要的關系型數(shù)據(jù)庫,支持騰訊QQ、微信等大型社交網(wǎng)絡平臺的用戶管理、消息管理、游戲數(shù)據(jù)存儲等。PG第三章大數(shù)據(jù)技術BIGDATACP

A

G

E大數(shù)據(jù)概論高等職業(yè)教育科普教育系列教材第三章大數(shù)據(jù)技術A

T

A

C

H

A

N3G

.E

W3O

.R L2D非關系型數(shù)據(jù)庫BPG大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfrolectionofdatainacomputer"(also

database)

"structured

colentry

is

by

1970.第三章3.3大數(shù)據(jù)存儲技術非關⑤

對象存儲系型①文檔存儲數(shù)據(jù)②鍵值存儲庫③列式存儲④圖形存儲1.存儲結構非關系型數(shù)據(jù)庫(NoSQL)的主要特性是不使用關系模型,不遵循關系型數(shù)據(jù)庫的表結構存儲方式。非關系型數(shù)據(jù)庫根據(jù)數(shù)據(jù)存儲結構的不同,也分成不同的類別,以下介紹常見的非關系型數(shù)據(jù)的存儲方式:大數(shù)據(jù)技術PG大數(shù)據(jù)概論eandstorableinformationbywhichcomptrecorded1946.Data-processingisfroturedcollectionofdatainacomputer"Meaning

"transmittablare

performed"

is

firs(also

database)

"strucentry

is

by

1970.第三章3.3大數(shù)據(jù)存儲技術非關系型數(shù)據(jù)庫國外:2.常見品牌國內(nèi):大數(shù)據(jù)技術PG大數(shù)據(jù)概論第三章大數(shù)據(jù)技術務,被廣泛應用于云環(huán)境和大規(guī)模數(shù)據(jù)存儲,。(also

database)

"structured

collection

of

data

in

a

computer"entry

is

by

1970.3.3大數(shù)據(jù)存儲技術非關系型數(shù)據(jù)庫3.應用場景鍵值存儲:Redis被廣泛應用于緩存、會話存儲、隊列等場景。 文檔存儲:MongoDB可以靈活地變更數(shù)據(jù)結構的應用,如內(nèi)容管理系統(tǒng)、日志分析平臺。Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro列式存儲:HBase適用于需要處理海量數(shù)據(jù)、低延遲讀寫、高并發(fā)讀寫、數(shù)據(jù)分析和挖掘以及實時計算和流處理等場景。 圖形存儲:Neo4j的優(yōu)勢在于處理關聯(lián)數(shù)據(jù)上的強大能力,包括ebay電子商務、沃爾瑪內(nèi)部管理、阿迪達斯購物網(wǎng)站等企業(yè)都選擇了Neo4j。對象存儲:AmazonS3是亞馬遜AWS提供的一種對象存儲服BIGDATACP

A

G

E大數(shù)據(jù)概論高等職業(yè)教育科普教育系列教材第三章大數(shù)據(jù)技術A

T

A

C

H

A

N

G E

3W

.O R

3L.D.3分布式數(shù)據(jù)庫B大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.3.3大數(shù)據(jù)存儲技術分布式數(shù)據(jù)庫分布式數(shù)據(jù)庫系統(tǒng)通常通過將數(shù)據(jù)分割成多個部分并在多個節(jié)點,節(jié)點是分布在一個或多個地理位置上的物理服務器,也可以是虛擬機或容器。每個節(jié)點都擁有自己的存儲和計算資源,這種設計模式在解決了傳統(tǒng)單點故障、性能瓶頸等問題的同時,還保證數(shù)據(jù)的一致性和可靠性,并提供了很高的性能和可伸縮性。1.存儲結構PG第三章大數(shù)據(jù)技術大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.3.3大數(shù)據(jù)存儲技術分布式數(shù)據(jù)庫2.常見品牌OceanBase是由螞蟻集團完全自主研發(fā)的企業(yè)級分布式關系數(shù)據(jù)庫,基于分布式架構和通用服務器、實現(xiàn)了金融級可靠性及數(shù)據(jù)一致性,擁有100%的知識產(chǎn)權。PG第三章大數(shù)據(jù)技術TiDB是PingCAP公司自主設計、研發(fā)的開源分布式關系型數(shù)據(jù)庫。大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.3.3大數(shù)據(jù)存儲技術分布式數(shù)據(jù)庫openGauss是一款全面友好開放,攜手伙伴共同打造的企業(yè)級開源關系型數(shù)據(jù)庫。openGauss深度融合華為在數(shù)據(jù)庫領域多年的經(jīng)驗,結合企業(yè)級場景需求,持續(xù)構建競爭力特性。PG第三章大數(shù)據(jù)技術大數(shù)據(jù)概論PG第三章大數(shù)據(jù)技術Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.3.3大數(shù)據(jù)存儲技術分布式數(shù)據(jù)庫3.應用場景阿里云飛天分布式數(shù)據(jù)庫騰訊云TDSQL分布式數(shù)據(jù)庫華為分布式數(shù)據(jù)庫GaussDB京東分布式數(shù)據(jù)庫JIMDBBBIGDATAC大數(shù)據(jù)概論高等職業(yè)教育科普教育系列教材第三章大數(shù)據(jù)技術P

A

G

EA

T

A

C

H

A

N

3G3E.W

O4R L

大D數(shù)據(jù)分析技術BBIGDATAC大數(shù)據(jù)概論高等職業(yè)教育科普教育系列教材第三章大數(shù)據(jù)技術P

A

G

EA

T

A

C

H

A

N

G

E

W

3O R

.L4D4.1數(shù)據(jù)可視化大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.3.4大數(shù)據(jù)分析技術數(shù)據(jù)可視化靜態(tài)可視化:Matplotlib、Seaborn、PlotlyPG第三章大數(shù)據(jù)技術大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.3.4大數(shù)據(jù)分析技術數(shù)據(jù)可視化動態(tài)可視化:Echarts、Highcharts、D3.js、Plotly、BokehPG第三章大數(shù)據(jù)技術大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.3.4大數(shù)據(jù)分析技術數(shù)據(jù)可視化地圖類:百度地圖開放平臺、高德地圖開放平臺,Leaflet、OpenLayersPG第三章大數(shù)據(jù)技術大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.3.4大數(shù)據(jù)分析技術數(shù)據(jù)可視化3D類:Thing.js、Three.js、Babylon.js、A-FramePG第三章大數(shù)據(jù)技術大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.3.4大數(shù)據(jù)分析技術數(shù)據(jù)可視化BI類:Tableau、PowerBI、SAS、IBMCognosAnalyticsPG第三章大數(shù)據(jù)技術ATACHANGEWOR

L

DBBIGDATACP

A

G

E大數(shù)據(jù)概論高等職業(yè)教育科普教育系列教材第三章大數(shù)據(jù)技術3.4.2數(shù)據(jù)挖掘PG大數(shù)據(jù)概論大數(shù)據(jù)技術Meaning

"transmittable

and

storable

information

by

which

compareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entry

is

by

1970.第三章3.4大數(shù)據(jù)分析技術數(shù)據(jù)挖掘數(shù)據(jù)挖掘是從大規(guī)模數(shù)據(jù)中自動發(fā)現(xiàn)、提取、分析和總結出有價值的信息的一種技術。它可以幫助人們發(fā)現(xiàn)大量數(shù)據(jù)中的潛在趨勢和關聯(lián),對數(shù)據(jù)進行分類、聚類、預測和異常檢測等分析,從而提供有價值的信息和洞察力,從而支持決策和策略的制定,提高生產(chǎn)效率和市場競爭力。PG大數(shù)據(jù)概論(also

database)

"structured

collection

of

data

in

a

computer"entry

is

by

1970.第三章3.4大數(shù)據(jù)分析技術數(shù)據(jù)可視化① 分類:通過已有的數(shù)據(jù),進行分類、預測等任務。例如,使用分類算法將郵件分為垃圾郵件和正常郵件,減少用戶收到垃圾郵件的數(shù)量。② 聚類:將大量數(shù)據(jù)分成具有相似特征的小組。例如,通過挖掘用戶的行為數(shù)據(jù)和消費數(shù)據(jù),將用戶分成不同的群體,以便公司能夠更好地理解和滿足用戶的需求。③ 關聯(lián)規(guī)則挖掘:發(fā)現(xiàn)數(shù)據(jù)中的關聯(lián)關系,即兩個或多個變量之間的關聯(lián)。例如,超市可以通過挖掘消費者的購物數(shù)據(jù),找出常一起購買的商品組合,并通過這些關聯(lián)規(guī)則制定促銷活動,Mea提ning高"tr銷ansmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro售量和利潤。④ 時間序列挖掘:發(fā)現(xiàn)時間序列數(shù)據(jù)中的模式、規(guī)律等。例如,可以通過對歷史氣象數(shù)據(jù)的分析,發(fā)現(xiàn)某一地區(qū)某個月份的降雨量出現(xiàn)了明顯的周期性變化,從而可以對該地區(qū)該月份的降雨量進行預測和調(diào)整。⑤ 異常檢測:檢測數(shù)據(jù)中的異常值或者異常模式。例如,通過對信用卡交易數(shù)據(jù)的異常檢測,可以識別出潛在的欺詐行為,從而保障金融機構的利益和消費者的安全。⑥ 文本挖掘:從大量文本數(shù)據(jù)中提取出有用的信息,包括文本分類、情感分析、實體識別等。例如,識別出新聞報道中的主要話題,用于新聞媒體和輿情分析等領域。大數(shù)據(jù)技術ATACHANGEWOR

L

DBBIGDATACP

A

G

E大數(shù)據(jù)概論高等職業(yè)教育科普教育系列教材第三章大數(shù)據(jù)技術3.4.3機器學習大數(shù)據(jù)概論PG第三章大數(shù)據(jù)技術Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.3.4大數(shù)據(jù)分析技術機器學習數(shù)據(jù)挖掘和機器學習都是從數(shù)據(jù)中提取有用信息的方法,但它們的重點略有不同。數(shù)據(jù)挖掘是從大量數(shù)據(jù)中發(fā)現(xiàn)規(guī)律、模式和關聯(lián)性的過程,其目的是發(fā)現(xiàn)數(shù)據(jù)的內(nèi)在結構和特征。機器學習是利用算法讓計算機自動學習數(shù)據(jù)中的規(guī)律和模式,并通過不斷的迭代優(yōu)化來提高預測或決策的準確性。大數(shù)據(jù)概論dstorableinformationbywhichcompcorded1946.Data-processingisfroedcollectionofdatainacomputer"Meaning

"transmittable

anare

performed"

is

first

re(also

database)"structurentry

is

by

1970.3.4大數(shù)據(jù)分析技術數(shù)據(jù)可視化機器學習基礎分類:PG第三章大數(shù)據(jù)技術大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(also

database)

"structured

collection

of

data

in

a

computer"3.4大數(shù)據(jù)分析技術數(shù)據(jù)可視化Python的機器學習庫:Scikit-learn、TensorFlow、Keras、PyTorch等;R語言的機器學習庫:Caret、randomForest、xgboost等;Java的機器學習庫:Weka、deeplearning4j、ApacheSpark等entry;isby1970.基于云的機器學習平臺:AmazonWebServices、GoogleCloudPlatform、MicrosoftAzure等;開源的自動機器學習工具:AutoML、TPOT、H2O.ai等。PG第三章大數(shù)據(jù)技術T

HNSKAATACHANGEWORLDBIGDATACHA高等職業(yè)教育科普教育系列教材大數(shù)據(jù)概論STAY

SANE

ANDKEEP

THINKINGP

A

G

EP

A

G

EATACHANGEWORLDBIGDATACHA大數(shù)據(jù)概論STAY

SANE

ANDKEEP

THINKING高等職業(yè)教育科普教育系列教材第四章.大數(shù)據(jù)應用ATACHANGEWORLDBBIGDATACP

A

G

E大數(shù)據(jù)概論高等職業(yè)教育科普教育系列教材第四章大數(shù)據(jù)應用4.1智慧醫(yī)療我國智慧醫(yī)療建設正朝著標準化、集成化、智能化、移動化、區(qū)域化方向發(fā)展,智慧醫(yī)療已經(jīng)逐漸融入人們的生活。先進的智慧醫(yī)療在線系統(tǒng),可以實現(xiàn)在線預約、健康檔案管理、社區(qū)服務、家庭醫(yī)療、支付清算等功能,大大便利了市民就醫(yī),同時提升了醫(yī)療服務的質(zhì)量和患者滿意度。智慧醫(yī)療通過打造健康檔案區(qū)域醫(yī)療信息平臺,利用最先進的物聯(lián)網(wǎng)技術和大數(shù)據(jù)技術讓患者體驗一站式的醫(yī)療服務。智慧醫(yī)療的核心就是“以患者為中心”,給予患者以全面、專業(yè)、個性化的醫(yī)療體驗。智慧醫(yī)療通過整合各類醫(yī)療信息資源,構建藥品目錄數(shù)據(jù)庫、居民健康檔案數(shù)據(jù)庫、影像數(shù)據(jù)庫(PictureArchivingandCommunicationSystems,PACS)、檢驗數(shù)據(jù)庫(LaboratoryInformationSystem,LIS)、醫(yī)療人員數(shù)據(jù)庫、醫(yī)療設備等衛(wèi)生領域的6大基礎數(shù)據(jù)庫,可以讓醫(yī)生隨時查閱病人的病歷、患史、治療措施和保險細則,隨時隨地快速制定診療方案,也可以讓患者自主選擇更換醫(yī)生或醫(yī)院,患者的轉診信息及病歷可以在任意一家醫(yī)院通過醫(yī)療聯(lián)網(wǎng)方式調(diào)閱。PG大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.4.1.1智慧醫(yī)療大數(shù)據(jù)的概念及應用智慧醫(yī)療大數(shù)據(jù)的概念第四章大數(shù)據(jù)應用區(qū)域化移動化集成化標準化智能化智慧醫(yī)療在智慧醫(yī)療推廣以前,患者每到一個醫(yī)院,就需要在這個醫(yī)院購買新的信息卡和病歷,重復做在其他醫(yī)院已經(jīng)做過的各種檢查。智慧醫(yī)療通過在大數(shù)據(jù)平臺錄入患者電子病歷,實現(xiàn)了不同醫(yī)療機構之間的信息共享。在任何醫(yī)院就醫(yī)時,只要輸入患者身份證號碼,就可以立即獲得患者的所有信息,包括既往病史、檢查結果、治療記錄等,再也不需要在轉診時做重復檢查。住院病案作為電子病歷的典型,可以根據(jù)系統(tǒng)實時獲取。住院病案中包含了病人患病經(jīng)過和治療情況,同時可以對住院過程進行管理,大大提高了醫(yī)院的管理效率。PG大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.4.1.1智慧醫(yī)療大數(shù)據(jù)的概念及應用電子病歷智慧醫(yī)療通過在大數(shù)據(jù)平臺錄入患者電子病歷,實現(xiàn)了不同醫(yī)療機構之間的信息共享。第四章大數(shù)據(jù)應用電子病歷醫(yī)院A醫(yī)院B信息共享人口健康信息平臺可以收集和管理個人健康信息,包括個人基本信息、健康狀況、疾病史、就診記錄等,從而促進健康管理和疾病預防。人口健康信息平臺可以促進醫(yī)療資源協(xié)調(diào)分配,對醫(yī)療資源進行全面的監(jiān)測和管理,統(tǒng)籌安排醫(yī)療資源的分配和調(diào)配,避免醫(yī)療資源的浪費和濫用。以哈爾濱醫(yī)療云項目為例,該項目以打造中國北方智慧醫(yī)療標桿為目標,于2020年6月底完成驗收,全面上線。衛(wèi)生專網(wǎng)覆蓋442家市區(qū)兩級醫(yī)療、衛(wèi)生管理機構;完成市級全民健康信息平臺及18個區(qū)縣(市)虛擬平臺的建設,縱向接入111家醫(yī)院數(shù)據(jù),橫向實現(xiàn)與公衛(wèi)系統(tǒng)、血液系統(tǒng)、計生系統(tǒng)等14項垂直業(yè)務系統(tǒng)數(shù)據(jù)對接,采集了22.1億條數(shù)據(jù),形成了610余份居民電子健康檔案,構建了4大類健康醫(yī)療云應用。PG大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.區(qū)域人口健康管理人口健康信息平臺可以收集和管理個人健康信息,促進健康管理和疾病預防。也可以促進醫(yī)療資源協(xié)調(diào)分配,對醫(yī)療資源進行全面的監(jiān)測和管理,統(tǒng)籌安排醫(yī)療資源的分配和調(diào)配,避免醫(yī)療資源的浪費和濫用。第四章4.1.1智慧醫(yī)療大數(shù)據(jù)的概念及應用哈爾濱市全民健康信息平臺大數(shù)據(jù)應用以東軟醫(yī)療健康大數(shù)據(jù)平臺為例,它由數(shù)據(jù)中臺、AI應用框架和基于大數(shù)據(jù)的智慧應用三大部分組成,通過平臺匯聚各類醫(yī)療健康數(shù)據(jù),形成完整的大數(shù)據(jù)體系,實現(xiàn)基于大數(shù)據(jù)和AI的智慧應用創(chuàng)新,賦能惠民、惠醫(yī)、惠政和惠業(yè)。PG大數(shù)據(jù)概論andstorableinformationbywhichcomprecorded1946.Data-processingisfrouredcollectionofdatainacomputer"Meaning

"transmittableare

performed"

is

first(also

database)

"structentry

is

by

1970.醫(yī)療大數(shù)據(jù)分析平臺醫(yī)療大數(shù)據(jù)分析平臺主要包括管理決策大數(shù)據(jù)應用、健康醫(yī)療臨床和科研大數(shù)據(jù)應用、公共衛(wèi)生大數(shù)據(jù)應用、健康管理大數(shù)據(jù)應用等。第四章4.1.1智慧醫(yī)療大數(shù)據(jù)的概念及應用醫(yī)療大數(shù)據(jù)大屏看板大數(shù)據(jù)應用東軟醫(yī)療健康大數(shù)據(jù)平臺架構通過推進大數(shù)據(jù)在醫(yī)療健康領域的應用,一方面,可以讓決策者多角度、全局性地掌握醫(yī)療機構運營的總體情況,實現(xiàn)醫(yī)院精細化管理;另一方面,能夠對體制改革進行合理的監(jiān)測與評估,使優(yōu)勢資源“下得去”,助力實現(xiàn)分級醫(yī)療效果的科學評估,合理進行資源優(yōu)化配置,更好地推動分級診療落地。大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.總結可以讓決策者多角度、全局性地掌握醫(yī)療機構運營的總體情況,實現(xiàn)醫(yī)院精細化管理能夠對體制改革進行合理的監(jiān)測與評估,更好地推動分級診療落地。4.1.1智慧醫(yī)療大數(shù)據(jù)的概念及應用PG第四章大數(shù)據(jù)應用大數(shù)據(jù)概論4.1.2濟南健康醫(yī)療大數(shù)據(jù)平臺建設與運營案例應用簡介在國家健康醫(yī)療大數(shù)據(jù)應用發(fā)展總體規(guī)劃的“1+5+X”(一個國家數(shù)據(jù)中心,五個區(qū)域中心,若干個應用發(fā)展中心)中,山東省承擔了國家健康醫(yī)療大數(shù)據(jù)北方中心建設任務。制定健康醫(yī)療大數(shù)據(jù)標準基于健康醫(yī)療大數(shù)據(jù)平臺開展數(shù)據(jù)運營與應用服務數(shù)據(jù)運營與應PG用服務第四章大數(shù)據(jù)應用健康醫(yī)療大數(shù)據(jù)平臺建設Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.PG大數(shù)據(jù)概論bleandstorableinformationbywhichcomprstrecorded1946.Data-processingisfroucturedcollectionofdatainacomputer"Meaning

"transmittaare

performed"

is

fi(also

database)

"strentry

is

by

1970.健康醫(yī)療大數(shù)據(jù)平臺建設匯集醫(yī)療相關數(shù)據(jù)、政府數(shù)據(jù)、社會數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù)、環(huán)境學等醫(yī)療相關全量數(shù)據(jù),形成健康醫(yī)療數(shù)據(jù)湖,并對匯聚的健康數(shù)據(jù)進行專項治理打造數(shù)據(jù)計算平臺,結合一碼通主索引連接所有治理后的數(shù)據(jù),根據(jù)應用需求形成分類應用,支持臨床輔助、科研、超級檔案檢索。第四章大數(shù)據(jù)應用4.1.2濟南健康醫(yī)療大數(shù)據(jù)平臺建設與運營案例平臺系統(tǒng)架構PG大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.制定健康醫(yī)療大數(shù)據(jù)標準基于國家衛(wèi)生行業(yè)標準和省級參考規(guī)范,結合濟南實際,濟南市創(chuàng)新制定《濟南市健康醫(yī)療大數(shù)據(jù)目錄》,共計11大類、60個亞目、320個細目,16717個數(shù)據(jù)項。第四章大數(shù)據(jù)應用4.1.2濟南健康醫(yī)療大數(shù)據(jù)平臺建設與運營案例PG大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.數(shù)據(jù)運營與應用服務依托浪潮平臺+生態(tài)模式,打造平臺生態(tài)型業(yè)務架構模式。第四章大數(shù)據(jù)應用4.1.2濟南健康醫(yī)療大數(shù)據(jù)平臺建設與運營案例健康醫(yī)療大數(shù)據(jù)技術及應用服務模式架構PG大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.數(shù)據(jù)運營與應用服務(1)助力政府濟南市基于健康醫(yī)療大數(shù)據(jù)建立的全民健康醫(yī)療大數(shù)據(jù)平臺首頁概覽圖如圖所示。第四章大數(shù)據(jù)應用4.1.2濟南健康醫(yī)療大數(shù)據(jù)平臺建設與運營案例濟南市全民健康醫(yī)療大數(shù)據(jù)平臺首頁概覽圖PG大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.數(shù)據(jù)運營與應用服務(2)服務醫(yī)療平臺面向醫(yī)療機構,對已經(jīng)治理的數(shù)據(jù)進行分類。目前在專病方面已經(jīng)開放了21種專病隊列,常見病200余種,全部病種兩萬六千余種,這為醫(yī)院在臨床路徑研究、醫(yī)藥研究、科學研究等方面提供了堅實基礎。第四章大數(shù)據(jù)應用4.1.2濟南健康醫(yī)療大數(shù)據(jù)平臺建設與運營案例人工智能閱片圖示PG大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.數(shù)據(jù)運營與應用服務(3)實現(xiàn)便民惠民平臺打造愛健康互聯(lián)網(wǎng)服務平臺,為基層居民和患者提供互聯(lián)網(wǎng)一站式服務。第四章大數(shù)據(jù)應用4.1.2濟南健康醫(yī)療大數(shù)據(jù)平臺建設與運營案例全民健康一卡通服務PG大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.4.1.3華西醫(yī)院腫瘤??婆R床科研智能大數(shù)據(jù)平臺案例應用簡介現(xiàn)代醫(yī)學已進行循證時代,基于嚴謹?shù)目茖W研究過程產(chǎn)生的醫(yī)學證據(jù)是優(yōu)化和改良當前醫(yī)療決策的最優(yōu)解之一。第四章大數(shù)據(jù)應用科研智能大數(shù)據(jù)平臺建設科研大數(shù)據(jù)平臺應用成果PG大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.科研智能大數(shù)據(jù)平臺建設華西醫(yī)院通過建設智能大數(shù)據(jù)平臺,完成全周期全維度全模態(tài)病患數(shù)據(jù)采集,實現(xiàn)臨床業(yè)務數(shù)據(jù)向標準化科研數(shù)據(jù)的智能轉化、統(tǒng)一存儲、處理、分析。第四章大數(shù)據(jù)應用4.1.3華西醫(yī)院腫瘤??婆R床科研智能大數(shù)據(jù)平臺案例智能數(shù)據(jù)治理圖PG大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.科研智能大數(shù)據(jù)平臺建設腫瘤??婆R床科研智能大數(shù)據(jù)平臺圍繞特定疾病繼續(xù)建設科研專病數(shù)據(jù)庫的基礎平臺。第四章大數(shù)據(jù)應用4.1.3華西醫(yī)院腫瘤??婆R床科研智能大數(shù)據(jù)平臺案例科研平臺架構圖PG大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.科研大數(shù)據(jù)平臺應用成果智能單病種數(shù)據(jù)庫建設完成后,實現(xiàn)萬量級數(shù)據(jù)AI自動化提取入庫少于1小時,將數(shù)據(jù)提取精度提升至99.3%。第四章大數(shù)據(jù)應用4.1.3華西醫(yī)院腫瘤專科臨床科研智能大數(shù)據(jù)平臺案例ATACHANGEWORLDBBIGDATACP

A

G

E大數(shù)據(jù)概論高等職業(yè)教育科普教育系列教材第四章大數(shù)據(jù)應用4.2智能交通PG大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.4.2.1智能交通概念及應用智能交通概念智能交通是利用信息技術手段,將交通運輸領域的各類數(shù)據(jù)和資源有機整合,實現(xiàn)數(shù)據(jù)的共享、協(xié)同、互通,從而提高交通運輸領域的管理、服務、安全、效率和創(chuàng)新等方面的水平。第四章大數(shù)據(jù)應用共享協(xié)同互通PG大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entry

is

by

1970.智能交通應用場景第四章大數(shù)據(jù)應用4.2.1智能交通概念及應用交通擁堵預測和優(yōu)化通過大數(shù)據(jù)分析交通狀況,對城市交通擁堵情況進行預測,并提出優(yōu)化措施,以減少擁堵情況的發(fā)生和影響。智能交通信號控制通過大數(shù)據(jù)技術實現(xiàn)交通信號的智能控制,根據(jù)交通狀況進行實時調(diào)整,以提高交通的通行效率和安全性。車輛管理和調(diào)度通過大數(shù)據(jù)技術實現(xiàn)對公共交通和物流車輛的管理和調(diào)度,以提高公共交通和物流運輸?shù)男屎唾|(zhì)量。交通安全預警和監(jiān)控通過大數(shù)據(jù)分析交通事故和違法行為等數(shù)據(jù),實現(xiàn)交通安全預警和監(jiān)控,幫助交警部門及時發(fā)現(xiàn)和處置交通安全隱患。交通信息服務通過大數(shù)據(jù)技術提供實時的交通信息服務,包括路況信息、公共交通信息、停車位信息等,以便人們更好地規(guī)劃出行路線,避免交通擁堵。智能交通應用場景PG大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.應用案例以湖南省長益高速公路擴容工程中高速公路大數(shù)據(jù)平臺為例。第四章大數(shù)據(jù)應用4.2.1智能交通概念及應用長益高速公路大數(shù)據(jù)平臺架構大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.總結智能交通可以利用城市實時交通信息、社交網(wǎng)絡和天氣數(shù)據(jù)來優(yōu)化最新的交通情況,融合了物聯(lián)網(wǎng)、大數(shù)據(jù)和云計算技術。4.2.1智能交通概念及應用PG第四章大數(shù)據(jù)應用大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.4.2.2江蘇交通運輸規(guī)劃大數(shù)據(jù)應用案例應用簡介近年來,江蘇省交通信息化建設的穩(wěn)步推進,目前已匯聚了覆蓋公、鐵、水、空、手機信令等多領域行業(yè)內(nèi)外多源交通數(shù)據(jù)資源。以接下來三個目錄來分別介紹。區(qū)域交通多源數(shù)據(jù)預處理PG第四章大數(shù)據(jù)應用區(qū)域交通算法與模型構建基于場景應用的大數(shù)據(jù)綜合決策平臺搭建大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.區(qū)域交通多源數(shù)據(jù)預處理本成果重點針對多源、異構、復雜的公路、鐵路、水運、航空、手機信令等各類交通數(shù)據(jù),形成了大數(shù)據(jù)清洗、數(shù)據(jù)融合、分布式高效計算等大數(shù)據(jù)預處理技術體系。4.2.2江蘇交通運輸規(guī)劃大數(shù)據(jù)應用案例PG第四章大數(shù)據(jù)應用高速公路數(shù)據(jù)預處理PG大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.區(qū)域交通算法與模型構建一是構建了交通出行特征全息感知、交通樞紐服務評測、全方式全鏈條出行軌跡追蹤等大數(shù)據(jù)算法模型。二是創(chuàng)新研究了基于多源數(shù)據(jù)的區(qū)域多模式、多層次交通模型,實現(xiàn)了多種運輸方式的一體化建模。第四章大數(shù)據(jù)應用4.2.2江蘇交通運輸規(guī)劃大數(shù)據(jù)應用案例大數(shù)據(jù)模型建立流程PG大數(shù)據(jù)概論bleandstorableinformationbywhichcompirstrecorded1946.Data-processingisfroructuredcollectionofdatainacomputer"Meaning

"transmittaare

performed"

is

f(also

database)

"stentry

is

by

1970.大數(shù)據(jù)綜合決策平臺建立了全方式全覆蓋的綜合交通大數(shù)據(jù)分析及仿真系統(tǒng)。第四章大數(shù)據(jù)應用4.2.2江蘇交通運輸規(guī)劃大數(shù)據(jù)應用案例中設高速公路大數(shù)據(jù)看板PG大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.4.2.3廣西交通運輸大數(shù)據(jù)資源管控平臺案例面對廣西交通運輸行業(yè)信息孤島、數(shù)據(jù)互聯(lián)互通不足的問題,本案例主要打造廣西交通運輸行業(yè)大數(shù)據(jù)資源管控基礎平臺,研究交通運輸數(shù)據(jù)資源管控的一系列關鍵技術,應 覆蓋數(shù)據(jù)資源集成采集、清洗轉換、物理存用 儲、邏輯存儲、質(zhì)量與安全管控、服務管控、簡介 數(shù)據(jù)可視化與分析挖掘等全流程提升,為打造行業(yè)數(shù)據(jù)資源池實現(xiàn)橫縱向數(shù)據(jù)共享交換,推動數(shù)據(jù)要素流通應用。第四章廣西交通運輸大數(shù)據(jù)資源管控平臺大數(shù)據(jù)應用大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.平臺技術內(nèi)容及創(chuàng)新點(1)平臺層面平臺支持多源異構數(shù)據(jù)采集、存儲、計算、共享、安全保障,搭建業(yè)內(nèi)主流Hadoop生態(tài)大數(shù)據(jù)平臺,涵蓋海量數(shù)據(jù)存儲、離線與實時處理、冷熱訪問等主要組件;打造高可用ETL工具,實現(xiàn)交通運輸多源異構數(shù)據(jù)的采集,同時滿足離線分析、準實時、實時等多類數(shù)據(jù)采集場景;打造共享管理、交換通道與節(jié)點管理基礎平臺,配備數(shù)據(jù)分級、內(nèi)容加密、傳輸安全驗證等安全保障技術,確保數(shù)據(jù)共享交換的完整性、有效性、及時性和安全性。4.2.3廣西交通運輸大數(shù)據(jù)資源管控平臺案例元數(shù)據(jù)管理系統(tǒng)PG第四章大數(shù)據(jù)應用大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.平臺技術內(nèi)容及創(chuàng)新點(2)數(shù)據(jù)層面對數(shù)據(jù)全生命周期、全流程開展標準化管理,推動數(shù)據(jù)治理,提升數(shù)據(jù)質(zhì)量,有力支撐數(shù)據(jù)共享交換能力開放。初步確立數(shù)據(jù)采集、存儲、共享交換、數(shù)據(jù)治理等技術規(guī)范與指南;以“TOGAF”方法架構為指引,以交通運輸大數(shù)據(jù)應用為導向,結合范式、維度兩種建模理論,構建綜合交通全域數(shù)倉模型;形成標準管理、元數(shù)據(jù)管理、數(shù)據(jù)質(zhì)量管理架構,摸清全域數(shù)據(jù)脈絡,統(tǒng)一標準,切實提升數(shù)據(jù)質(zhì)量。4.2.3廣西交通運輸大數(shù)據(jù)資源管控平臺案例元數(shù)據(jù)管理系統(tǒng)PG第四章大數(shù)據(jù)應用大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.平臺技術內(nèi)容及創(chuàng)新點(3)應用層面實現(xiàn)應用的靈活部署與個性化開發(fā),開展數(shù)據(jù)的跨層次創(chuàng)新應用探索。在基礎技術架構上,采用微服務架構,便于應用的靈活部署與橫向擴展;搭建便捷化的數(shù)據(jù)統(tǒng)計分析組件,實現(xiàn)對多源異構綜合交通數(shù)據(jù)的匯聚統(tǒng)計,實現(xiàn)數(shù)據(jù)融合分析應用;建設基于GIS一張圖的跨平臺可視化技術,將數(shù)據(jù)分析應用成果靈活、快速展示。4.2.3廣西交通運輸大數(shù)據(jù)資源管控平臺案例元數(shù)據(jù)管理系統(tǒng)PG第四章大數(shù)據(jù)應用大數(shù)據(jù)概論PG第四章大數(shù)據(jù)應用entry

is

by

1970.平臺應用成果(1)初步完成重點系統(tǒng)數(shù)據(jù)采集匯聚截至2020年7月16日,已完成廣西交通運輸行業(yè)管理部門數(shù)據(jù)采集匯聚共1.738TB,其中結構化基礎數(shù)據(jù)1160.3GB,含47.33億條記錄、2166張表、26553個字段;非結構化數(shù)據(jù)619.7GB,含GIS數(shù)據(jù)520.8GB,發(fā)布了76個地圖服務、410個圖層信息服務,圖片數(shù)據(jù)98.9GB,共654872張圖片。完成了公路基礎數(shù)據(jù)、車輛基礎數(shù)據(jù)、道路附屬設施數(shù)據(jù)、橋梁基礎數(shù)據(jù)、高速公路基礎數(shù)據(jù)、高速計重收費數(shù)據(jù)、船舶數(shù)據(jù)等60余個數(shù)據(jù)專題數(shù)據(jù)的整理。通過建模整理,構建了涵蓋交通Mean5ing大"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"行業(yè)域、11個對象域、10個職能事務域的倉庫層;初步梳理了相對統(tǒng)一的、通用的、完整的、準確的5大對象主數(shù)據(jù),包括人員、業(yè)戶、車輛、船舶、公路。平臺共有5個主題資源共2040條目,其中基礎庫319個表、業(yè)務庫362個表、主題庫955個表,感知庫6個表,元數(shù)據(jù)庫398個表。4.2.3廣西交通運輸大數(shù)據(jù)資源管控平臺案例大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.應用成果(2)對交通運輸行業(yè)數(shù)據(jù)應用提供了支撐在數(shù)據(jù)可視化展示方面,依托云數(shù)據(jù)中心打造的數(shù)據(jù)可視化萬花筒平臺,實現(xiàn)交通大數(shù)據(jù)的可見可感,幫助管理人員全面感知基礎設施、路網(wǎng)運行規(guī)律與交通態(tài)勢,并實現(xiàn)可視化部署,為交通資產(chǎn)精細化管理提供多維度數(shù)據(jù)呈現(xiàn)能力。聯(lián)合高德地圖、航班管家、高鐵管家、盛威時代等第三方公司,結合GIS圖層4.2.3廣西交通運輸大數(shù)據(jù)資源管控平臺案例信息,建成涵蓋云中心數(shù)據(jù)資源展示、綜PG第四章大數(shù)據(jù)應用廣西交通運輸云數(shù)據(jù)中心面板合交通、規(guī)劃建設、路網(wǎng)監(jiān)測、安全應急、節(jié)能環(huán)保、公路養(yǎng)護、交通物流、安全態(tài)

勢等多個主題數(shù)據(jù)展示與多維交互大屏。

廣西交通運輸云數(shù)據(jù)中心面板如圖所示。大數(shù)據(jù)概論Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"entryisby1970.應用成果(3)打造了廣西交通運輸數(shù)據(jù)資統(tǒng)一管控標準規(guī)范體系依據(jù)廣西交通運輸云數(shù)據(jù)中心、廣西交通運輸大數(shù)據(jù)資源管控平臺的建設實踐工作,已打造成套適用于廣西交通運輸數(shù)據(jù)共享交換的標準規(guī)范。扎實保障數(shù)據(jù)融通對接,破除壁壘,提升數(shù)據(jù)流通效率。共享交4.2.3廣西交通運輸大數(shù)據(jù)資源管控平臺案例換標準體系建設內(nèi)容包括:數(shù)據(jù)信息資源標準、數(shù)據(jù)信息采集標準、數(shù)據(jù)信息共享PG第四章大數(shù)據(jù)應用廣西交通運輸云數(shù)據(jù)中心面板標準、數(shù)據(jù)信息交互標準、數(shù)據(jù)質(zhì)量稽核標準、通用基礎標準、配套支撐標準等。ATACHANGEWORLDBBIGDATACP

A

G

E大數(shù)據(jù)概論高等職業(yè)教育科普教育系列教材第四章大數(shù)據(jù)應用4.3智慧教育大數(shù)據(jù)概論4.3.1智慧教育大數(shù)據(jù)的概念及應用智慧教育大數(shù)據(jù)概念隨著互聯(lián)網(wǎng)和信息技術的快速發(fā)展,大數(shù)據(jù)技術在教育領域中的應用也越來越廣泛。個性化教學通過大數(shù)據(jù)分析學生的學習情況、學習習慣、知識點掌握情況等數(shù)據(jù),可以為每個學生量身定制個性化的教學計劃。Meaning"transmittableandstorableinformationbywhichcompareperformed"isfirstrecorded1946.Data-processingisfro(alsodatabase)"structuredcollectionofdatainacomputer"智能輔助教學通過人工智能技術,可以開發(fā)出各種智能輔助ent教ry學is工by具197,0.如智能教學軟件、智能作業(yè)系統(tǒng)等,提供給學生和教師使用。教育資源共享大數(shù)據(jù)可以將全國各地的教育資源整合到一起,形成一個龐大的教育資源庫,供全國各地的學生和教師使用。學生管理通過大數(shù)據(jù)分析學生的學習情況、行為習慣等數(shù)據(jù),

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論