下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、醫(yī)療大數(shù)據(jù)搜索系統(tǒng)的建設(shè)與應(yīng)用摘要:醫(yī)院信息化的建設(shè)過程中,各個系統(tǒng)圍繞業(yè)務(wù)應(yīng)用分批分期建立,逐步 覆蓋業(yè)務(wù)全流程的同時,積累了大量醫(yī)療數(shù)據(jù),這些數(shù)據(jù)均具有多源異構(gòu)、分布 式、碎片化等特點。為有效整合分散于各獨立系統(tǒng)中的數(shù)據(jù),并利用這些數(shù)據(jù)更 好地為臨床科研服務(wù),以滿足日益增長的臨床科研數(shù)據(jù)服務(wù)需求。本文對醫(yī)療大 數(shù)據(jù)搜索系統(tǒng)的建設(shè)與應(yīng)用進行探討。關(guān)鍵詞:醫(yī)療大數(shù)據(jù);搜索系統(tǒng);建設(shè)應(yīng)用1功能實現(xiàn)1.1科研數(shù)據(jù)中心科研數(shù)據(jù)中心按照人數(shù)和人次維度建立索引以滿足不同科研的查詢需求,并 以ElasticSearch專用格式建立索引文檔。索引文檔設(shè)計時需保留數(shù)據(jù)間的業(yè)務(wù)關(guān) 系,這不僅可實現(xiàn)搜索內(nèi)容的秒級
2、呈現(xiàn),還支持組合、多級條件查詢。另外索引 項目的建立也結(jié)合了臨床業(yè)務(wù)常用查詢需求,確保符合用戶科研搜索使用習慣。 1.2數(shù)據(jù)搜索及導出在對數(shù)據(jù)庫存儲結(jié)構(gòu)非常熟悉的情況下,基于傳統(tǒng)關(guān)系型數(shù)據(jù)庫的復(fù)雜檢索 可能需要耗費幾個甚至十幾個小時。本文提出的醫(yī)療大數(shù)據(jù)搜索系統(tǒng)通過大數(shù)據(jù) 搜索引擎技術(shù),可實現(xiàn)互聯(lián)網(wǎng)的快速交互響應(yīng),支持用戶對搜索內(nèi)容的秒級呈現(xiàn), 同時還結(jié)合了臨床業(yè)務(wù)建立常用查詢、導出項目,方便醫(yī)生的快速學習和使用。 1.3數(shù)據(jù)管理及隱私保護考慮到醫(yī)療數(shù)據(jù)的患者隱私保護與保留數(shù)據(jù)的研究規(guī)律,在數(shù)據(jù)脫敏設(shè)計上 去除單一粗暴的隱私數(shù)據(jù)替換功能,采用當前主流的脫敏技術(shù),提供多種脫敏方 式,包括全部替換
3、、局部替換、日期偏移、數(shù)據(jù)映射、截斷、遮罩、數(shù)值取整和 自動編號等。另外,基于科研機構(gòu)對數(shù)據(jù)的審計需求,系統(tǒng)對用戶導出的查詢數(shù) 據(jù)進行副本留痕,并對留痕文件進行加密處理,降低服務(wù)器被攻擊后數(shù)據(jù)泄露的 風險。1.4醫(yī)學文本后結(jié)構(gòu)化處理除眾多的結(jié)構(gòu)化數(shù)據(jù)外,醫(yī)學文本類數(shù)據(jù)(如患者的現(xiàn)病史、既往史、病程 記錄、影像學報告等)也含有十分重要的信息。文本后結(jié)構(gòu)化處理結(jié)合了 NLP、 語義語法規(guī)則庫等人工智能技術(shù),能夠?qū)⑨t(yī)學文本中的信息進行結(jié)構(gòu)化提取,方 便醫(yī)生利用。由于病種特點和個人書寫習慣等問題,結(jié)構(gòu)化的算法需要不斷學習 以達到更高的準確率。為提高用戶科研效率,減少結(jié)構(gòu)化數(shù)據(jù)的迭代周期,系統(tǒng) 提供可視
4、的后結(jié)構(gòu)化配置界面和實時結(jié)構(gòu)化應(yīng)用程序編程接口(applicationprogramminginterface,API),保證調(diào)整規(guī)則及算法后可及時看到效 果。1.5統(tǒng)計分析功能在臨床醫(yī)生的科研工作中通過統(tǒng)計分析的方法挖掘臨床數(shù)據(jù)中的規(guī)律是一個 必不可少的環(huán)節(jié)。目前,臨床醫(yī)生大多將數(shù)據(jù)導出后,使用通用的統(tǒng)計分析軟件 進行數(shù)據(jù)分析。但這種方法存在幾個問題:(1)導出數(shù)據(jù)的安全性較難保證;(2)通用的統(tǒng)計分析軟件功能強大但操 作復(fù)雜,對使用者的統(tǒng)計學知識要求較高;(3)部分功能未針對醫(yī)療行業(yè)進行 細化。因此,系統(tǒng)在主流的R語言算法基礎(chǔ)上構(gòu)建了專業(yè)的統(tǒng)計分析工具,通過 瀏覽器端在線分析、增加智能化推
5、薦算法功能等方式解決上述問題。同時,系統(tǒng) 不僅提供了數(shù)據(jù)預(yù)處理功能,還提供了對研究變量可根據(jù)醫(yī)學統(tǒng)計學方法進行缺 失值分析填補、離散化處理等功能,為數(shù)據(jù)分析的全流程提供幫助。2應(yīng)用效果2.1數(shù)據(jù)規(guī)模科研數(shù)據(jù)中心包括院內(nèi)自信息化以來的存量數(shù)據(jù),收錄有效就診患者 31748245人次,其中門診就診30849299人次,住院就診898946人次,詳細數(shù)據(jù) 時間周期如圖1所示。據(jù)統(tǒng)計,科研數(shù)據(jù)中心已提供了 41017個科研變量,共計 9億多條數(shù)據(jù)。同時,數(shù)據(jù)中心支持以增量方式接入院內(nèi)新產(chǎn)生的業(yè)務(wù)數(shù)據(jù),提 供實時的數(shù)據(jù)利用服務(wù)能力。圖1科研數(shù)據(jù)中心數(shù)據(jù)時間周期2.2科研查詢服務(wù)目前,醫(yī)療大數(shù)據(jù)搜索系統(tǒng)已
6、為婦科、腎內(nèi)科、耳鼻喉科、肝病科、血液科、風濕免疫 科等十幾個科室的科研課題提供了數(shù)據(jù)查詢服務(wù)。醫(yī)療大數(shù)據(jù)搜索系統(tǒng)改變了跨系統(tǒng)查詢耗 費時間長的問題,實現(xiàn)了醫(yī)生對于權(quán)限內(nèi)的數(shù)據(jù)自行創(chuàng)建、查詢,秒級顯示查詢結(jié)果,且與 CDR進行集成以輔助醫(yī)生對患者歷次就診結(jié)果進行查看與分析等功能。2.3數(shù)據(jù)安全保障按照醫(yī)院管理流程對檢索條件進行逐級審批管理,保證了數(shù)據(jù)安全。審批時可顯示審批 履歷、標識檢索條件和結(jié)果涉及的敏感項,并設(shè)置過期時間。醫(yī)療大數(shù)據(jù)搜索系統(tǒng)參考 HIPAA法案定義的18項身份識別信息進行數(shù)據(jù)脫敏設(shè)置,并根據(jù)醫(yī)院自身情況設(shè)置隱私患者 及隱私病區(qū)。2.4提高運行效率醫(yī)療大數(shù)據(jù)搜索系統(tǒng)采用醫(yī)學N
7、LP和機器學習技術(shù)處理通用后結(jié)構(gòu)化變量30個、??坪?結(jié)構(gòu)化歸一變量44個,提供了醫(yī)生可設(shè)置的后結(jié)構(gòu)化配置界面,實現(xiàn)了醫(yī)生修改規(guī)則后可 實時通過系統(tǒng)看到后結(jié)構(gòu)化的效果。通過提高后結(jié)構(gòu)化效率,縮短了醫(yī)生數(shù)據(jù)分析時間,進 而提高了科研效率。2.5數(shù)據(jù)統(tǒng)計分析系統(tǒng)基于主流的R語言統(tǒng)計分析工具包構(gòu)建統(tǒng)計分析方法庫,保證了結(jié)果的準確性;聚 焦于醫(yī)療常用的分析方法(如各類假設(shè)檢驗、生存分析等)提高了行業(yè)的專業(yè)度;將數(shù)據(jù)查 詢結(jié)果與統(tǒng)計分析集成,保證了數(shù)據(jù)的保密性和安全性;納入了智能分析模塊,可以根據(jù)數(shù) 據(jù)的類型(離散型、連續(xù)型)、分布情況(是否正態(tài))等幫助用戶推薦分析方法,提升了系 統(tǒng)的易用性。3討論醫(yī)療
8、大數(shù)據(jù)搜索系統(tǒng)有效整合了分散于各獨立系統(tǒng)間的數(shù)據(jù),提高了臨床科研數(shù)據(jù)查詢 的質(zhì)量和效率。但其建設(shè)仍處于摸索過程中,需要反思與持續(xù)改進。3.1產(chǎn)品選型目前,醫(yī)院尚缺乏自主研發(fā)能力,這就必然涉及產(chǎn)品選型。傳統(tǒng)HIT公司雖熟悉醫(yī)院的 業(yè)務(wù)場景、工作流程和醫(yī)療業(yè)務(wù)系統(tǒng)架構(gòu),在系統(tǒng)的對接方面具有一定的優(yōu)勢。但大數(shù)據(jù)往 往僅是傳統(tǒng)HIT公司的方向之一,因此在技術(shù)更新、人才吸納、市場推廣等方面很難有突破。 而大數(shù)據(jù)公司由于其應(yīng)用場景的不斷拓展、技術(shù)研發(fā)的深入,在團隊、人才和市場占有率方 面有顯著優(yōu)勢。但大數(shù)據(jù)公司對醫(yī)院業(yè)務(wù)了解較少,切入時間可能較長。因此,醫(yī)院在產(chǎn)品 選型時,要結(jié)合實際,兼顧近期、遠期目標,
9、選擇適合的產(chǎn)品。3.2適度原則大數(shù)據(jù)搜索平臺的建設(shè)勢必涉及對前端系統(tǒng)的改造。就電子病歷系統(tǒng)而言:一方面,需 要對病歷模板進行標準化改造,規(guī)范數(shù)據(jù)來源;另一方面,不能限制醫(yī)生的思路,保留其自 由發(fā)揮的空間,病程記錄等自由文本的結(jié)構(gòu)化用后結(jié)構(gòu)化方法來實現(xiàn)。因此,需要把握好適 度原則。3.3數(shù)據(jù)安全在系統(tǒng)的建設(shè)和實施過程中,要確保數(shù)據(jù)的安全,不被外界竊取和篡改,不予非授權(quán)方 使用。因此,亟須建立相應(yīng)的管理制度,采用數(shù)據(jù)加密技術(shù)和數(shù)據(jù)訪問授權(quán)機制等方法,避 免“一鍋端”,保障數(shù)據(jù)的安全性。3.4患者隱私應(yīng)建立規(guī)范的數(shù)據(jù)查詢流程,保證各環(huán)節(jié)正常、有序地運轉(zhuǎn),使數(shù)據(jù)利用真正落地。同 時,在數(shù)據(jù)利用過程中,
10、要妥善處理好患者隱私,嚴格按照倫理委員會的倫理批件提供相應(yīng) 的數(shù)據(jù),保護患者的人格和尊嚴。3.5人才培養(yǎng)由于大數(shù)據(jù)的迅猛發(fā)展,需要一批了解醫(yī)療業(yè)務(wù)和信息技術(shù)的復(fù)合型人才。麥肯錫研究 報告指出,美國等信息發(fā)達的國家中大數(shù)據(jù)領(lǐng)域相關(guān)人才的缺失于2018年達到1419萬。 而我國的大數(shù)據(jù)發(fā)展才剛剛起步,培養(yǎng)一批雙料”復(fù)合型人才是當前和今后很長一段時間內(nèi) 生物醫(yī)學大數(shù)據(jù)發(fā)展的重要工作。結(jié)束語:醫(yī)療大數(shù)據(jù)搜索系統(tǒng)改變了傳統(tǒng)人工翻閱紙質(zhì)病歷的模式,具有省時、省力、高效的優(yōu) 勢,實現(xiàn)了從既定思維到創(chuàng)新性思維的轉(zhuǎn)變,可從海量原始數(shù)據(jù)中發(fā)現(xiàn)規(guī)律,為臨床科研提 供了更多思路,對回顧性研究和前瞻性探索都具有重大意義。但是,利用醫(yī)療大數(shù)據(jù)搜索系 統(tǒng)為臨床科研提供服務(wù)還處于起步階段,缺乏成熟的產(chǎn)品與案例,建設(shè)過程必然是逐步探索 的過程,需要臨床科研人員的積極配合和深度參與,并且在使用過程中不斷積累經(jīng)驗完善系 統(tǒng),以吸引更多的臨床科研人員參與,形成良性循環(huán)并
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 鐵路站場樞紐課程設(shè)計
- 黑客與攻擊技術(shù)課程設(shè)計
- 鉆井工程課程設(shè)計唐海
- 造價全過程課程設(shè)計
- 足球選項課課程設(shè)計研究
- 2025至2030年中國軸承油動輪數(shù)據(jù)監(jiān)測研究報告
- 2025技術(shù)轉(zhuǎn)讓合同書范文
- 2025年沖浪運動合同
- 二人合伙投資生意合同
- 安置專業(yè)軍人聘用合同
- 使用錯誤評估報告(可用性工程)模版
- 公司章程(二個股東模板)
- GB/T 19889.7-2005聲學建筑和建筑構(gòu)件隔聲測量第7部分:樓板撞擊聲隔聲的現(xiàn)場測量
- 世界奧林匹克數(shù)學競賽6年級試題
- 藥用植物學-課件
- 文化差異與跨文化交際課件(完整版)
- 國貨彩瞳美妝化消費趨勢洞察報告
- 云南省就業(yè)創(chuàng)業(yè)失業(yè)登記申請表
- UL_標準(1026)家用電器中文版本
- 國網(wǎng)三個項目部標準化手冊(課堂PPT)
- 快速了解陌生行業(yè)的方法論及示例PPT課件
評論
0/150
提交評論