




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第17講 Medical IR醫(yī)療信息檢索2017/10/091提綱 Medical IR簡介 TREC CDS 任務(wù)簡介 常用CDS方法介紹 DNRM for CDS2提綱 Medical IR簡介 TREC CDS 任務(wù)簡介 常用CDS方法介紹 DNRM for CDS3Medical IR簡介有很多時候,為了更加準確地做出醫(yī)療決策,醫(yī)生可能需要查閱一些相關(guān)的醫(yī)療文獻??紤]到現(xiàn)有醫(yī)療文獻的數(shù)量以及其增長的速度,快速而準確地定位所需要的醫(yī)療文獻變得非常重要。Medical IR的目標就是根據(jù)醫(yī)生的信息需求(如電子病歷),從海量醫(yī)療文獻中找到盡可能多的相關(guān)文獻。與一般的IR任務(wù)(如Web檢索)
2、相比,Medical IR任務(wù)的查詢和文檔長度都相對長很多;Medical IR任務(wù)的查詢和文檔都較多地包含醫(yī)療領(lǐng)域特定的詞匯和概念。4提綱 Medical IR簡介 TREC CDS 任務(wù)簡介 常用CDS方法介紹 DNRM for CDS5TREC CDS 任務(wù)文檔集:從免費的在線醫(yī)療文獻倉庫PubMed Central (PMC) 獲取,共733138篇文檔,是PMC在2014.1.21的快照。查詢:根據(jù)不同的需求類型分為三類 (Diagnosis, Test, Treatment),每個查詢有如下兩個:Description:比較完整的描述Summary:簡化的描述,去掉了一些不相關(guān)的信
3、息7提綱 Medical IR簡介 TREC CDS 任務(wù)簡介 常用CDS方法介紹 DNRM for CDS8常用CDS方法考慮查詢類型信息:首先訓(xùn)練分類器 (如對Diagnosis和非Diagnosis分類),然后對初始檢索結(jié)果進行分類,根據(jù)分類得分有一個排序,該排序可以與初始檢索結(jié)果排序進行fusion。Re-ranking:基于learning-to-rank:用BM25、PL2和BB2等模型評分作為feature,用random forest學(xué)習(xí)pointwise排序模型,或者用RankSVM學(xué)習(xí)pairwise排序模型,再用學(xué)習(xí)到的模型對初始檢索結(jié)果重排基于position:根據(jù)位置
4、信息為文檔計算一個權(quán)重,并與初始評分求和,再對初始檢索結(jié)果進行重排序引入語義信息:通過計算查詢與文檔之間的語義相似度評分,然后將該評分與初始檢索評分進行插值,最后對初始檢索結(jié)果進行重排10提綱 Medical IR簡介 TREC CDS 任務(wù)簡介 常用CDS方法介紹 DNRM for CDS11基于DNN的方法-DNRM考慮到查詢包含的信息較少,直接計算查詢與文檔之間的相似度不能達到很好的效果;現(xiàn)有的基于DNN的比較有效的檢索模型都需要計算查詢與文檔的單詞-單詞相似度矩陣,計算復(fù)雜度較高;并且不考慮反饋信息,檢索效果也會受到一定影響;DNRM引入了兩種相似度特征,一是查詢詞與文檔的相似度,二是
5、偽相關(guān)反饋文檔之間的相似度,然后通過多層感知機 (MLP) 學(xué)習(xí)一個評分,一定程度上克服了上述的兩個問題。12轉(zhuǎn)化為一個相似度計算的問題哪個與“標準答案”更近似?DNRM基本思想將文檔評分轉(zhuǎn)化為一個與“標準答案”計算相似度問題D2Q(文檔-查詢)相似度是一種弱匹配信號相對于文檔,查詢太短,覆蓋的信息太少文檔間相似度是一種“軟匹配( soft matching)”,考慮了文檔的所有內(nèi)容事實上一篇文檔是否相關(guān)是由其內(nèi)容決定的,而不是是否包含查詢關(guān)鍵字“標準答案”由K個初始排名靠前的文檔組成將待評分文檔與這K個文檔的相似度作為K維特征輸入一個前饋網(wǎng)絡(luò)前饋網(wǎng)絡(luò)輸出最終文檔評分Yanhua Ran et
6、 al. A Document-based Neural Relevance Model for Effective Clinical Decision Support. BIBM 2017. To appear.DNRM for CDS 實驗設(shè)置與baselines的比較:BM25,SEM-QD,DRMMDNRM模型多個變種的比較:只使用D2Q評分 (DNRMQ);只使用D2D評分 (DNRMD);D2D評分且與BM25插值 (DNRMD-);使用D2Q與D2D評分且與BM25插值 (DNRMDQ-)DNRM for CDS DNRM for CDS 實驗結(jié)果實驗結(jié)論:在大部分情況下, DN
7、RMD-以及DNRMDQ - 比baselines效果要好;對于長查詢 (Description) 而言,總體上DNRMDQ-要比DNRMD-效果要好。DNRM模型能夠取得優(yōu)于Best TREC Run的結(jié)果參考文獻Simpson M S, Voorhees E M, Hersh W. Overview of the trec 2014 clinical decision support trackR. LISTER HILL NATIONAL CENTER FOR BIOMEDICAL COMMUNICATIONS BETHESDA MD, 2014.Roberts K, Simpson M
8、 S, Voorhees E M, et al. Overview of the TREC 2015 Clinical Decision Support TrackC/TREC. 2015.Yang C, He B. A novel semantics-based approach to medical literature searchC/Bioinformatics and Biomedicine (BIBM), 2016 IEEE International Conference on. IEEE, 2016: 1616-1623.Balaneshin-Kordan S, Kotov A
9、, Xisto R. WSU-IR at TREC 2015 clinical decision support track: Joint weighting of explicit and latent medical query concepts from diverse sourcesR. Wayne State University Detroit United States, 2015.Song Y, He Y, Hu Q, et al. Ecnu at 2015 cds track: Two re-ranking methods in medical information ret
10、rievalC/Proceedings of the 2015 Text Retrieval Conference. 2015.參考文獻Choi S, Choi J. SNUMedinfo at TREC CDS track 2014: Medical case-based retrieval taskR. SEOUL NATIONAL UNIV (REPUBLIC OF KOREA), 2014.Cummins R. Clinical Decision Support with the SPUD Language ModelC/TREC. 2015.Abacha A B, Khelifi S. LIST at TREC 2015 Clinical Decision Support Track: Question Analysis and U
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 初中校級課題申報書
- 發(fā)票供銷合同范本
- 南匯家電運輸合同范本
- 保時捷合同范本
- 網(wǎng)球課題申報書格式要求
- 公司交保險合同范本
- 全國合同范本模板
- 合同范本是幾號字體
- 買賣小型合同范本
- 中介簽獨家合同范本
- RT Thread設(shè)備驅(qū)動開發(fā)指南
- 《中小學(xué)生守則》學(xué)習(xí)PPT
- 蝴蝶蘭組盆方法
- QC成果減少現(xiàn)澆梁與PC疊合板交界處的漏漿資料參考
- 植物次生代謝
- 2023年江蘇經(jīng)貿(mào)職業(yè)技術(shù)學(xué)院單招面試模擬試題及答案解析
- 海膠生產(chǎn)工作總結(jié)推薦5篇
- 山西省平城區(qū)民政局離婚協(xié)議書匯編
- GB/T 7588.2-2020電梯制造與安裝安全規(guī)范第2部分:電梯部件的設(shè)計原則、計算和檢驗
- GB/T 19845-2005機械振動船舶設(shè)備和機械部件的振動試驗要求
- GB 9706.14-1997醫(yī)用電氣設(shè)備第2部分:X射線設(shè)備附屬設(shè)備安全專用要求
評論
0/150
提交評論