數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用課件_第1頁
數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用課件_第2頁
數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用課件_第3頁
數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用課件_第4頁
數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用課件_第5頁
已閱讀5頁,還剩122頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

ChinaAcademyofChineseMedicalSciences數(shù)據(jù)挖掘在中醫(yī)藥研究中的應(yīng)用中醫(yī)藥信息研究所2024/8/211數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用數(shù)據(jù)挖掘的相關(guān)概念數(shù)據(jù)挖掘在中醫(yī)藥領(lǐng)域中的應(yīng)用內(nèi)容課容內(nèi)程2數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用產(chǎn)生數(shù)據(jù)挖掘的產(chǎn)生3數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用什么激發(fā)了數(shù)據(jù)挖掘?

——“數(shù)據(jù)爆炸”但“知識貧乏”信息社會迅猛發(fā)展sz-數(shù)據(jù)激增-發(fā)現(xiàn)隱藏信息-利用數(shù)據(jù)-獲取知識-為我所用4數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用大型數(shù)據(jù)庫涌現(xiàn)數(shù)據(jù)庫技術(shù)發(fā)展用戶不滿足于數(shù)據(jù)庫的查詢功能統(tǒng)計學(xué)機器學(xué)習(xí)模式識別信息科學(xué)數(shù)據(jù)庫可視化數(shù)據(jù)挖掘

數(shù)據(jù)挖掘的出現(xiàn)是數(shù)據(jù)庫技術(shù)發(fā)展的必然數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用借用挖掘金礦的名稱數(shù)據(jù)知識數(shù)據(jù)挖掘希望利用數(shù)據(jù)挖掘技術(shù)解決“數(shù)據(jù)豐富”與“知識貧乏”之間的矛盾數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用數(shù)據(jù)挖掘的歷史1989年11屆國際人工智能研討會

首次提出了基于數(shù)據(jù)挖掘的知識發(fā)現(xiàn)

由美國人工智能協(xié)會主辦的知識發(fā)現(xiàn)國際研討會已經(jīng)召開了8次,規(guī)模由原來的專題討論會發(fā)展到國際學(xué)術(shù)大會國內(nèi):1993年國家自然科學(xué)基金首次支持該領(lǐng)域的研究項目。目前,國內(nèi)的許多科研單位和高等院校競相開展知識發(fā)現(xiàn)的基礎(chǔ)理論及其應(yīng)用研究,2024/8/217數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用2010年國家自然基金資助數(shù)據(jù)挖掘研究66項目數(shù)據(jù)挖掘項目西醫(yī):基于多模式序列超聲圖像識別系統(tǒng)診斷乳腺癌的方法學(xué)研究——田家瑋,哈爾濱醫(yī)科大學(xué)中醫(yī):應(yīng)用數(shù)據(jù)挖掘技術(shù)研究中醫(yī)藥治療再生障礙性貧血的組方規(guī)律——向陽,中國人民解放軍第210醫(yī)院基于智能計算的中醫(yī)方劑基礎(chǔ)治法模型的構(gòu)建——任廷革,北京中醫(yī)藥大學(xué)基于數(shù)據(jù)挖掘的針灸法效應(yīng)特異性基本規(guī)律及特點的研究——賈春生,河北醫(yī)科大學(xué)中藥新藥有效核心處方發(fā)現(xiàn)的隨機對照忙發(fā)設(shè)計方法研究——何麗云,中國中醫(yī)科學(xué)院中醫(yī)臨床基礎(chǔ)醫(yī)學(xué)研究所2024/8/218數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用數(shù)據(jù)挖掘的概念數(shù)據(jù)挖掘:DataMining.

數(shù)據(jù)中發(fā)現(xiàn)有效的、新穎的、潛在有用的,并且最終可以被讀懂的模式的過程模式,即pattern。其實就是解決某一類問題的方法論。即把解決某類問題的方法總結(jié)歸納到理論高度,那就是模式。例如:比如:孫子說“至死地而后生”是戰(zhàn)爭模式三十六計“走為上”、“空城計”也是戰(zhàn)爭模式。2024/8/219數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用數(shù)據(jù)挖掘與其他概念數(shù)據(jù)挖掘和知識發(fā)現(xiàn)(KDDKNOWLEDGEDISCOVERYINDATABASE)有人認為是一樣的只是不同領(lǐng)域稱呼不同數(shù)據(jù)挖掘是知識發(fā)現(xiàn)的過程的一部分?jǐn)?shù)據(jù)挖掘與數(shù)據(jù)分析數(shù)據(jù)挖掘是一個動態(tài)過程,能夠比數(shù)據(jù)分析更智能地使用數(shù)據(jù)倉庫數(shù)據(jù)挖掘與統(tǒng)計學(xué)統(tǒng)計學(xué)推斷是假設(shè)驅(qū)動的,即形成假設(shè)并在數(shù)據(jù)上驗證它。而數(shù)據(jù)挖掘是發(fā)現(xiàn)驅(qū)動的,即自動地從數(shù)據(jù)中提取模式和假定2024/8/2110數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用數(shù)據(jù)挖掘的數(shù)量常常很巨大

面臨的常常是大型數(shù)據(jù)庫,而且常常為其他目的而收集好的數(shù)據(jù)。

發(fā)現(xiàn)隱含的知識數(shù)據(jù)挖掘工作者不愿把先驗知識預(yù)先嵌入算法,是在沒有前提假設(shè)的情況下,從事信息的挖掘與知識的提取。數(shù)據(jù)挖掘的特點2024/8/2111數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用關(guān)聯(lián)分析分類聚類分析……介紹上述功能的一些具體計算方法。數(shù)據(jù)挖掘的基本功能2024/8/2112數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用關(guān)聯(lián)分析associationanalysis關(guān)聯(lián)分析是發(fā)現(xiàn)關(guān)聯(lián)規(guī)則。兩個或兩個以上變量的取值之間存在某種規(guī)律性,就稱為關(guān)聯(lián)。關(guān)聯(lián)分析的挖掘過程就是發(fā)現(xiàn)大量數(shù)據(jù)中項集之間有趣的關(guān)聯(lián)或相關(guān)聯(lián)系。

數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用請NCR公司構(gòu)建數(shù)據(jù)倉庫記錄銷售數(shù)據(jù)——每一位顧客哪一天在哪一家連鎖店購買了哪些商品啤酒與尿布2024/8/2114數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用購物籃分析:即分析哪些商品最有希望被顧客一起購買。2024/8/2115數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用每逢周末與尿布一起購買最多的商品是——啤酒!原因:美國的太太們常叮囑她們的丈夫下班后為小孩買尿布,而丈夫們在買尿布后又隨手帶回了他們喜歡的啤酒。16數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用舉例:沃爾瑪:通過關(guān)聯(lián)分析這一數(shù)據(jù)挖掘方法,發(fā)現(xiàn)“啤酒”及“尿布”兩件物品總是一起被購買。此結(jié)果蘊含著巨大的商業(yè)價值:兩件商品間隔最遠兩件商品放在一起啤酒尿布數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用如何完成?通過支持度和置信度高低來衡量關(guān)聯(lián)的強度。什么是支持度?如何計算?什么是置信度?如何計算?數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用沃爾瑪超市為范例顧客買東西很多,有很多購買收據(jù)記錄。收據(jù)1:啤酒、面包、方便面、鹽、收據(jù)2:陳皮、可樂、米、面包、鹽收據(jù)3:面包、被子、枕頭、收據(jù)4:椅子、筆記本收據(jù)5:可樂、椅子、枕頭、面包收據(jù)6:面包、筆記本……數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用收據(jù)1:啤酒、面包、方便面、鹽、

收據(jù)2:陳皮、可樂、米、面包、鹽

收據(jù)3:面包、被子、枕頭、

收據(jù)4:椅子、筆記本

收據(jù)5:可樂、椅子、枕頭、面包

收據(jù)6:面包、筆記本

支持度(support)計算公式A商品和B商品共同出現(xiàn)在一個收據(jù)次數(shù)——————————————————————總次數(shù)

2

SUPPORT(面包、枕頭)=——————=33.33%

6數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用收據(jù)1:啤酒、面包、方便面、鹽、

收據(jù)2:陳皮、可樂、米、面包、鹽

收據(jù)3:面包、被子、枕頭、

收據(jù)4:椅子、筆記本

收據(jù)5:可樂、椅子、枕頭、面包

收據(jù)6:面包、筆記本

置信度(confidencet:A→B)=A商品和B商品共同出現(xiàn)在一個收據(jù)次數(shù)——————————————————————A商品出現(xiàn)次數(shù)

2SUPPORT(枕頭→面包)=—————=40%5數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用置信度(congfidence:B→A)=A商品和B商品共同出現(xiàn)在一個收據(jù)次數(shù)——————————————————————B商品出現(xiàn)次數(shù)收據(jù)1:啤酒、面包、方便面、鹽、

收據(jù)2:陳皮、可樂、米、面包、鹽

收據(jù)3:面包、被子、枕頭、

收據(jù)4:椅子、筆記本

收據(jù)5:可樂、椅子、枕頭、面包

收據(jù)6:面包、筆記本

2SUPPORT(面包→枕頭)=—————=100%22024/8/2122數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用頻繁子集篩選-------獲得挖掘結(jié)果置信度支持度商品1,商品290%80%商品1,商品370%40%商品4,商品580%89%商品6,商品840%50%商品7,商品930%20%…….有意義無意義數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用關(guān)聯(lián)分析特點可以從大量數(shù)據(jù)中發(fā)現(xiàn)有趣的關(guān)聯(lián)2024/8/2124數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用聚類分析clustering將異質(zhì)總體分成為同質(zhì)性的類別根據(jù)數(shù)據(jù)自動產(chǎn)生各個類別例如:作者群的自動聚類。2024/8/2125數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用聚類如何實現(xiàn):從復(fù)雜數(shù)據(jù)中提取簡單的分組結(jié)構(gòu)根據(jù)采集的與性別相關(guān)特征信息:衣著,頭發(fā)等26數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用自動聚成若干類2024/8/212024/8/2127數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用相似度聚類,是把最相似的數(shù)據(jù)聚結(jié)在一起形成類別。通常最常用的計算方式就是“歐式距離”歐式距離表示多維空間的幾何距離:例如:A人物像B人物像裙子10頭發(fā)41衣著鮮艷102024/8/2128數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用歐式距離計算裙子x頭發(fā)x衣著鮮艷zA人物像B人物像裙子10頭發(fā)41衣著鮮艷10歐式距離2024/8/2129數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用歐式距離計算----完成相似度度量公式:DISTANCE(A,B)===3.31注意的是最相近的值(一樣)一定是0A人物像B人物像裙子10頭發(fā)41衣著鮮艷102024/8/2130數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用計算相似度后如何聚類?2024/8/212024/8/2131數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用計算相似度后如何聚類?

(自下而上的層次聚類法)有了具體相似度量后,每兩個對象之間都形成一個相似度值。4*4的矩陣01011205340先把最相近的聚類到一起變成一簇和其他對象再進行相似度計算在數(shù)學(xué)上,矩陣是指縱橫排列的二維數(shù)據(jù)表格。matrix2024/8/2132數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用兩個合并在一起的簇怎么和其他對象比較?3*3的矩陣有很多計算方法:介紹單連接:D(c1,c2)=Min{d(o,O)}D(,)=Min{d(,

),d(,)}=20?0?40010112053402112024/8/2133數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用有很多規(guī)定定義這種計算。單連接——取最近值完全連接——取最遠值。。。。0203402024/8/2134數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用聚類完成0302024/8/2135數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用聚類分析特點是物以類聚的一種統(tǒng)計分析方法。用于對事物類別的面貌尚不清楚,甚至在事前連總共有幾類都不能確定的情況下進行分類。在中醫(yī)藥中應(yīng)用:一組某病人,利用聚類,聚集成幾類,推斷出該病常見證型有哪些?2024/8/2136數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用分類Classification即為按照分析對象的屬性分門別類加以定義,建立類別。例如:銀行貸款用戶:分為高風(fēng)險、中風(fēng)險、低風(fēng)險三類用戶。如有申請貸款者,根據(jù)所填寫信息,利用數(shù)據(jù)挖掘方法,劃分其是三類用戶中那一類。2024/8/2137數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用主要介紹關(guān)于分類的兩種方法貝葉斯模型決策樹2024/8/2138數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用貝葉斯模型14天打網(wǎng)球情況。14天不同天氣情況下打網(wǎng)球的情況分類目的:根據(jù)新的一天天氣,決定是否打網(wǎng)球天氣溫度濕度有風(fēng)yesNoyesNoyesnoyesno晴23熱22高34否62多云40溫暖42正常61是33雨32涼爽31打網(wǎng)球YESNO95實例:根據(jù)以往打網(wǎng)球的情況,看看根據(jù)新一天的天氣情況,能否打網(wǎng)球?2024/8/2139數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用目的:給出新一天的氣候:看看是否打網(wǎng)球?貝葉斯模型利用概率的方式計算:就是在天氣(晴)=YES,氣溫(涼爽)=YES,濕度(高)=YES,有風(fēng)=YES的條件下:打網(wǎng)球是否為YES?天氣氣溫濕度有風(fēng)晴涼爽高是2024/8/2140數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用計算過程轉(zhuǎn)換14天打網(wǎng)球情況為概率表14天不同天氣情況下打網(wǎng)球的情況

天氣溫度濕度有風(fēng)打網(wǎng)球yesNoyesNoyesnoyesnoyesNo晴23熱22高34否6295多云40溫暖42正常61是33雨32涼爽31天氣溫度濕度有風(fēng)打網(wǎng)球yesNoyesNoyesnoyesnoyesNo晴2/93/5熱2/92/5高3/94/5否6/92/59/145/14多云4/90溫暖4/92/5正常6/91/5是3/93/5雨3/92/5涼爽3/91/52024/8/2141數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用天氣溫度濕度有風(fēng)打網(wǎng)球yesNoyesNoyesnoyesnoyesNo晴2/93/5熱2/92/5高3/94/5否6/92/59/145/14多云4/90溫暖4/92/5正常6/91/5是3/93/5雨3/92/5涼爽3/91/5YES的概率(紅色)=2/9*3/9*3/9*3/9*9/14=0.0053NO的概率(綠色)=3/5*1/5*4/5*3/5*5/14=0.0206YES+NO=1,經(jīng)過歸一化處理YES=20.5%,NO=79.5%2024/8/2142數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用貝葉斯模型特點所有條件變量對于分類均是有用的先驗知識的正確和豐富和后驗知識的豐富和正確,能直接影響分類的準(zhǔn)確性在中醫(yī)藥醫(yī)學(xué)中范例應(yīng)用于專家系統(tǒng)診斷。根據(jù)癥狀,推斷出診斷。2024/8/2143數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用決策樹決策樹(decisiontree)每個決策或事件都可能引出兩個或多個事件,導(dǎo)致不同的結(jié)果,把這種決策分支畫成圖形很像一棵樹的枝干,故稱決策樹例:根據(jù)表格情況形成分類樹性別年齡血壓藥物1男20正常A2女73正常B3男37高A4男33低B5女48高A……藥物B血壓年齡藥物A藥物B藥物A高正常低≤40>402024/8/2144數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用如何解讀決策樹信息如果血壓高,則采用藥物A如果血壓低,則采用藥物B如果血壓正常并且年齡小于等于40,則采用藥物A,否則采用藥物B.藥物B血壓年齡藥物A藥物B藥物A高正常低≤40>402024/8/2145數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用產(chǎn)生疑問如何計算節(jié)點如何劃分?

為什么先血壓,后年齡?分裂變量的界限為什么以40歲為界限?藥物B血壓年齡藥物A藥物B藥物A高正常低≤40>402024/8/2146數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用介紹其中一個ID3算法計算決策樹14天打網(wǎng)球情況。14天不同天氣情況下打網(wǎng)球的情況分類目的:根據(jù)新的一天天氣,決定是否打網(wǎng)球天氣溫度濕度有風(fēng)yesNoyesNoyesnoyesno晴23熱22高34否62多云40溫暖42正常61是33雨32涼爽31打網(wǎng)球YESNO952024/8/2147數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用14天具體打網(wǎng)球情況:序號天氣氣溫濕度有風(fēng)打網(wǎng)球1晴熱高無NO2晴熱高有NO3多云熱高無YES4雨溫暖高無YES5雨涼爽正常無YES6雨涼爽正常有NO7多云涼爽正常有YES8晴溫暖高無NO9晴涼爽正常無YES10雨溫暖正常無YES11晴溫暖正常有YES12多云溫暖高有YES13多云熱正常無YES14雨溫暖高有NO48數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用每一個因素形成一個決策樹分支天氣yesNo晴23多云40雨32基于天氣劃分決策樹天氣1:NO2:NO8:NO9:YES11:YES3:YES7:YES12:YES13:YES4:YES5:YES6:NO10:YES14:NO晴多云雨2024/8/2149數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用其他因素也形成了一個樹的分支氣溫1:NO2:NO8:YES13:YES4:YES8:NO10:YES11:YES12:YES14:NO5:YES6:NO7:YES9:YES熱溫暖涼爽有風(fēng)1:YES3:NO4:YES5:YES8:YES9:NO10:YES13:YES2:NO6:NO7:YES11:YES12YES14:NOfalsetrue濕度1:NO2:NO3:YES4:YES8:NO12:YES14:NO5:YES6:NO7:YES10:YES11:YES13:YES高正常2024/8/2150數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用如何把多個因素合并成一個大的決策樹?天氣、氣溫、濕度、有風(fēng)這四個因素誰為起點分支?在何處分支?在何處停止?越確定的在分支,越不確定的在主干。否則到了樹的支端無法做決定。但如何計算它們的確定性和不確定性?藥物B血壓年齡藥物A藥物B藥物A高正常低≤40>402024/8/2151數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用如何把小的分支合并成一棵大的決策樹?首先介紹一下信息的一個計算方法:信息熵的定義:無序性度量。(不確定性)

對值的無序的情況做一個量化的測量。例:信息熵=0信息熵=0信息熵最大當(dāng)都是yes或都是NO時無序性很差,不確定性很弱,信息熵最小0當(dāng)yes和no一樣多時無序性很強,不確定性很強,信息熵最大1:NO2:NO8:NO13:NO1:YES2:YES8:YES13:YES1:NO2:NO8:YES13:YES2024/8/2152數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用利用熵的計算方法計算決策樹越到樹的主干,不確定性越大,熵越大,越到樹的分支,確定性越大,熵越小以便決定YES或NO熵大熵小確定性越大不確定性越大Yes和no越平均Yes和no越一致2024/8/2153數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用信息熵的計算公式Info[C1,C2]=ENTROPY(P1,P2)=-P1*LOG2P1—P2*LOG2P2

C1,C2代表發(fā)生事件的不同數(shù)量P1=C1/(C1+C2)發(fā)生事件的不同概率以YES與NO為例解釋:C1,代表發(fā)生yes的次數(shù),P1,代表發(fā)生YES的概率C2,代表發(fā)生NO的次數(shù),P2,代表發(fā)生NO的概率

函數(shù)名稱,就像SUM一樣。2024/8/2154數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用Info[C1,C2]=ENTROPY(P1,P2)

=-P1*LOG2P1—P2*LOG2P2

C1,代表發(fā)生yes的次數(shù),P1,代表發(fā)生YES的概率

C2,代表發(fā)生NO的次數(shù),P2,代表發(fā)生NO的概率

例如:在一個節(jié)點上yes是2,no是3P1=2/5P2=3/5Info([2,3])=-2/5*LOG2(2/5)-3/5*LOG2(3/5)=(-0.4)*(-1.32)+(-0.6)*(-0.74)=0.971位天氣1:NO2:NO8:NO9:YES11:YES晴比特,又叫Bit,是計量單位2024/8/2155數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用以天氣為例進行信息熵計算天氣yesNo晴23多云40雨32合計95Info(晴)=Info([2,3])=0.971位Info(多云)=Info([4,0])=0.0位Info(雨)=Info([3,2])=0.971位還是不能確定誰是主干:觀點就是天氣、氣溫、濕度、有風(fēng),誰建立了分支之后,信息的不確定性消除得越多,就當(dāng)做主干。也就是看看以誰當(dāng)主干,很快就達到了分支,很快信息就變得確定了。2024/8/2156數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用計算天氣下面建立分支后不確定性Gain(天氣)=info(天氣合計)-info(晴,多云,雨)=info([9,5])-info([2,3],[4,0],[3,2])=info([9,5])-(info([2,3]+info([4,0]+info([3,2])=0.247天氣yesNo晴23多云40雨32合計95不確定性消除的值有一個名詞表示:信息增益gain平均信息值2024/8/2157數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用同理計算出其他三個因素下面建立分支后,信息不確定性消除了多少Gain(天氣)=0.247位Gain(氣溫)=0.029位Gain(濕度)=0.152位Gain(有風(fēng))=0.048位選擇不確定性消除最大的作為第一級主分支2024/8/2158數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用天氣已經(jīng)作為第一個主干了,那么下面該接著誰作為下一級主干?1:NO2:NO8:NO9:YES11:YES3:YES7:YES12:YES13:YES4:YES5:YES6:NO10:YES14:NO氣溫?濕度?有風(fēng)?直接做決定需要參考其他因素需要參考其他因素2024/8/2159數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用14天具體打網(wǎng)球情況:序號天氣氣溫濕度有風(fēng)打網(wǎng)球1晴熱高無NO2晴熱高有NO3多云熱高無YES4雨溫暖高無YES5雨涼爽正常無YES6雨涼爽正常有NO7多云涼爽正常有YES8晴溫暖高無NO9晴涼爽正常無YES10雨溫暖正常無YES11晴溫暖正常有YES12多云溫暖高有YES13多云熱正常無YES14雨溫暖高有NO60數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用以天氣晴下面建立分支為例:以信息完全確定作為分支的結(jié)束2024/8/21611:NO2:NO8:NO9:YES11:YES氣溫1:no2:no8:no9:yes11:yes熱溫暖涼爽序號天氣氣溫打網(wǎng)球1晴熱NO2晴熱NO8晴溫暖NO9晴涼爽YES11晴溫暖YES2024/8/2161數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用以天氣晴下面建立分支為例:以信息完全確定作為分支的結(jié)束62濕度1:no2:no8:no9:yes11:yes序號天氣濕度打網(wǎng)球1晴高NO2晴高NO8晴高NO9晴正常YES11晴正常YES高正常62數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用序號天氣有風(fēng)打網(wǎng)球1晴無NO2晴有NO8晴無NO9晴無YES11晴有YES有風(fēng)1:no8:no9:yes2:no11:yes無有2024/8/2163數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用以天氣晴下面建立分支為例:以信息完全確定作為分支的結(jié)束2024/8/21641:NO2:NO8:NO9:YES11:YES氣溫濕度有風(fēng)1:no2:no8:no9:yes11:yes1:no2:no8:no9:yes11:yes1:no8:no9:yes2:no11:yes2024/8/2164數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用1:NO2:NO8:NO9:YES11:YES3:YES7:YES12:YES13:YES4:YES5:YES6:NO10:YES14:NO1:no2:no8:no9:yes11:yes4:yes5:yes10:yes6:no14:no最終的決策樹2024/8/2165數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用結(jié)果人性化2024/8/2166數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用決策樹的特點決策樹一般都是自上而下的來生成的??梢酝瓿煞诸惾蝿?wù),而且因為是樹狀結(jié)構(gòu),比較容易被使用者理解。2024/8/2167數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用第一步驟選擇第三步驟挖掘第二步驟處理第四步驟分析數(shù)據(jù)挖掘步驟目標(biāo)數(shù)據(jù)預(yù)處理及變換變換后的數(shù)據(jù)數(shù)據(jù)挖掘算法解釋/評估68清理篩選知識2024/8/2168數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用第一步驟:選擇收集數(shù)據(jù)

就是進行原始需要被挖掘的數(shù)據(jù)采集。例如:做肺癌處方的數(shù)據(jù)挖掘,要采集肺癌處方的信息,或原有的患者信息中導(dǎo)出,形成數(shù)據(jù)子集。原始數(shù)據(jù)的采集非常費時費力,通常在費用中占相當(dāng)大的比重??梢圆捎幂^小規(guī)模的數(shù)據(jù)對問題的可行性進行初步研究。2024/8/2169數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用第二步驟:處理數(shù)據(jù)預(yù)處理部分,把數(shù)據(jù)轉(zhuǎn)換成比較容易被數(shù)據(jù)挖掘的格式及內(nèi)容。內(nèi)容處理:年齡

六十歲60

有個還分組:老年、青年、等格式處理:年齡

出生日期1950年轉(zhuǎn)成61。

2024/8/2170數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用第三步驟:挖掘運用工具和算法,進行挖掘,完成分類、關(guān)聯(lián)、聚類、估計、預(yù)測等功能,發(fā)現(xiàn)數(shù)據(jù)中的規(guī)律。例如:關(guān)聯(lián)分析中常用apriori算法,算法就是一種計算方法,例如:計算一個班上有多少人:可以用加法或乘法。加法和乘法就是算法。2024/8/2171數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用第四步驟分析例如:預(yù)測信用卡欺詐行為。

通過算法分析信用卡用戶的購買習(xí)慣,根據(jù)結(jié)果認識客戶的模式,并分辨出偏離模式的信息卡盜用行為。2024/8/2172數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用概念數(shù)據(jù)挖掘在中醫(yī)藥領(lǐng)域中應(yīng)用73數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用二、關(guān)聯(lián)分析在中醫(yī)領(lǐng)域應(yīng)用情況

中醫(yī)領(lǐng)域及計算機領(lǐng)域均有深入研究中醫(yī)計算機中國中醫(yī)科學(xué)院南京中醫(yī)藥大學(xué)湖南中醫(yī)藥大學(xué)福建中醫(yī)學(xué)院北京中醫(yī)藥大學(xué)浙江大學(xué)計算機科學(xué)與技術(shù)學(xué)院廈門大學(xué)山西醫(yī)科大學(xué)山東師范大學(xué)南京理工大學(xué)南方醫(yī)科大學(xué)江蘇大學(xué)河南大學(xué)合肥工業(yè)大學(xué)哈爾濱工程大學(xué)廣東工業(yè)大學(xué)東北大學(xué)北京交通大學(xué)北京工業(yè)大學(xué)數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用近3年的學(xué)位論文中醫(yī)癥狀病機實體識別及其關(guān)系挖掘研究絕經(jīng)綜合征中醫(yī)藥臨床療效評價方法的數(shù)據(jù)挖掘研究中醫(yī)診療中挖掘算法的方法研究基于智能算法的醫(yī)學(xué)數(shù)據(jù)挖掘——特征權(quán)重優(yōu)化方法研究及其應(yīng)用中醫(yī)醫(yī)案數(shù)據(jù)挖掘技術(shù)研究基于數(shù)據(jù)挖掘技術(shù)的證素辨證方法研究中醫(yī)小兒肺炎療效評價系統(tǒng)的設(shè)計與實現(xiàn)基于數(shù)據(jù)挖掘?qū)毙怨诿}綜合征辨證論治規(guī)律的探索性研究中醫(yī)小兒肺炎辯證標(biāo)準(zhǔn)數(shù)據(jù)挖掘系統(tǒng)中的數(shù)據(jù)預(yù)處理技術(shù)基于數(shù)據(jù)挖掘的周仲瑛教授治療系統(tǒng)性紅斑狼瘡病案回顧性研究中醫(yī)臨床診療垂直搜索系統(tǒng)研究基于數(shù)據(jù)挖掘的中醫(yī)臟腑辨證系統(tǒng)研究中醫(yī)活血化瘀方數(shù)據(jù)庫及其數(shù)據(jù)挖掘基于數(shù)據(jù)挖掘的中醫(yī)方劑分析技術(shù)研究中醫(yī)婦科常見病醫(yī)案數(shù)據(jù)挖掘方法研究基于粒計算與完全圖的關(guān)聯(lián)規(guī)則算法研究中藥歸經(jīng)(肺經(jīng))理論和肺系方劑配伍規(guī)律的解析及在海洋中藥研發(fā)中的應(yīng)用基于聚類和BP網(wǎng)絡(luò)集成的中醫(yī)耳穴智能診斷儀研究應(yīng)用信息技術(shù)探索我國高等中醫(yī)藥院校學(xué)術(shù)及科研發(fā)展趨勢基于分類關(guān)聯(lián)規(guī)則的仲景方挖掘研究田從豁教授治療痹證、癮疹、不寐的經(jīng)驗挖掘分析基于貝葉斯網(wǎng)絡(luò)的中醫(yī)醫(yī)案數(shù)據(jù)挖掘特征選擇在中醫(yī)數(shù)據(jù)挖掘中的應(yīng)用研究基于SVM與關(guān)聯(lián)規(guī)則中醫(yī)舌象數(shù)據(jù)挖掘技術(shù)初步研究數(shù)據(jù)挖掘中分類分析的策略研究及其生物醫(yī)學(xué)應(yīng)用基于HMM的中醫(yī)臨床療效評價分析研究數(shù)據(jù)挖掘在中醫(yī)若干問題研究中的應(yīng)用關(guān)聯(lián)規(guī)則挖掘在中醫(yī)辨證診斷中的應(yīng)用研究數(shù)據(jù)挖掘模型的創(chuàng)建及其在中醫(yī)藥文獻中的應(yīng)用研究關(guān)聯(lián)規(guī)則算法研究及其在中醫(yī)藥數(shù)據(jù)挖掘中的應(yīng)用數(shù)據(jù)挖掘及其在中醫(yī)藥領(lǐng)域中的應(yīng)用關(guān)聯(lián)分析在中醫(yī)數(shù)據(jù)挖掘中的應(yīng)用研究脾虛證診斷信息數(shù)據(jù)挖掘的初步探討惡性腫瘤與脾虛證相關(guān)性數(shù)據(jù)挖掘的初步探討明清中醫(yī)疫病發(fā)病、癥狀與用藥相關(guān)性數(shù)據(jù)挖掘研究多路異質(zhì)聚類在中醫(yī)臨床數(shù)據(jù)中的應(yīng)用及其研究名老中醫(yī)經(jīng)驗傳承中的數(shù)據(jù)挖掘技術(shù)研究粗糙集合屬性約簡方法研究與實現(xiàn)面向中醫(yī)胃病診療的數(shù)據(jù)挖掘技術(shù)SVM算法研究及其在中醫(yī)臟腑辨證中的應(yīng)用慢性胃炎中醫(yī)診療中的數(shù)據(jù)挖掘研究DartSpora數(shù)據(jù)挖掘平臺的構(gòu)建呂仁和教授治療糖尿病學(xué)術(shù)思想及其傳承方法的研究可擴展智能推理及其在中醫(yī)舌診中的應(yīng)用絕經(jīng)綜合征中醫(yī)證治規(guī)律的數(shù)據(jù)挖掘模型與系統(tǒng)架構(gòu)設(shè)計數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用

原始數(shù)據(jù)規(guī)范不足

挖掘領(lǐng)域局限性

結(jié)果評價不充分

存在問題數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用研究目的:豐富婦科的臨床用藥理論探索:中藥與中藥之間癥狀與癥狀之間證型與證型之間中藥與癥狀之間中藥與證型之間癥狀與證型之間三、數(shù)據(jù)挖掘在中醫(yī)婦科醫(yī)案中的應(yīng)用關(guān)系數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用收集符合要求的醫(yī)案第一步數(shù)據(jù)采集第二步數(shù)據(jù)預(yù)處理第三步數(shù)據(jù)挖掘第四步結(jié)果評價分析把收集的婦科醫(yī)案數(shù)據(jù)統(tǒng)一★★★把統(tǒng)一好的數(shù)據(jù)進行數(shù)據(jù)挖掘把挖掘結(jié)果作一個綜合分析★★★研究流程數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用

醫(yī)案采集病種選擇醫(yī)家選擇醫(yī)案時間醫(yī)案內(nèi)容第一步:數(shù)據(jù)采集數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用參考94中醫(yī)藥行業(yè)標(biāo)準(zhǔn):確定婦科常見疾病共有14個通過檢索中醫(yī)藥信息研究所的中國中醫(yī)藥期刊文獻數(shù)據(jù)庫檢出這些疾病的期刊文章發(fā)表情況病種選擇數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用

病種選擇數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用選擇了前4個發(fā)表文獻數(shù)最多的病種,在醫(yī)案實際記錄中,有的病名很模糊,故醫(yī)案中信息診斷參考了國家中醫(yī)藥管理局1994年頒布了《中華人民共和國中醫(yī)藥行業(yè)標(biāo)準(zhǔn)-中醫(yī)病癥診斷療效標(biāo)準(zhǔn)》數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用

醫(yī)案總況病種選擇醫(yī)家選擇醫(yī)案時間醫(yī)案內(nèi)容痛經(jīng)崩漏不孕閉經(jīng)經(jīng)驗豐富的醫(yī)師醫(yī)案出版時間1972-2005醫(yī)案就診時間1951-2003中醫(yī)診斷中藥處方證型癥狀數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用采集醫(yī)案情況處方,癥狀,證候原文采集涉及醫(yī)案共2138例崩漏664例閉經(jīng)408例不孕631例痛經(jīng)435例期刊中醫(yī)案848例,專著中醫(yī)案1290例涉及醫(yī)家476位數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用數(shù)據(jù)采集內(nèi)容圍繞數(shù)據(jù)挖掘目的:尋找證-癥-藥關(guān)系。采集4種疾病醫(yī)案中證-癥-藥信息崩漏閉經(jīng)不孕痛經(jīng)證型癥狀處方中藥組成數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用確定一些納入排出標(biāo)準(zhǔn)例如:在本課題收錄的醫(yī)案中,治療方法都是單純的中草藥內(nèi)服治療。凡含有中成藥、針灸治療、外用治療、西藥治療、手術(shù)治療的醫(yī)案均被排除在外。這里特別要說明的是中成藥治療不予收錄。辨證必須含有病性和病位內(nèi)容。一些醫(yī)案的辨證部分只含有病位如“肝脾為病”或只含有病性“虛”或“實”不予收錄。癥狀除主癥之外必須有兩個以上癥狀描述,數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用采集醫(yī)案樣例1陳某43歲1976,12,14月經(jīng)過多來則如崩,已十余年,血色鮮紅,夾有大血塊.無腹痛.頭面洪熱,此次經(jīng)期將臨,舌胖,苔薄白,脈沉細氣血兩虧,沖任損傷黨參12g黃芪12g白術(shù)9g生貫眾30g花蕊石30g益母草9g升麻6g槐花12g生甘草4.5g炙甘草4.5g側(cè)柏葉30g山藥15川斷12g鉤藤12g崩漏沈仲理《近現(xiàn)代二十五位中醫(yī)名家婦科經(jīng)驗》242頁癥狀\證型\中藥名稱都需要規(guī)范處理數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用預(yù)處理內(nèi)容總則盡量貼近臨床盡量忠于原意,不失或少失原意。中藥證型癥狀

數(shù)據(jù)預(yù)處理數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用中藥部分

預(yù)處理名稱預(yù)處理冬術(shù)白術(shù)正異名的處理中藥正異名標(biāo)準(zhǔn)表正名是唯一的異名是唯一的紫背金盤草白毛夏枯草翻背白草管仲天水蟻草地膏藥毛大丁草根白葉不翻鹿茸草秋牡丹根根委陵菜翻白草白牛膽正異正異正異正異野丈人胡王使者白頭公《中華本草》中的正異名循環(huán)現(xiàn)象建表方式白頭翁……數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用醫(yī)案中原文規(guī)范后木蔓頭→木饅頭青篙→青蒿肉從蓉→肉蓯蓉桑葚→桑椹…………錯別字省略字醫(yī)案原文中名稱規(guī)范后名稱龍牡→龍骨,牡蠣赤白芍→赤芍,白芍藿荷梗→藿梗,荷梗蒼白術(shù)→蒼術(shù),白術(shù)…………數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用凈制、切制對于藥物性味歸經(jīng)改變很小,,就是凡見中藥名稱中含有“片”、“末”、“粉”、“鮮”、“嫩”、“凈”等凈制、切制方法的標(biāo)志用詞,予以去除。例如:醫(yī)案處方中見“佛手片”,直接去除“片”字,被規(guī)范成“佛手”。炮制預(yù)處理凈制、切制數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用凈制、切制、炮炙三種炮制方法中的炮炙法,對中藥的性味歸經(jīng)等有很大影響,中藥這部分的炮炙方法給予保留在中藥炮制參考書籍中,每味藥的炮制內(nèi)容中有這樣一個欄目——[處方應(yīng)付],用以指導(dǎo)藥劑師處理臨床醫(yī)師的處方[36]。例如:大黃的[處方應(yīng)付]:處方中寫大黃、川軍、生軍均付生大黃。寫酒大黃、酒軍付酒炒大黃,寫熟大黃、制大黃付熟大黃,其余各隨方付給。參考上述的中藥[處方應(yīng)付],熟大黃、制大黃都合并為熟大黃。炮炙數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用編號規(guī)范后名稱頻數(shù)原始中藥名稱101400白茅根《藥典》15白茅根《藥典》茅根《別冊》生白茅根《切》101600白術(shù)《藥典》642白術(shù)《藥典》土白術(shù)《別冊》冬術(shù)《別冊》土炒白術(shù)《切》炒白術(shù)《切》土白術(shù)《切》漂白術(shù)《切》曬白術(shù)《切》101601白術(shù)(焦)8焦白術(shù)焦冬術(shù)101602白術(shù)(生)18生白術(shù)101603白術(shù)(炭)2白術(shù)炭101604白術(shù)(煨)1煨白術(shù)101605白術(shù)(制)1制白術(shù)中藥規(guī)范表(部分)數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用從結(jié)構(gòu)上規(guī)范,把證型名稱規(guī)范成統(tǒng)一結(jié)構(gòu)的主謂詞組,主語部分是病位,謂語部分是病性。結(jié)構(gòu)主+謂??血+瘀證型部分預(yù)處理數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用復(fù)合證型,涉及兩個臟器的盡量拆分,例如肝腎陰虛,可以拆分成肝陰虛+腎陰虛,如果難以拆分的,如肝脾不和,則保留原狀。內(nèi)容復(fù)合證型沖任沖任失調(diào)的辨證幾乎出現(xiàn)在所有醫(yī)案中,成為一個非常強的干擾項,故把沖任失調(diào)的辨證去除數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用對規(guī)范后的證型的選詞,一方面參考了《中國中醫(yī)藥學(xué)主題詞表》、《中醫(yī)診斷學(xué)》、《中華人民共和國中醫(yī)藥行業(yè)標(biāo)準(zhǔn)-中醫(yī)病證診斷療效標(biāo)準(zhǔn)》等專業(yè)書籍;另一方面把需要規(guī)范成同一證型的用詞作了頻數(shù)統(tǒng)計,選用了一個使用頻次最高的詞作為規(guī)范后證型。選詞頻次高數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用證型標(biāo)注表(部分)編號規(guī)范后證型詞頻次證型詞原文(后綴數(shù)字為醫(yī)案中出現(xiàn)的頻次)300905血瘀591血瘀349瘀血85血淤19血滯30血行不暢15血凝12氣血瘀滯10氣血運行不暢10血行瘀滯6氣血郁滯5氣血阻滯5氣血壅滯5血澀4血結(jié)4氣血澀滯3煉血成瘀3氣血凝滯3血阻3干血2氣血不暢2氣血瘀阻2血行不通2血結(jié)成瘀化熱1血行瘀阻1血行受阻1痰血互結(jié)1氣血奎滯1血滯不暢1血分有寒夾瘀1寒凝血泣著而成瘀1氣礙血行1血不得行1血運不暢1血有郁熱1數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用結(jié)構(gòu)主+謂??腹+痛副詞選詞頻次高癥狀部分預(yù)處理稍略微結(jié)構(gòu)副詞選詞頻次高略微數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用癥狀描述詳細程度不同同一個腹痛,有的僅寫腹痛,有的寫腹刺痛,有的寫小腹痛,有的寫小腹刺痛,用詞上深淺各不相同。需要對癥狀進行特殊處理,才能粗細概念均保留。數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用癥狀部分用詞拆分下腹微刺痛醫(yī)案原文拆分下腹微刺痛下腹微刺痛下刺微腹微刺痛規(guī)范后腹痛下腹痛腹刺痛刺痛下腹刺痛規(guī)范后數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用癥狀標(biāo)注表(部分)編號規(guī)范后癥狀頻次醫(yī)案中原文癥狀用詞及使用頻次201105體瘦289體瘦93消瘦42形體消瘦34形瘦33形體瘦弱28形體削瘦5形體較瘦5面黃肌瘦4體質(zhì)瘦弱3贏瘦3形體瘦小3身體瘦弱3瘦弱3體質(zhì)消瘦2身體嬴瘦2形體不豐2形體偏瘦2身體較瘦2形體瘦削2嬴瘦2形嬴1形體枯瘦1形體消索1形體漸瘦1形體日嬴1身瘦1肌肉消削1數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用591個醫(yī)案涉及食欲差,但不同表達方式有84種編號癥狀(頻次)編號癥狀(頻次)編號癥狀(頻次)編號癥狀(頻次)1納差10322納欠343食納減164食納甚差12納呆9323不欲食344飲食差165食少乏味13納少7724胃納差345不欲飲食166食欲不旺14食欲不振5125飲食少346谷納少馨167食欲極差15食少3026納食不佳347眠食欠佳168食欲較差16不思飲食2127飲食不思348納呆乏味169胃不思納17納減1928少食249納谷不旺170胃不欲納18納谷不馨1929納食差250納谷不振171胃呆少納19納欠佳1530納差食少251納谷欠馨172胃納不多110納谷不香1031納谷欠振252納減不思173胃納不香111納呆食少932納谷無味253納食不振174胃納欠馨112不思食733納食不馨254納食偏少175胃納日減113納食不香734納食減少255納食衰少176飲食不香114食欲減退735納食無味256納食亦差177飲食不欲115納食欠佳636食納不佳257食不知味178飲食乏味116胃納欠佳637食納不香258食谷不馨179飲食欠佳117飲食減少638食納呆滯259食納不思180飲食欠馨118食納欠佳539食欲不佳260食納大減181飲食無味119食欲差440胃納不馨261食納減退182精神食欲不振120食欲欠佳441飲食不佳262食納較差183谷食大減納少121胃納不佳442食減163食納日減184飲食素來偏少1數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用1陳某43歲1976,12,14月經(jīng)過多來則如崩,已十余年,血色鮮紅,夾有大血塊.無腹痛.頭面洪熱,此次經(jīng)期將臨,舌胖,苔薄白,脈沉細氣血兩虧,沖任損傷黨參12g黃芪12g白術(shù)9g生貫眾30g花蕊石30g益母草9g升麻6g槐花12g生甘草4.5g炙甘草4.5g側(cè)柏葉30g山藥15川斷12g鉤藤12g崩漏沈仲理《近現(xiàn)代二十五位中醫(yī)名家婦科經(jīng)驗》242頁婦科醫(yī)案數(shù)據(jù)庫預(yù)處理1經(jīng)血量多,經(jīng)色鮮紅,經(jīng)血有塊,頭熱,面熱,舌體胖,舌苔薄,舌苔白,脈沉,脈細氣虛,血虛黨參,黃芪,白術(shù),綿馬貫眾,花蕊石,益母草,升麻,槐花,甘草,甘草(炙),側(cè)柏葉,山藥,續(xù)斷,鉤藤崩漏醫(yī)案原文醫(yī)案數(shù)據(jù)庫數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用婦科醫(yī)案數(shù)據(jù)庫痛經(jīng)435例不孕631例閉經(jīng)408例崩漏664例癥狀605個中藥754個證型63個婦科醫(yī)案共2138例數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用WEKA軟件中國中醫(yī)研究院周雪忠等人開發(fā)的應(yīng)用軟件,此軟件基于新西蘭維克多大學(xué)研發(fā)的智能平臺WEKA。婦科醫(yī)案數(shù)據(jù)挖掘

數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用WEKA軟件主界面及運行界面數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用方劑庫1白術(shù),蒼術(shù),大黃,白芍2白術(shù),蒼術(shù),紅花3白術(shù),蒼術(shù),白芍方劑轉(zhuǎn)化成藥對1白術(shù)-蒼術(shù),白術(shù)-大黃,白術(shù)-白芍,蒼術(shù)-大黃,蒼術(shù)-白芍,大黃-白芍2白術(shù)-蒼術(shù),白術(shù)-紅花,蒼術(shù)-紅花3白術(shù)-蒼術(shù),白術(shù)-白芍,蒼術(shù)-白芍?jǐn)?shù)據(jù)挖掘原理應(yīng)用編號藥對頻次1白術(shù)-蒼術(shù)32白術(shù)-白芍23白術(shù)-大黃14白術(shù)-紅花15蒼術(shù)-白芍26蒼術(shù)-大黃17蒼術(shù)-紅花18大黃-白芍1數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用編號藥對頻次支持度置信度1白術(shù)?蒼術(shù)3100%100%蒼術(shù)?白術(shù)100%2白術(shù)?白芍266%66%白芍?白術(shù)100%3白術(shù)?大黃133%33%大黃?白術(shù)100%4白術(shù)?紅花133%33%紅花?白術(shù)100%5蒼術(shù)?白芍266%66%白芍?蒼術(shù)100%6蒼術(shù)?大黃133%33%大黃?蒼術(shù)100%7蒼術(shù)?紅花133%33%紅花?蒼術(shù)100%8大黃?白芍133%100%白芍?大黃50%數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用單味藥頻次白術(shù)蒼術(shù)白芍大黃紅花33211方劑庫1白術(shù),蒼術(shù),大黃,白芍2白術(shù),蒼術(shù),紅花3白術(shù),蒼術(shù),白芍同時出現(xiàn)白芍、大黃的方劑數(shù)1“白芍-大黃”支持度=————————————————=33%總方劑數(shù)3同時出現(xiàn)白芍、大黃的方劑數(shù)1“白芍?大黃”置信度=————————————————=50%凡出現(xiàn)白芍的方劑數(shù)2同時出現(xiàn)白芍、大黃的方劑數(shù)1“大黃?白芍”置信度=————————————————=100%凡出現(xiàn)大黃的方劑數(shù)1編號藥對頻次支持度置信度8白芍?大黃133%50%大黃?白芍100%數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用設(shè)定

最小支持度50%

最小置信度50%藥對頻次支持度置信度白術(shù)?蒼術(shù)3100%100%蒼術(shù)?白術(shù)100%白術(shù)?白芍266%66%白芍?白術(shù)100%白術(shù)?大黃133%33%大黃?白術(shù)100%白術(shù)?紅花133%33%紅花?白術(shù)100%蒼術(shù)?白芍266%66%白芍?蒼術(shù)100%蒼術(shù)?大黃133%33%大黃?蒼術(shù)100%蒼術(shù)?紅花133%33%紅花?蒼術(shù)100%大黃?白芍133%100%白芍?大黃50%數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用支持度、置信度的設(shè)置對藥支持度置信度吳茱萸?當(dāng)歸6%60%五靈脂?當(dāng)歸10%74%艾葉?當(dāng)歸11%73%延胡索?當(dāng)歸10%71%紅花?當(dāng)歸9%71%肉桂?當(dāng)歸6%71%香附?當(dāng)歸12%70%熟地黃?當(dāng)歸13%69%………………最小支持度最小置信度本課題設(shè)定最小支持度5%最小置信度40%后進行數(shù)據(jù)挖掘再在一次挖掘結(jié)果中篩選支持度最高前10名置信度最高前10名高頻組數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用普遍挖掘模式編號癥狀證型中藥組成中醫(yī)診斷1經(jīng)血量多,經(jīng)血量少,經(jīng)色褐,腹脹,腹痛,少腹脹,少腹痛,脹痛,心悸,體倦,面浮,肢腫,口渴,不欲飲,便秘,舌苔薄,舌苔白,舌苔膩,脈沉,脈細心虛,脾虛柴胡,白芍,牡丹皮,黃芩,龍骨(生),牡蠣,黨參,白術(shù),茯苓,薄荷,麥冬崩漏數(shù)據(jù)挖掘編號高頻癥狀組高頻證型組高頻藥對1經(jīng)血量多?肢腫腹痛?口渴……血瘀?脾虛肝郁?脾虛……白芍?白術(shù)茯苓?麥冬……數(shù)據(jù)挖掘在中醫(yī)藥中應(yīng)用本課題數(shù)據(jù)挖掘結(jié)果編號癥狀證型中藥組成中醫(yī)診斷1經(jīng)血量多,經(jīng)血量少,經(jīng)色褐,腹脹,腹痛,少腹脹,少腹痛,脹痛,心悸,體倦,面浮,肢腫,口渴,不欲飲,便秘,舌苔薄,舌苔白,舌苔膩,脈沉,脈細心虛,脾虛柴胡,白芍,牡丹皮,黃芩,龍骨(生),牡蠣,黨參,白術(shù),茯苓,薄荷,麥冬崩漏編號患者癥狀,證型,中藥組成信息中醫(yī)診斷1經(jīng)血量多,經(jīng)血量少,經(jīng)色褐,腹脹,腹痛,少腹脹,少腹痛,脹痛,心悸,體倦,面浮,肢腫,口渴,不欲飲,便秘,舌苔薄,舌苔白,舌苔膩,脈沉,脈細,心虛,脾虛,柴胡,白芍,牡丹皮,黃芩,龍骨(生),牡蠣,黨參,白術(shù),茯苓,薄荷,麥冬崩漏高頻藥對白芍?白術(shù)。。。數(shù)據(jù)挖掘高頻組備注經(jīng)血量多?肢腫癥狀+癥狀血瘀?脾虛

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論