數(shù)據(jù)挖掘技術在中醫(yī)藥研究中的應用_第1頁
數(shù)據(jù)挖掘技術在中醫(yī)藥研究中的應用_第2頁
數(shù)據(jù)挖掘技術在中醫(yī)藥研究中的應用_第3頁
數(shù)據(jù)挖掘技術在中醫(yī)藥研究中的應用_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

數(shù)據(jù)挖掘技術在中醫(yī)藥研究中的應用

挖掘挖掘技術是一種有效的信息處理技術,可以分析中醫(yī)個性化診斷信息的特點,提取其原有的新理論、新方法,有效總結和傳承中醫(yī)經(jīng)驗。中醫(yī)藥研究歷經(jīng)數(shù)千年總結發(fā)展后,在許多方面積累了豐富的數(shù)據(jù),這些數(shù)據(jù)具有明顯的海量特征,但它們又多以零散的形式存儲在各種文獻中。對如此海量且無序的數(shù)據(jù),若僅憑個人思維綜合分析,會受到認識水平、思維方式、主觀因素以及研究方法和研究范圍的限制。利用數(shù)據(jù)挖掘相關技術進行知識的獲取研究,在眾多的中醫(yī)藥資源中去偽存真、去粗取精,以促進中醫(yī)藥事業(yè)的發(fā)展,是中醫(yī)藥現(xiàn)代化研究的重要組成部分。數(shù)據(jù)挖掘作為一個在海量數(shù)據(jù)中獲取知識的有力工具,已在中醫(yī)藥領域得到應用,現(xiàn)將應用研究情況綜述如下。1知識發(fā)現(xiàn)方法數(shù)據(jù)挖掘指的是在大型數(shù)據(jù)庫的數(shù)據(jù)中提取出人們感興趣的知識,是對大量觀察到的數(shù)據(jù)進行分析,從中發(fā)現(xiàn)事先未知的聯(lián)系和規(guī)律[1]。這些知識一般是隱含的、事先未知的潛在有用的信息,提取的知識以概念、規(guī)律、規(guī)則、模式等形式存在。數(shù)據(jù)挖掘需要處理的問題主要是在大型的數(shù)據(jù)庫中尋找有價值的隱藏知識,通過分析對這些有意義的信息進行歸納與總結,形成系統(tǒng)的模式,提供給有關部門進行參考。從廣義上說,數(shù)據(jù)挖掘的過程也是知識發(fā)現(xiàn)(KDD)的過程。這種知識發(fā)現(xiàn)一般分為5個步驟:第一,問題定義;第二,數(shù)據(jù)提取;第三,數(shù)據(jù)預處理;第四,數(shù)據(jù)挖掘;第五,知識評估。數(shù)據(jù)挖掘分為預測型(predictive)和描述型(de-scriptive)兩大類型。在數(shù)據(jù)挖掘領域提出了神經(jīng)網(wǎng)絡、決策樹、聯(lián)機分析處理、數(shù)據(jù)可視化、遺傳算法、統(tǒng)計學方法、數(shù)據(jù)倉庫技術等多種實現(xiàn)模式。在現(xiàn)階段,數(shù)據(jù)挖掘在國外的發(fā)展趨勢及研究主要有:注重對Bayes方法以及Boosting方法的研究和提高[2],即對知識發(fā)現(xiàn)方法的進一步研究;在知識發(fā)現(xiàn)中統(tǒng)計學回歸法的應用;對現(xiàn)代網(wǎng)絡信息挖掘方法的研究等[3]。在國內(nèi)外還出現(xiàn)了一些較有影響力的數(shù)據(jù)挖掘系統(tǒng),包括各種專用或通用的數(shù)據(jù)挖掘軟件。但總體來講,在現(xiàn)階段數(shù)據(jù)挖掘系統(tǒng)由于各自算法和模型不同,跨平臺操作會受到很大的限制,所以一個普遍且實用的模型有待進一步研究。在中醫(yī)藥領域中數(shù)據(jù)的特點有離散型、連續(xù)型、混合型等,對這些數(shù)據(jù)的預處理(如噪聲處理等)是非常復雜的,挖掘過程需要反復多次的人機交互,每一個環(huán)節(jié)都不可缺少專業(yè)技術人員。只有在中醫(yī)理論的指導下并緊密結合臨床實際,對于不同的問題,通過選擇合理的挖掘方法,才能挖掘出真正有價值的知識[4]。2文獻形式和程序2.1數(shù)量龐雜,形式多樣有史以來,中醫(yī)藥著作資源數(shù)量非常龐雜。在資產(chǎn)階級民主革命前我國已發(fā)行了近兩萬冊的中醫(yī)學文獻著作,在新中國成立后,出版了相當于建國前刊出總量的圖書品種[5]。在文獻形式和文字上都有了很大的差別。2.2信息的模糊性,術語不規(guī)范在中醫(yī)藥研究中,對藥物、診療過程、疾病癥狀的描述等都有大量的定性描述和繁多的模糊概念。尤其是對藥物的描述,一藥多名與異藥同名的現(xiàn)象也非常普遍[6]。中醫(yī)學對疾病的診斷是通過醫(yī)生的四診(望、聞、問、切)經(jīng)驗獲取有用信息,對疾病做出診斷。中醫(yī)癥狀的模糊性獲取信息時形式多樣、癥狀間的一癥多名或多癥一名的現(xiàn)象,增加了中醫(yī)藥數(shù)據(jù)挖掘的難度。3法律及科技的應用研究隨著時代的發(fā)展,中醫(yī)藥信息資源數(shù)量快速增長,但中醫(yī)藥信息資源的特點是龐雜而又無序的,這與專業(yè)技術人員對信息的需求形成了嚴重的矛盾。為解決這一矛盾,一個重要途徑就是將各種信息進行加工處理,建立較完善的信息資源數(shù)據(jù)庫。將數(shù)據(jù)挖掘技術引入中醫(yī)藥現(xiàn)代化研究,正是計算機技術運用于中醫(yī)藥現(xiàn)代化研究的又一新嘗試。3.1在中醫(yī)診斷中的應用中醫(yī)診斷客觀化的基礎條件是四診客觀化,四診客觀化對古今大量四診文獻進行的一種處理方法就是數(shù)據(jù)挖掘。如將中醫(yī)醫(yī)案與中醫(yī)的舌診、脈診理論相結合,通過建立中醫(yī)病案聯(lián)機分析處理(OLAP)系統(tǒng),對從一些著名醫(yī)案著作中收集到的上千例案例進行實例研究,從而了解當代名醫(yī)大家對于舌脈診的認識,舌脈象與病證的相關性[7]。也有研究將明清及近現(xiàn)代3000例醫(yī)案的相關內(nèi)容分為病名、證型、舌象、脈象、癥狀等5種模式,嘗試采用Fayyad模型,成功建立了脈象與病名之間、病名與脈象之間、脈象與證型之間、證型與脈象之間的聯(lián)系[8]。在中醫(yī)診斷中,正確的診斷對于確立治療方案、指導用藥及調(diào)理康復無疑是非常重要的。而在臨床中有些疾病錯綜復雜,運用數(shù)據(jù)挖掘的有關分類分析方法應用于疾病的診斷中[9],如對男女患者的CT圖像采用貝葉斯學習分類法進行自動診斷;對重癥監(jiān)護者呼吸的壓力、體積曲線用推導機器學習方法進行分析等,表明數(shù)據(jù)挖掘技術在臨床診斷模型中具有良好的分類性能。數(shù)據(jù)挖掘作為中醫(yī)藥現(xiàn)代化研究的重要組成部分,在中醫(yī)診斷學中尤其在中醫(yī)四診客觀化的研究中有著非常廣泛的應用。這種將傳統(tǒng)的研究方法與統(tǒng)計學知識、人工智能技術、數(shù)據(jù)庫技術的有機結合,將是解決大量數(shù)據(jù)難以處理這一研究瓶頸的行之有效的方法,將其運用于中醫(yī)四診的研究中,可促進中醫(yī)診斷學的規(guī)范化研究。3.2在中醫(yī)證候研究的應用中醫(yī)證候的研究關鍵是合理運用方法學。運用現(xiàn)代科學技術和計算機技術,為中醫(yī)證候的研究提供了有力的技術平臺。3.2.2中醫(yī)證候診斷標準及方法的研究袁世宏等[12]以病證結合為前提,以名老中醫(yī)的病案為數(shù)據(jù)源,開展人工神經(jīng)網(wǎng)絡用于冠心病證候診斷標準的模型研究,提出了證候診斷標準建立的方法學,通過模型檢驗證明了該方法的可行性。醫(yī)學界對中醫(yī)證候規(guī)范化研究的方法和手段層出不窮,主要方法有多元分析方法、神經(jīng)網(wǎng)絡方法[13]。多元分析方法主要分為回歸分析法、因子分析法、判別分析法、聚類分析法、相關分析法等。多元分析在中醫(yī)藥研究中,尤其在中醫(yī)證候?qū)W研究方面的應用日趨廣泛并顯現(xiàn)出其重要性。神經(jīng)網(wǎng)絡方法是繼機器學習方法、統(tǒng)計學方法之后的另外一種數(shù)據(jù)挖掘的手段。由于傳統(tǒng)的醫(yī)學統(tǒng)計方法具有局限性,研究者們開始嘗試運用模糊智能技術探索中醫(yī)證候分類及療效評估的方法,并用實驗的方法論證了其方法上的可行性[14]。3.3在針灸處方配伍中的應用針灸處方配伍規(guī)律的研究是中醫(yī)藥現(xiàn)代化研究的重要組成部分,不僅對豐富和發(fā)展針灸學理論具有重要意義,同時也為有效指導臨床用穴組方提供重要依據(jù)。目前在針灸領域運用數(shù)據(jù)挖掘技術的應用較少,尚處于起步階段,其前景廣闊,同時充滿挑戰(zhàn)。用現(xiàn)代科學技術來分析針灸處方,揭示其內(nèi)在的配伍和應用規(guī)律是當前針灸領域研究的熱點問題。如張義等[15]采用數(shù)據(jù)挖掘技術分析腧穴種類、歸經(jīng)及其使用頻次、配伍組合、分部和特定穴分類等,總結出針灸治療中風偏癱的腧穴運用規(guī)律、配伍規(guī)律以及特定穴的運用規(guī)律,為臨床選穴組方提供參考和借鑒。3.4在中藥研究中的應用數(shù)據(jù)挖掘技術應用于中藥現(xiàn)代化中,是計算機技術在中醫(yī)藥現(xiàn)代化中的又一新嘗試。近期,國內(nèi)外學者研究的一個熱點問題就是對中藥復方的研究,在此方面的文獻、論著也較多,取得了一定成績。3.4.1藥對配伍規(guī)律研究數(shù)據(jù)挖掘技術在方劑配伍規(guī)律上的研究有以分類為主的數(shù)據(jù)挖掘研究、以聚類為主的數(shù)據(jù)挖掘研究和以關聯(lián)為主的數(shù)據(jù)挖掘研究等三種模式:這些模式在方劑組方藥物的功效、性味等分類、對方劑的制方要素進行分析、在尋找藥物之間的相互聯(lián)系和整體用藥規(guī)律上都取得了很大的成績[16]。3.4.2中藥指紋圖譜及中藥譜效關系的研究根據(jù)中藥指紋圖譜技術采集手段的差異,一般分為物理圖譜、化學圖譜及物理化學和分子生物學圖譜等多維多息圖譜。中藥指紋圖譜以可量化性、專屬性、重現(xiàn)性和再現(xiàn)性、穩(wěn)定性、完整性和細節(jié)處理的模糊性為主要特點,中藥指紋圖譜分析在中藥材真?zhèn)舞b別、質(zhì)量評價等方面已取得了重大成果,同時為譜效關系的數(shù)據(jù)挖掘打下了堅實的基礎。數(shù)據(jù)挖掘技術是發(fā)現(xiàn)和解析中藥指紋圖譜潛在信息的有力工具,通過對中藥指紋圖譜進行數(shù)據(jù)挖掘可以從中提取隱含的及具有潛在應用價值、最終可理解的信息的過程。其中比較典型的解析方法有模式識別、人工神經(jīng)網(wǎng)絡等[17]。中藥譜效關系是在2001年提出的處于學術前沿、全新的中藥現(xiàn)代化研究思路。譜效關系研究是以中藥指紋圖譜研究為基礎,同時又比指紋圖譜更深入一層的科學研究[18]。一般的譜效關系研究過程包括采用適合的分析方法構建中藥指紋圖譜,并對圖譜標示的成分進行分析;建立適合的藥效評價模型,獲取藥理學數(shù)據(jù);采用數(shù)據(jù)挖掘技術將指紋圖譜數(shù)據(jù)和藥理學數(shù)據(jù)進行關聯(lián),結合中醫(yī)藥專業(yè)知識,建立有意義的譜-效關系。其中分析方法和數(shù)據(jù)挖掘技術是研究譜效關系的重要組成部分。3.4.3開發(fā)新藥中藥經(jīng)歷代醫(yī)藥學家醫(yī)療實踐證明,具有非常明確的性味與功效,從中尋找新的活性成分或先導化合物是開發(fā)創(chuàng)新天然藥物的有效途徑。數(shù)據(jù)挖掘技術在新藥開發(fā)中,增強了在尋找新藥過程中的主動性,避免了盲目性,真正做到了有的放矢。利用數(shù)據(jù)挖掘技術從數(shù)百種、數(shù)千種藥用植物中進行挖掘,可對新藥開發(fā)具有指導、啟發(fā)作用。如陸愛軍等[19]對中藥化學數(shù)據(jù)庫使用關聯(lián)規(guī)則的方法進行挖掘,通過對關聯(lián)規(guī)則的分析、鉆取,得到25個有趣的關聯(lián)規(guī)則,這些關聯(lián)規(guī)則對于相應的研究工作有一定的指導作用。4數(shù)據(jù)挖掘的研究數(shù)據(jù)挖掘作為一個從海量數(shù)據(jù)中獲取知識的有力工具,采用合理的數(shù)據(jù)挖掘模型及算法,能有效地推動了中醫(yī)藥信息化的進程。但中醫(yī)藥領域的數(shù)據(jù)挖掘研究目前尚處于起步階段。同其他研究方法一樣,數(shù)據(jù)挖掘技術并不是萬能的。數(shù)據(jù)挖掘研究結果的準確性受數(shù)據(jù)庫

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論