數(shù)據(jù)可視化在中醫(yī)用藥分析中的應(yīng)用及改進(jìn)策略研究論文設(shè)計(jì)_第1頁
數(shù)據(jù)可視化在中醫(yī)用藥分析中的應(yīng)用及改進(jìn)策略研究論文設(shè)計(jì)_第2頁
數(shù)據(jù)可視化在中醫(yī)用藥分析中的應(yīng)用及改進(jìn)策略研究論文設(shè)計(jì)_第3頁
數(shù)據(jù)可視化在中醫(yī)用藥分析中的應(yīng)用及改進(jìn)策略研究論文設(shè)計(jì)_第4頁
數(shù)據(jù)可視化在中醫(yī)用藥分析中的應(yīng)用及改進(jìn)策略研究論文設(shè)計(jì)_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第1章前言1.1研究背景可視化的理論思想誕生于15至17世紀(jì),自此人們對(duì)數(shù)據(jù)可視化的早期探索正式開始;18世紀(jì),數(shù)據(jù)可視化實(shí)現(xiàn)了初期的發(fā)展,各類圖標(biāo)在人們的視野中出現(xiàn);19世紀(jì)前期,由于工業(yè)的迅速發(fā)展,人們開始發(fā)現(xiàn)數(shù)據(jù)在經(jīng)濟(jì)發(fā)展中的作用,19世紀(jì)后期,隨著第一次工業(yè)革命,數(shù)據(jù)可視化收到了人們廣泛關(guān)注,它的發(fā)展迎來了首個(gè)黃金時(shí)期,圖表和圖形等被廣泛應(yīng)用到人們的生產(chǎn)與生活中;20世紀(jì)前期;早期的數(shù)據(jù)可視化表達(dá)方式已經(jīng)滿足了當(dāng)時(shí)的需求,因而對(duì)于圖表、圖形表達(dá)的研究沒有進(jìn)一步發(fā)展下去;20世紀(jì)中后期直至今天;科技迅猛發(fā)展,以信息科學(xué)與技術(shù)為代表的第三產(chǎn)業(yè)的不斷發(fā)展,數(shù)據(jù)可視化技術(shù)展現(xiàn)出新的生機(jī)與活力,開始進(jìn)入高速發(fā)展階段,并取得了明顯進(jìn)步,越來越多的應(yīng)用到了生產(chǎn)與生活中來。目前,數(shù)據(jù)可視化的展示方式已超過30種,每一種特定的方式都有它的用處。正因?yàn)閿?shù)據(jù)可視化的方法不斷發(fā)展進(jìn)步,我們已經(jīng)不局限于柱狀圖和餅狀圖。數(shù)據(jù)可視化有很多好處,但他們往往因?yàn)槿狈斫舛兴蛔?。需要我們進(jìn)一步進(jìn)行研究和探索。隨著醫(yī)學(xué)的不斷發(fā)展,我國傳統(tǒng)中醫(yī)得到了長足發(fā)展,不斷融入最新的科學(xué)技術(shù),與時(shí)俱進(jìn)。數(shù)據(jù)可視化技術(shù)在中醫(yī)用藥分析中起到了極大的作用,越來越多的中醫(yī)用藥數(shù)據(jù)分析通過數(shù)據(jù)可視化來實(shí)現(xiàn),簡化步驟、提高效率,是促進(jìn)中醫(yī)進(jìn)步的重要?jiǎng)恿Α?.2研究意義隨著不斷增長的信息量,要求人們需要具備更加快捷的信息處理方式,所以人們對(duì)數(shù)據(jù)可視化的需求也大大增加。如今,有三十多種可視化數(shù)據(jù)的方式,每種特定方式都有其用途。隨著可視化方法的不斷發(fā)展,我們不再局限于條形圖和餅圖。數(shù)據(jù)可視化有很多好處,但是由于缺乏了解而常常受到限制。在某些情況下,同一張上的圖表上內(nèi)容過多可能會(huì)導(dǎo)致整個(gè)圖表紛繁紛雜,不便于人們直觀的去理解和使用。我們可以采取用的呈現(xiàn)數(shù)據(jù)的方式有很多,但在大多數(shù)情況下只有少數(shù)幾種適用。本文從數(shù)據(jù)可視化技術(shù)研究和發(fā)展的背景入手,對(duì)數(shù)據(jù)可視化技術(shù)的國內(nèi)外研究現(xiàn)狀進(jìn)行了介紹,對(duì)數(shù)據(jù)可視化與中醫(yī)的相關(guān)性進(jìn)行了分析,對(duì)近些年來所實(shí)現(xiàn)的成果做了介紹。通過R語言實(shí)現(xiàn)數(shù)據(jù)可視化技術(shù)在中藥分析中的靈活、適當(dāng)?shù)膽?yīng)用,以提高可視化技術(shù)在中藥分析中的使用率,為知識(shí)的傳播與交流提供新的途徑,增強(qiáng)知識(shí)密度,提高決策和解決問題的能力。探索中醫(yī)藥與可視化的相關(guān)性,分析其在中醫(yī)藥領(lǐng)域的應(yīng)用,實(shí)現(xiàn)可視化技術(shù)與中醫(yī)藥分析的更好結(jié)合,為中醫(yī)藥的發(fā)展提供更多線索,研究多樣的數(shù)據(jù)可視化展示方式,為中醫(yī)可視化技術(shù)的發(fā)展提供技術(shù)支持。1.3國內(nèi)外研究現(xiàn)狀數(shù)據(jù)可視化技術(shù)是為了改進(jìn)科學(xué)計(jì)算和輔助處理大量數(shù)據(jù)而誕生的,隨之創(chuàng)建了第一個(gè)數(shù)據(jù)可視化視圖,伴隨著信息技術(shù)的快速發(fā)展,產(chǎn)生了大量的沒有經(jīng)過科學(xué)處理的數(shù)據(jù),由于信息過于冗雜,數(shù)據(jù)大都沒有辦法獲得適當(dāng)采用。1987年,美國科學(xué)基金協(xié)會(huì)在一次專題討論會(huì)上提出“科學(xué)計(jì)算可視化”理論,一門嶄新學(xué)科就此誕生,從此,國內(nèi)外掀起了數(shù)據(jù)可視化的熱潮,國內(nèi)也逐步把數(shù)據(jù)可視化技術(shù)與各行各業(yè)相聯(lián)系,中國傳統(tǒng)中醫(yī)也順應(yīng)時(shí)代發(fā)展的潮流融入到了數(shù)據(jù)可視化的領(lǐng)域中來。諾維薩德大學(xué)(2019)進(jìn)行了對(duì)Pacs設(shè)計(jì)中數(shù)據(jù)可視化技術(shù)的實(shí)證研究[1]。圣保羅大學(xué)(2018)在信息可視化領(lǐng)域的發(fā)現(xiàn):用于距離信息的用戶輔助投影技術(shù)[2]。俄勒岡大學(xué)(2018)的研究人員討論了數(shù)據(jù)分析用于模擬、可視化和數(shù)據(jù)分析的數(shù)據(jù)簡化技術(shù)方面的發(fā)現(xiàn)[3].紐約大學(xué)(2018)以圖書館為主導(dǎo)開創(chuàng)了“數(shù)據(jù)可視化診所”,開創(chuàng)了數(shù)據(jù)可視化技術(shù)中的新概念、新思路[4]。孟洪宇等人(2018)從數(shù)據(jù)可視化技術(shù)的發(fā)展歷程入手,對(duì)信息和知識(shí)可視化在本源、理論根本、目的、數(shù)據(jù)可視化目標(biāo)、描述目標(biāo)、方法、參與者類型和互補(bǔ)方法等方向進(jìn)行對(duì)比[5]。單琪媛等人(2019)根據(jù)近年來國內(nèi)和國際中藥質(zhì)譜可視化分析技術(shù)的研究資料,對(duì)質(zhì)譜數(shù)據(jù)的可視化技術(shù)包括在中藥分析中的具體應(yīng)用進(jìn)行詳細(xì)介紹[6]。許茜等人(2019)基于當(dāng)前大數(shù)據(jù)的發(fā)展現(xiàn)狀對(duì)醫(yī)學(xué)數(shù)據(jù)分析的可視化進(jìn)行了進(jìn)一步的探索。楊慧等人(2018)從醫(yī)學(xué)可視化圖像與可視化技術(shù)的專利目前的發(fā)展?fàn)顩r入手對(duì)醫(yī)學(xué)圖像可視化技術(shù)進(jìn)行介紹,并結(jié)合各階段專利申報(bào)量和重要申報(bào)人探究了該項(xiàng)技術(shù)的專利情況,并對(duì)專利的研究前景和研究趨勢(shì)做出總結(jié)[7]。

1.4論文主要研究內(nèi)容本文的主要研究內(nèi)容是對(duì)數(shù)據(jù)可視化的研究背景、研究意義和種類進(jìn)行討論,對(duì)常用的展示方式進(jìn)行討論,進(jìn)一步探索在將數(shù)據(jù)可視化技術(shù)應(yīng)用到中醫(yī)用藥分析過程中對(duì)可視化展示方式的選擇,在綜合先前的研究結(jié)果的基礎(chǔ)上,將調(diào)查研究法、學(xué)術(shù)研究法、信息研究法和實(shí)驗(yàn)法等研究方法與文獻(xiàn)研究法相結(jié)合,通過對(duì)中醫(yī)用藥分析的數(shù)據(jù)可視化展示方式進(jìn)行研究,使得人們掌握和分析中醫(yī)用藥數(shù)據(jù)更加直觀、便捷。1.5關(guān)鍵問題及解決方法本文關(guān)鍵問題是如何在實(shí)驗(yàn)過程中選擇合適的數(shù)據(jù)可視化的展示方式和如何對(duì)選擇的可視化展示方式進(jìn)行合理的處理,選擇合適的數(shù)據(jù)可視化展示方式并不容易,每個(gè)圖表都有其優(yōu)點(diǎn)和局限性,同一類圖表中也會(huì)有不同的分類,需要我們恰當(dāng)?shù)膽?yīng)用。例如,柱狀圖分為一般柱狀圖、分組柱狀圖、堆積柱狀圖、橫線柱狀圖、雙向柱狀圖等。通過對(duì)中醫(yī)用藥分析中產(chǎn)生的數(shù)據(jù)進(jìn)行分析,采用不同的數(shù)據(jù)可視化展示方式,比較不同數(shù)據(jù)可視化展示方式的優(yōu)缺點(diǎn),著重注意圖表的細(xì)節(jié)部分,采用合理的處理方式,提出相應(yīng)的改進(jìn)的策略與方向。1.6論文組織結(jié)構(gòu)本文總共分為6個(gè)章節(jié),第1章是論文的前言,詳細(xì)的介紹了本文的研究意義和背景說明本文完成的意義在于探索中醫(yī)藥與可視化的相關(guān)性,并分析其在中醫(yī)用藥范圍內(nèi)的應(yīng)用及思想理論成果,目的是為我國傳統(tǒng)中醫(yī)發(fā)展和進(jìn)步探索更多的新思路、新技術(shù)、新方法;第2章是數(shù)據(jù)可視化與中醫(yī)的相關(guān)性分析,詳細(xì)介紹了數(shù)據(jù)可視化在中醫(yī)中的應(yīng)用,進(jìn)行數(shù)據(jù)可視化和中醫(yī)的相關(guān)性分析為下一章展示方式的分析做了理論準(zhǔn)備;第3章進(jìn)行了數(shù)據(jù)可視化分析中常用展示方式的優(yōu)缺點(diǎn)對(duì)比,通過舉例直觀的展示了不同展示方式的效果與優(yōu)缺點(diǎn);第4章是基于R語言數(shù)據(jù)可視化技術(shù)的實(shí)現(xiàn),通過R語言實(shí)現(xiàn)中醫(yī)用藥數(shù)據(jù)分析的可視化展示,對(duì)采用的可視化展示方式進(jìn)行分析和總結(jié)。第5章是數(shù)據(jù)可視化展示方式的改進(jìn)策略研究;最后是結(jié)語,總結(jié)全文并提出了未來的展望和可視化技術(shù)的展示方式在今后的發(fā)展方向。第2章數(shù)據(jù)可視化的介紹以及在中醫(yī)領(lǐng)域的應(yīng)用2.1數(shù)據(jù)可視化技術(shù)2.1.1介紹數(shù)據(jù)可視化技術(shù)是指通過信息技術(shù),以圖表的形式將數(shù)據(jù)簡明的呈現(xiàn)出來,并進(jìn)行交互處理的理論、方法和技術(shù)[8]。它可以通過圖表對(duì)大量的數(shù)據(jù)進(jìn)行分析和處理,體現(xiàn)信息模型、變量之間的關(guān)系和變化方向,方便人們對(duì)信息的獲取和利用,便于人們快速的進(jìn)行決策,加強(qiáng)人和各類數(shù)據(jù)的聯(lián)系,探究包含在其中的客觀規(guī)律。數(shù)據(jù)可視化技術(shù)中最根本的觀念是把數(shù)據(jù)庫中的每一項(xiàng)拆分為單個(gè)變量,變量的總和組成一個(gè)可視化的圖表。2.1.2數(shù)據(jù)可視化技術(shù)的主要特點(diǎn)(1)人機(jī)交互,讀者可以更加便利地與數(shù)據(jù)進(jìn)行交互和處理;(2)多維展示,可以從多個(gè)維度看到目標(biāo)變量的屬性,并且可以根據(jù)他們各自的特點(diǎn),對(duì)其歸類、排列、組合和展示[9];(3)可視化展示,數(shù)據(jù)可以根據(jù)需求制作成不同樣式的圖表來進(jìn)行展示[10]。2.2數(shù)據(jù)可視化技術(shù)和中醫(yī)的相關(guān)性分析數(shù)據(jù)可視化技術(shù)中的概念和方法與中醫(yī)有著密不可分的聯(lián)系:數(shù)據(jù)可視化技術(shù)能夠?qū)A康闹嗅t(yī)信息進(jìn)行分析,進(jìn)而詳細(xì)的分類和整理,把醫(yī)學(xué)數(shù)據(jù)進(jìn)行可視化展示,有利于更好的對(duì)醫(yī)學(xué)信息進(jìn)行解讀和對(duì)未來將會(huì)產(chǎn)生的信息進(jìn)行估計(jì)。同時(shí)中醫(yī)在我國發(fā)展歷史悠久,信息的體量也會(huì)十分龐大,體系之多,信息之雜,是人無法簡單的用肉眼去進(jìn)行辨別分析的,給醫(yī)學(xué)者進(jìn)行醫(yī)學(xué)研究和用藥分析等帶來了極大的困擾,但是通過采用數(shù)據(jù)可視化技術(shù),為我們研究龐大信息中的內(nèi)在關(guān)聯(lián)和其所含的價(jià)值提供了便利,使中醫(yī)用藥更加合理和適當(dāng)。數(shù)據(jù)可視化技術(shù)對(duì)研究對(duì)象知識(shí)類型的分類。第一類是顯性知識(shí)型,第二類是隱形知識(shí)型。他們?cè)谥嗅t(yī)研究中起到了不同的作用,第一類為中醫(yī)基本原理等的掌握,望、聞、問、切四種診察疾病方法后信息的收集與整理,用藥的判斷和采納,遣方用藥思路,經(jīng)絡(luò)治療配穴方法等,數(shù)據(jù)可視化技術(shù)可以將數(shù)據(jù)轉(zhuǎn)化為方便人們理解的圖形,便于醫(yī)者進(jìn)行信息理解和新思路的開創(chuàng)。第二類為我國中醫(yī)的傳承起到了重要作用,中醫(yī)在歷史經(jīng)驗(yàn)和思路中存在著大量的隱性知識(shí)信息,而這些寶貴的信息由于太過龐大不利于我國中醫(yī)的傳承、發(fā)揚(yáng)與進(jìn)步,數(shù)據(jù)可視化可以把第一類知識(shí)類型轉(zhuǎn)化為第二類知識(shí)類型,提高人們對(duì)中醫(yī)隱形知識(shí)的關(guān)注度,為中醫(yī)的傳承提供了新途徑、新方法,進(jìn)一步方便了醫(yī)學(xué)研究者的對(duì)病情的分析與判斷。我國的傳統(tǒng)中醫(yī)在不斷的發(fā)展中形成了規(guī)模大、內(nèi)容完善的理論體系,包含了復(fù)雜且繁多的知識(shí)與信息。例如,傳統(tǒng)中醫(yī)基本原理所包含的數(shù)據(jù)可視化技術(shù)的對(duì)象以及與之相關(guān)聯(lián)的基本概念,存在著大量的一維信息;傳統(tǒng)中醫(yī)的陰陽調(diào)和中又蘊(yùn)含著二維信息;臟腑位置以及體表投影的相關(guān)性展現(xiàn)的是統(tǒng)一體的觀念,同時(shí)也從另一方面展現(xiàn)了三維映射的關(guān)聯(lián);中醫(yī)基礎(chǔ)原理中所涉及到的的精、氣、血、津液學(xué)說等都是多維信息的表現(xiàn)。2.3數(shù)據(jù)可視化技術(shù)在中醫(yī)中的應(yīng)用Flash的使用使中醫(yī)藏象理論系統(tǒng)的可視化教學(xué)方式發(fā)生了改變[11];中醫(yī)藏象理論歷史悠久,其理論淵源于我國傳統(tǒng)文化,具有非常豐富的歷史文化內(nèi)涵,內(nèi)容十分廣泛,嚴(yán)謹(jǐn)又復(fù)雜。Flash能夠生動(dòng)形象的展示中醫(yī)理論內(nèi)涵;通過對(duì)教學(xué)方法的不斷研究與創(chuàng)新改革教學(xué)方法使中醫(yī)能夠生動(dòng)、輕松地理解“藏象理論”的抽象性和含糊不清的知識(shí),使它更具有準(zhǔn)確性和系統(tǒng)性?;贑iteSpaces對(duì)中醫(yī)體質(zhì)學(xué)說知識(shí)圖譜進(jìn)行可視化分析和展示[12]:它的目的是對(duì)“中醫(yī)體質(zhì)”進(jìn)行系統(tǒng)的文獻(xiàn)計(jì)量學(xué)和視覺分析,探尋40多年來中醫(yī)體質(zhì)的發(fā)展變化情況,對(duì)需要我們?nèi)ブ攸c(diǎn)關(guān)注的方向和未來的發(fā)展趨勢(shì)進(jìn)行研究與討論。采用的方法主要是以1975年至2017年CNKI收集的所有相關(guān)文獻(xiàn)為對(duì)象,進(jìn)行定量分析。同時(shí),使用CiteSpace5.1對(duì)文獻(xiàn)中的機(jī)構(gòu)和關(guān)鍵字進(jìn)行共現(xiàn)分析,并繪制相關(guān)的視覺圖。結(jié)果,總共查詢到了了5882篇文章,通過定量分析,訪問了一個(gè)高產(chǎn)機(jī)構(gòu)和代表性研究人員及其團(tuán)隊(duì),通過視覺分析,“中醫(yī)體質(zhì)識(shí)別”,“糖尿病”和“危險(xiǎn)因素”是其中出現(xiàn)次數(shù)最多。結(jié)論:圖譜引領(lǐng)了這一領(lǐng)域的發(fā)展趨勢(shì),并找到了研究熱點(diǎn),研究疾病的治療方法和危險(xiǎn)因素是今后體質(zhì)研究的重要方向。中國古代中醫(yī)傳統(tǒng)針灸銅人的可視化探索[13]:3D激光掃描為解決針灸銅人等文化遺產(chǎn)單一的數(shù)字保護(hù)手段,經(jīng)驗(yàn)不足,傳播力弱的問題提供了新手段新方法,這種方法又分為3D可視化和VR技術(shù)的數(shù)字化方法。以穴位青銅針灸舉例說明,它第一次將3D激光掃描技術(shù)用于數(shù)據(jù)采集和3D模型的建立。其次,XML語言被應(yīng)用于中醫(yī)用藥知識(shí)的表現(xiàn)和儲(chǔ)存。同時(shí),他們對(duì)二次誤差度量和漸進(jìn)網(wǎng)格算法進(jìn)行優(yōu)化用于自動(dòng)生成針灸銅人多分辨率簡化模型。最后,使用Unity引擎研發(fā)了一套VR針灸青銅人互動(dòng)顯示系統(tǒng),可以實(shí)現(xiàn)3D場(chǎng)景中穴位,經(jīng)絡(luò),常見病等中醫(yī)知識(shí)的快速可視化和互動(dòng)查詢,為歷史文物和非物質(zhì)文化遺產(chǎn)的數(shù)字保護(hù)和傳播提供參考。基于脈搏脈沖信息獲取的中醫(yī)脈診數(shù)字化與可視化研究[14]:脈診信息模糊不清,無法量化和主觀判斷,對(duì)保持中醫(yī)診斷的客觀性造成了困難。目前,中國傳統(tǒng)脈息診斷儀的類似特征是在一維記錄脈壓波動(dòng)信號(hào)。因此,獲得的脈沖診斷信號(hào)的特征參數(shù)不足以完全體現(xiàn)傳統(tǒng)脈沖中包含的所有信息。在文獻(xiàn)綜述和脈搏診斷經(jīng)驗(yàn)總結(jié)的基礎(chǔ)上,本研究運(yùn)用現(xiàn)代科學(xué)技術(shù)手段,研究了中醫(yī)脈搏診斷信息采集的關(guān)鍵技術(shù)。本文突破了僅從“脈沖位置和脈沖數(shù)”分析單個(gè)信號(hào)特征參數(shù)的缺點(diǎn)。在理論和技術(shù)的指導(dǎo)和支持下,成功實(shí)現(xiàn)了多維脈沖信息的同步采集,并著重強(qiáng)調(diào)了“脈沖形狀和脈沖電位”的信息采集和表達(dá)。在數(shù)字仿真和重構(gòu)四個(gè)脈沖診斷屬性的基礎(chǔ)上,觸覺信息可視化的階段性工作已經(jīng)初步完成。第3章數(shù)據(jù)可視化的主要展示方式和中醫(yī)藥特點(diǎn)分析3.1引言數(shù)據(jù)可視化展示是指通過借助抽象化的技術(shù)手段,將復(fù)雜的數(shù)據(jù)用圖表的方式呈現(xiàn),有效的可視化背后的主要原則是能夠突出你要表現(xiàn)的核心問題,根據(jù)觀眾的需求和接受程度,對(duì)數(shù)據(jù)實(shí)現(xiàn)精確的呈現(xiàn),并且傳造出能夠清晰傳達(dá)信息的而可視化結(jié)果,本章的主要工作是進(jìn)行數(shù)據(jù)可視化分析中常用展示方式的對(duì)比和優(yōu)缺點(diǎn)分析。3.2基本圖形分析1.條形圖,又稱條形統(tǒng)計(jì)圖優(yōu)點(diǎn):可以清楚的反映數(shù)量,便于比較。缺點(diǎn):統(tǒng)計(jì)的類別比較少,比較單調(diào)。簡介:條形圖是長度的單位,代表著數(shù)量的多少,根據(jù)數(shù)量的多少繪制成不同長度的直條,然后按順序排列這些直條。從條形圖可以很容易地看到各種數(shù)字。條形圖通常稱為條形圖,也稱為條形圖或直條形圖。分類:條形統(tǒng)計(jì)圖分為:單式條形統(tǒng)計(jì)圖和復(fù)式條形統(tǒng)計(jì)圖,前者只表示1個(gè)項(xiàng)目的數(shù)據(jù),后者可以同時(shí)表示多個(gè)項(xiàng)目的數(shù)據(jù)。頻數(shù):頻數(shù)是數(shù)據(jù)分布在不同區(qū)域內(nèi)的個(gè)數(shù)。頻率:頻數(shù)與數(shù)據(jù)總和的比例為頻率,頻率×100%就是百分比。舉例:圖3-1條形圖2.餅圖優(yōu)點(diǎn):能夠清楚的表示各個(gè)部分占總體的比例情況。缺點(diǎn):肉眼對(duì)面積大小不敏感。簡介:餅圖是統(tǒng)計(jì)學(xué)中的常用圖表,往往只有一個(gè)數(shù)據(jù)系列,區(qū)域的大小代表了再綜合中的比率。分類:餅圖和三維餅圖;復(fù)合餅圖和復(fù)合條形圖;單獨(dú)的餅圖和單獨(dú)的三維餅圖:單獨(dú)的餅圖顯示每個(gè)值相對(duì)于總值的大小,同時(shí)強(qiáng)調(diào)每個(gè)值。分離的餅圖可以以三維格式顯示。這樣,扇面可以手動(dòng)拉出。舉例:圖3-2年齡分布餅圖3.直方圖優(yōu)點(diǎn):更直觀的傳遞過程質(zhì)量狀態(tài)信息;在對(duì)質(zhì)量的變化進(jìn)行研究之后,我們可以控制過程的狀態(tài),并決定將我們的精力更多的集中在提高質(zhì)量上。缺點(diǎn):無法輕松的找到問題的重點(diǎn)現(xiàn)象。簡介:直方圖,又稱質(zhì)量分布圖,是一種統(tǒng)計(jì)報(bào)表圖形,其數(shù)據(jù)分布由一系列不同高度的垂直條紋或線段來表示。橫軸常用于表示數(shù)據(jù)的類型,縱軸常用于表示數(shù)據(jù)的分布。直方圖是對(duì)連續(xù)變量概率分布的估計(jì),由卡爾·皮爾遜首次提出。這是一個(gè)條形圖。要建立直方圖,首先要分割數(shù)值范圍,簡單地說就是將整個(gè)數(shù)值范圍劃分不同的區(qū)間,然后計(jì)算每個(gè)區(qū)間中數(shù)值的多少。直方圖也可以被歸一化以顯示“相對(duì)”頻率。舉例:圖3-3直方圖4.樹狀圖優(yōu)點(diǎn):比較直觀,易于理解。缺點(diǎn):不適用于較大范圍的情況。介紹:樹形圖,也叫樹狀圖。樹圖是數(shù)據(jù)樹的圖形表示形式,它以父-子層次結(jié)構(gòu)組織對(duì)象。分類:為根據(jù)分支,關(guān)系可以被表示,其具有二維和三維維度。數(shù)量分類學(xué)中用于表型分類的樹形圖稱為現(xiàn)象圖,與系統(tǒng)推理相混合的樹形圖稱為分支圖進(jìn)行區(qū)分。表型樹圖是根據(jù)群體分析繪制的,而系統(tǒng)樹圖是由計(jì)算機(jī)根據(jù)模擬的假設(shè)字符進(jìn)化方向繪制的。舉例:圖3-4聚類樹狀圖5.網(wǎng)狀圖優(yōu)點(diǎn):明確表達(dá)事物之間的邏輯關(guān)系,選定關(guān)鍵工作和關(guān)鍵路徑。缺點(diǎn):進(jìn)度狀況不能一目了然,繪圖難度和修改工作量很大,應(yīng)用要求高,繪圖識(shí)別困難。介紹:網(wǎng)狀圖是一種具有網(wǎng)絡(luò)形狀的圖形化模型,因此被稱為網(wǎng)狀圖。網(wǎng)狀圖通常用來表示事物之間的聯(lián)系程度。分類:雙代號(hào)網(wǎng)狀圖使用箭頭線表示一個(gè)活動(dòng),活動(dòng)的名稱寫在箭頭線上。箭頭表示活動(dòng)的結(jié)束。單代號(hào)網(wǎng)狀圖用圓圈表示單個(gè)網(wǎng)狀圖中的一個(gè)活動(dòng),并在圓圈中寫上該活動(dòng)的名稱。箭頭線用于表示相關(guān)活動(dòng)之間的前后次序,沒有其他含義。由于它的活動(dòng)只能用一個(gè)符號(hào)表示,所以它被稱為單代碼網(wǎng)狀圖。舉例:圖3-5網(wǎng)狀圖3.3中醫(yī)藥信息特點(diǎn)分析我國中醫(yī)藥信息具備三大特點(diǎn):1.傳統(tǒng)性我國傳統(tǒng)中醫(yī)發(fā)展歷史悠久,數(shù)量巨大,大量的中醫(yī)用藥數(shù)據(jù)在歷史的發(fā)展中得以保留,自戰(zhàn)國時(shí)期直至建國以前有記錄的中醫(yī)藥書籍就超過一萬多種,而在民間廣泛流傳的不同時(shí)期的不同版本更是接近四萬種,同時(shí)還存在著無法實(shí)際考證的書籍,如此龐大的數(shù)據(jù)體量帶來的是難以考證和無法處理。中藥藥方分析困難,對(duì)未來中醫(yī)發(fā)展的延續(xù)性造成了阻礙。2.民族性我國有56個(gè)民族,各個(gè)民族都在長期的歷史發(fā)展中形成了各自的文化,中醫(yī)藥也在各民族的努力中不斷發(fā)展,但恰恰由于各民族文化差異,中醫(yī)用藥方法也出現(xiàn)了差別,收集整理工作成為了極為重要的部分。3.世界性隨著世界醫(yī)療水平的發(fā)展,我國傳統(tǒng)中醫(yī)進(jìn)入到了國際化的階段,中醫(yī)用藥數(shù)據(jù)需要經(jīng)過合理的處理和加工才能更便于國際化的發(fā)展。3.4小結(jié)上述展示的可視化展示方式中,最常用的是條形圖和餅圖,它們的結(jié)構(gòu)都十分簡單,即使讀者不具備較高的知識(shí)水平也能夠輕松閱讀。結(jié)合我國傳統(tǒng)中醫(yī)目前的發(fā)展現(xiàn)狀,根據(jù)上述幾類數(shù)據(jù)可視化展示方式的優(yōu)缺點(diǎn)分析,大多數(shù)可視化方式都能夠應(yīng)用到中醫(yī)用藥分析中,但是根據(jù)中醫(yī)用藥數(shù)據(jù)的特點(diǎn),比較適合采用的有條形圖、網(wǎng)狀圖、樹狀圖等,它們既能對(duì)中醫(yī)用藥中的數(shù)據(jù)比例、使用頻次進(jìn)行展示,又能明顯的展示出各類中藥材之間的聯(lián)系。第4章基于R語言數(shù)據(jù)可視化技術(shù)的實(shí)現(xiàn)4.1引言數(shù)據(jù)可視化的本質(zhì)是將大量的數(shù)據(jù)進(jìn)行合理的規(guī)劃和處理,使數(shù)據(jù)的表現(xiàn)形式由復(fù)雜到簡單,其根本意義是利用數(shù)據(jù)做出決策。可視化的工具種類較多,本文是基于R語言進(jìn)行數(shù)據(jù)可視化技術(shù)的實(shí)現(xiàn),通過R語言實(shí)現(xiàn)中醫(yī)藥數(shù)據(jù)分析的可視化展示。4.2可視化工具介紹R語言被使用于統(tǒng)計(jì)計(jì)算、繪制圖表、數(shù)據(jù)挖掘的軟件中,它的創(chuàng)始人是新西蘭奧克蘭大學(xué)。目前由R語言開發(fā)核心團(tuán)隊(duì)開發(fā),在數(shù)據(jù)統(tǒng)計(jì)分析、繪圖等領(lǐng)域的應(yīng)用廣泛。R軟件的語言環(huán)境能夠?yàn)橛脩舻膫€(gè)性化設(shè)計(jì)提供極大的便利,并且是免費(fèi)、開源的軟件,再國內(nèi)和國外廣受歡迎。R語言的三大繪圖系統(tǒng):基本繪圖系統(tǒng)(BasePlottingSystem):需要事先計(jì)劃;能夠直接地及時(shí)反映繪圖與分析數(shù)據(jù)的邏輯圖+修飾常用于繪制2D圖。Lattice繪圖系統(tǒng)(LatticePlottingSystem):簡單的成圖方式適用于觀察變量之間的交互:ggplot2繪圖系統(tǒng)(ggplotwPlottingSystem):能夠把圖和數(shù)據(jù)之間進(jìn)行分離。4.3實(shí)驗(yàn)數(shù)據(jù)本實(shí)驗(yàn)數(shù)據(jù)來源于中藥抗病毒方藥數(shù)據(jù)平臺(tái),包含726種中藥藥品,36種針對(duì)病毒性肺炎的方劑,本文選取其中15種藥品進(jìn)行數(shù)據(jù)可視化展示,根據(jù)他們的藥物組合、關(guān)聯(lián)規(guī)則、藥物頻次,以柱狀圖、網(wǎng)狀圖、樹狀圖為例進(jìn)行可視化分析。表4-1關(guān)聯(lián)規(guī)則No.中藥名稱置信度1桔梗,金銀花,杏仁->連翹12金銀花,杏仁,桔梗->連翹13石膏,杏仁->麻黃14麻黃,石膏->杏仁15石膏,甘草,杏仁->麻黃16石膏,杏仁,甘草->麻黃17麻黃,桔梗->杏仁18麻黃,甘草->杏仁0.93759甘草,麻黃->杏仁0.937510桔梗,甘草->杏仁0.90909111甘草,桔梗->杏仁0.90909112桔梗,金銀花->連翹0.913金銀花,桔梗->連翹0.914前胡->杏仁0.88888915石膏->麻黃0.88888916石膏->杏仁0.88888917生石膏,金銀花->杏仁0.88888918麻黃,生石膏->杏仁0.88888919陳皮->金銀花0.87520生石膏->杏仁0.85714321魚腥草,生石膏->杏仁0.85714322生石膏,魚腥草->金銀花0.85714323金銀花,大青葉->連翹0.85714324甘草,石膏->麻黃0.857143表4-2藥物頻次No.中藥名稱用藥頻次1杏仁352甘草283金銀花274麻黃255連翹246桔梗197魚腥草168生石膏149大青葉1010前胡911北沙參912板藍(lán)根913石膏914葶藶子915陳皮84.4實(shí)驗(yàn)過程本文主要采用的工具包主要有tidyverse包、ggplot2包、networkD3包、stringr包、picante包、ape包。1.柱形圖:name2<-"pinci.txt"pinci2<-read.table(name2,sep="\t",header=1)view(pinci2)data_pinci2<-data.frame(pinci2)data_pinci2<-data_pinci2[c(1:15),]ggplot(data_pinci2,aes(data_pinci2$藥物名稱,data_pinci2$頻次))+geom_bar(stat="identity",aes(fill=data_pinci2$藥物名稱))+labs(x="藥物名稱",y="頻次",fill="藥物名稱")ggsave(file="藥物頻次.png")2.網(wǎng)狀圖:name_guize<-"guize.txt"guize1<-read.table(name_guize,sep="\t",header=1)#View(guize1)data_guize<-data.frame(guize1)data_guize1<-data_guize%>%mutate(長度=str_length(data_guize$藥物關(guān)聯(lián)規(guī)則),藥物1=str_sub(data_guize$藥物關(guān)聯(lián)規(guī)則,1,3),藥物2=str_sub(data_guize$藥物關(guān)聯(lián)規(guī)則,1,3),藥物3=str_sub(data_guize$藥物關(guān)聯(lián)規(guī)則,1,3),關(guān)聯(lián)藥物=str_sub(data_guize$藥物關(guān)聯(lián)規(guī)則,1,3))#view(data_guize1)data_guize1$藥物1[c(1)]<-c(str_sub(data_guize$藥物關(guān)聯(lián)規(guī)則,1,3)[c(1)])for(iin1:length(data_guize1$長度)){if(data_guize1$長度[i]==22){data_guize1$藥物1[c(i)]<-str_sub(data_guize$藥物關(guān)聯(lián)規(guī)則,1,3)[c(i)]data_guize1$藥物2[c(i)]<-str_sub(data_guize$藥物關(guān)聯(lián)規(guī)則,7,9)[c(i)]data_guize1$藥物3[c(i)]<-str_sub(data_guize$藥物關(guān)聯(lián)規(guī)則,13,15)[c(i)]data_guize1$關(guān)聯(lián)藥物[c(i)]=str_sub(data_guize$藥物關(guān)聯(lián)規(guī)則,19,22)[c(i)]}elseif(data_guize1$長度[i]==16){data_guize1$藥物1[c(i)]<-str_sub(data_guize$藥物關(guān)聯(lián)規(guī)則,1,3)[c(i)]data_guize1$藥物2[c(i)]<-str_sub(data_guize$藥物關(guān)聯(lián)規(guī)則,7,9)[c(i)]data_guize1$藥物3[c(i)]<-NAdata_guize1$關(guān)聯(lián)藥物[c(i)]<-str_sub(data_guize$藥物關(guān)聯(lián)規(guī)則,13,16)[c(i)]}elseif(data_guize1$長度[i]==10){data_guize1$藥物1[c(i)]<-str_sub(data_guize$藥物關(guān)聯(lián)規(guī)則,1,3)[c(i)]data_guize1$藥物2[c(i)]<-NAdata_guize1$藥物3[c(i)]<-NAdata_guize1$關(guān)聯(lián)藥物[c(i)]<-str_sub(data_guize$藥物關(guān)聯(lián)規(guī)則,7,10)[c(i)]}}#View(data_guize1)data_guize2<-tibble(藥物=list(c(data_guize1$藥物1,data_guize1$藥物2,data_guize1$藥物3)),關(guān)聯(lián)藥物=list(rep(data_guize1$關(guān)聯(lián)藥物,times=3)))#View(data_guize2)networkdata<-data.frame(data_guize2$藥物[[1]][!is.na(data_guize2$藥物[[1]])],data_guize2$關(guān)聯(lián)藥物[[1]][!is.na(data_guize2$藥物[[1]])])simpleNetwork(networkdata,zoom=T,fontFamily="黑體",fontSize=20,width=1200,height=500,linkColour="black",nodeColour="black",linkDistance=200)3.樹狀圖:data_shu<-data_pinci2view(data_shu)s(data_shu)<-data_shu$藥物名稱data_shu1<-hclust(dist(data_shu),method="median")plot(data_shu1,hang=0.3,cex=1,xlab="藥物名稱",ylab="頻次",main="聚類樹狀圖")plot(as.phylo(data_shu1),type="fan")4.5實(shí)驗(yàn)效果柱形圖圖4-1柱形圖2.網(wǎng)狀圖圖4-2網(wǎng)狀圖樹狀圖圖4-3樹狀圖4.5實(shí)驗(yàn)總結(jié)(1)柱狀圖:對(duì)這十五種藥品的使用頻次采用的是柱狀圖的表現(xiàn)形式,并采用了不同的色彩使它們之間的差異更加明顯,可以直觀的看出杏仁的使用頻次最多而陳皮的使用頻次最少。(2)網(wǎng)狀圖:對(duì)這十五種藥品的關(guān)聯(lián)規(guī)則采用的是網(wǎng)狀圖的表現(xiàn)形式,呈網(wǎng)狀表現(xiàn)出來,很容易讓人發(fā)現(xiàn)其中的焦點(diǎn),可以直觀的看出與杏仁的相關(guān)的藥品最多而與陳皮、大青葉、前胡、黃麻相關(guān)藥品的使用頻次最少。(3)樹狀圖:對(duì)這十五種藥品的頻次采用的是聚類樹狀圖的表現(xiàn)形式,呈樹狀表現(xiàn)出來,很容易讓人對(duì)其進(jìn)行分類,可以直觀的看出哪幾類能夠分為一組,同時(shí)可以根據(jù)自己的需求進(jìn)行分群。柱狀圖和樹狀圖擅于展示各類藥品之間的數(shù)量關(guān)系,能夠十分簡潔明了的將藥品的頻次表現(xiàn)出來,通過不同的顏色加深視覺效果也進(jìn)行了引導(dǎo)性的分類,柱狀圖由于自身的簡潔性也便于進(jìn)行標(biāo)注,方便對(duì)比,具有普適性。網(wǎng)狀圖則擅于表現(xiàn)各個(gè)藥品之間的關(guān)聯(lián)程度,但是較為復(fù)雜,需要具備一定的知識(shí)背景。實(shí)驗(yàn)所展現(xiàn)的可視化展示方式,是十分基礎(chǔ)的展示方式,僅能夠滿足人們的正常使用,如果對(duì)數(shù)據(jù)可視化展示方式有更高的要求則需要進(jìn)一步的優(yōu)化。數(shù)據(jù)可視化展示方式改進(jìn)策略研究5.1引言可視化展示方式的選擇決定能否將數(shù)據(jù)良好的呈現(xiàn),而一個(gè)好的可視化展示方式,在科技快速發(fā)展的今天也會(huì)逐漸暴露出缺陷,可視化視圖的改進(jìn)就變得尤為重要,一個(gè)好的視圖能夠吸引人們的注意力,促進(jìn)深入理解,快速幫助人們進(jìn)行決策,本章從可視化視圖入手進(jìn)行改進(jìn)。5.2改進(jìn)策略1.對(duì)比數(shù)據(jù)可視化使比較更容易,并使我們能夠直觀地看到兩個(gè)不同的數(shù)據(jù)集之間的差異。但是僅僅將兩張圖表并排放置進(jìn)行比較并不一定能實(shí)現(xiàn)這個(gè)目標(biāo)。在實(shí)際操作中,它可能會(huì)變得更加混亂。方法:(1)盡可能地包括零基線。從零基線開始雖然不是很折線圖的必備要素,但如果它提供了更多的比較背景,則應(yīng)該包括在內(nèi)。如果數(shù)據(jù)中呈現(xiàn)出的較小波動(dòng)是有用的,可以通過截?cái)啾嚷蕘硗癸@差異。(2)選擇最優(yōu)的可視化展示方式。如果對(duì)視覺一致性有一定的需求,需要讓讀者更方便的進(jìn)行比較。我們就需要從折線圖、條形圖等便于比較的圖表中進(jìn)行選擇。我們要始終把便于讀者的比較和了解放在第一位。圖4-4餅圖和條形圖效果對(duì)比2.顏色

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論