從中醫(yī)古籍?dāng)?shù)據(jù)庫建設(shè)看中醫(yī)古籍?dāng)?shù)字化_第1頁
從中醫(yī)古籍?dāng)?shù)據(jù)庫建設(shè)看中醫(yī)古籍?dāng)?shù)字化_第2頁
從中醫(yī)古籍?dāng)?shù)據(jù)庫建設(shè)看中醫(yī)古籍?dāng)?shù)字化_第3頁
從中醫(yī)古籍?dāng)?shù)據(jù)庫建設(shè)看中醫(yī)古籍?dāng)?shù)字化_第4頁
從中醫(yī)古籍?dāng)?shù)據(jù)庫建設(shè)看中醫(yī)古籍?dāng)?shù)字化_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、從中醫(yī)古籍?dāng)?shù)據(jù)庫建立看中醫(yī)古籍?dāng)?shù)字化李兵,劉國正,符永馳,裘儉,張偉娜【關(guān)鍵詞】中醫(yī)古籍;數(shù)字化;古籍?dāng)?shù)據(jù)庫中醫(yī)古籍是中醫(yī)藥學(xué)傳承和生長的載體,既具有緊張的學(xué)術(shù)代價,又具有相稱的文物代價。最新出書的?中國中醫(yī)古籍總目?共收錄中醫(yī)古籍13455種,根本上反響了當(dāng)前我國中醫(yī)古籍的存世和漫衍近況。如安在庇護的底子上更好地利用這些貴重的中醫(yī)藥資源是中醫(yī)藥研究職員的汗青任務(wù)。通過數(shù)字化處置懲罰,既實現(xiàn)了對中醫(yī)古籍的永世保存,又可為便利、快捷、無損地開拓和利用這些名貴資源搭建起研究平臺。中國中醫(yī)科學(xué)院中醫(yī)藥信息研究所自2002年始,對館藏中醫(yī)文籍舉行了數(shù)字化再生性庇護和利用研究,如今,已建成“中醫(yī)藥珍善本

2、古籍多媒體數(shù)據(jù)庫、“中醫(yī)藥古籍資源數(shù)據(jù)庫,實現(xiàn)了部門中醫(yī)古籍的數(shù)字化庇護與利用。1“中醫(yī)藥古籍資源數(shù)據(jù)庫建立1.1研究配景中醫(yī)古籍是中華民族幾千年來防病治病名貴履歷的結(jié)晶,是中華民族的良好文化遺產(chǎn)。中醫(yī)藥古籍文獻中所收載的理法方藥、養(yǎng)生保健知識是取之不勁用之不竭的寶庫,具有極高的有用代價。古籍屬于不成再生的文化資源,比年來,只管我國加大了對付古籍的庇護力度,使古籍的保存情況得到改進,但隨著汗青的推進,古籍照舊會悄無聲氣、不成制止地出現(xiàn)損毀,以致滅亡。中醫(yī)古籍團體保存情況較差,各藏館保存條件良莠不一,中醫(yī)古籍庇護和傳承令人擔(dān)憂。鑒于此,用數(shù)字化本領(lǐng)對中醫(yī)古籍舉行處置懲罰,既可以使中醫(yī)古籍的原圖原

3、貌永世保存,又可以通過數(shù)據(jù)庫和網(wǎng)絡(luò)普及利用,制止閱讀原書對古籍造成的損傷。因此,中醫(yī)古籍?dāng)?shù)字化是中醫(yī)古籍庇護和利用的抱負方法。中國中醫(yī)科學(xué)院圖書館所藏中醫(yī)古籍占存世中醫(yī)古籍?dāng)?shù)目的一半以上,此中中醫(yī)珍善本古籍就達2萬余冊。中國中醫(yī)科學(xué)院中醫(yī)藥信息研究所利用該資源上風(fēng),構(gòu)建了“中醫(yī)藥古籍資源數(shù)據(jù)庫,現(xiàn)已收錄1500種中醫(yī)古籍的元數(shù)據(jù)信息和此中的850種中醫(yī)古籍的原文圖像,已經(jīng)可以通過中醫(yī)古籍閱覽體系實現(xiàn)電子閱覽,為中醫(yī)古籍?dāng)?shù)字化庇護和利用開拓了途徑。1.2“中醫(yī)藥古籍資源數(shù)據(jù)庫建庫流程按照中醫(yī)古籍的年代、版本代價、文獻代價、庇護品級等確定收錄尺度,對破壞嚴峻的珍善本古籍優(yōu)先舉行數(shù)字化處置懲罰。思量

4、到對古籍的再生性庇護,我們以古籍原文圖像作為重要數(shù)據(jù)泉源,部門古籍實現(xiàn)全文本化。由于圖像要求的存儲空間較大,我們接納支持多媒體數(shù)據(jù)的rale9i數(shù)據(jù)庫體系,并對體系布局舉行優(yōu)化,根本辦理了運行速率題目。按照古籍文獻的特點,按中醫(yī)古籍的分類、題名、責(zé)任者、出書年代、出書者、版本項、版式、卷數(shù)、館藏地、冊本特性、保存狀態(tài)、復(fù)制狀態(tài)等舉行著錄,著錄規(guī)矩拜見“我國數(shù)字圖書館尺度范例建立工程研究結(jié)果古籍元數(shù)據(jù)著錄規(guī)矩(dls-s05-014),對收錄古籍撰寫提要,力圖創(chuàng)立完備的古籍書目數(shù)據(jù)庫。包羅古籍的掃描、質(zhì)檢、圖像處置懲罰、文本錄入等。為實現(xiàn)保存和利用雙重目的,掃描時接納全彩形式,300dpi,jp

5、eg格式保存,按頁碼挨次重定名,對掃描后圖像的挨次、偏歪度、完備性、清楚度舉行查抄,并舉行糾偏、去污、裁邊等處置懲罰。對部門古籍舉行文本錄入,實現(xiàn)圖文比較。接納自主開拓的古籍編纂器對文中有用的檢索點舉行抽取和xl格式標引,如病證方藥的名稱、索引信息、各級標題等,力圖實現(xiàn)圖像的全文檢索,制止標引過繁或過簡,影響檢索結(jié)果。對標引后數(shù)據(jù)舉行考核。將圖像數(shù)據(jù)、元數(shù)據(jù)、標引數(shù)據(jù)、文本數(shù)據(jù)合成、入庫,形成中醫(yī)古籍電子書,公布到閱覽體系后舉行數(shù)據(jù)庫測試,實現(xiàn)中醫(yī)古籍的數(shù)字化庇護與利用。1.3接納技能數(shù)據(jù)庫接納rale9i,數(shù)據(jù)搜刮接納raletext技能。整個體系接納基于java的eb應(yīng)用技能,結(jié)合基于j2

6、ee的struts和實現(xiàn)數(shù)據(jù)長期化的hibernate框架的v方案形式,構(gòu)建了高內(nèi)聚、弱藕合、可維護和可擴展的中醫(yī)古籍?dāng)?shù)字化體系1。2中醫(yī)古籍?dāng)?shù)字化存在的停滯2.1中醫(yī)古籍中生僻漢字的處置懲罰漢字從產(chǎn)生至今履歷了漫長的演變歷程,由此也產(chǎn)生了大量的繁簡字、異體字、古今字、通假字等。中醫(yī)古籍?dāng)?shù)字化歷程中碰到的字體停滯有兩個方面,一個是對字體的認知停滯,生僻漢字的正確錄入必要很深的中醫(yī)文獻學(xué)功底,而對付一樣平常的操縱職員很難辦到;一個是技能停滯,unide字符集固然可以辦理字庫題目,但是很多軟件不支持,常用的輸入法和搜刮引擎不支持大字符集,很多生僻字仍不克不及準確表現(xiàn)和檢索。用造字的要領(lǐng)費時費力,并

7、且很難共享和檢索,生僻漢字的處置懲罰還是中醫(yī)古籍?dāng)?shù)字化歷程中的一大停滯。2.2天下古籍?dāng)?shù)字化尺度尚待創(chuàng)立如今,固然到場中醫(yī)古籍?dāng)?shù)字化事情的單元較多,但險些都處于各自為戰(zhàn)的狀態(tài),所接納的途徑多樣,因此產(chǎn)生的數(shù)字化結(jié)果情勢多樣,倒霉于中醫(yī)古籍?dāng)?shù)字化生長,也倒霉于中醫(yī)古籍?dāng)?shù)字化資源共享。究其緣故原由,除了缺乏同一的和諧方案外,沒有可參照的行業(yè)尺度也是此中緊張的緣故原由。2.3中醫(yī)古籍?dāng)?shù)字化軟件有待革新軟件成效是否強盛對中醫(yī)古籍?dāng)?shù)字化歷程和結(jié)果具有直接影響,選擇符合的軟件可以起到事半功倍的結(jié)果。如今,可供選擇的數(shù)字化加工體系很多,掃描和圖像處置懲罰技能已較為成熟。而r軟件對古籍中部門繁體字和不規(guī)矩用字

8、的識別結(jié)果很差,輔以人工校對那么必要大量的時間和人力,怎樣進步r在古籍字符識別上的正確率是古籍?dāng)?shù)字化面對的一浩劫題;數(shù)據(jù)加工軟件在批處置懲罰、大字符集、內(nèi)容辦理等方面存在缺陷;檢索體系怎樣按照中醫(yī)古籍的特點進步檢索速率和精準度也是值得進一步研究的題目。2.4古籍信息的精準檢索快速、正確地檢索到所必要的內(nèi)容是古籍?dāng)?shù)字化應(yīng)有的根本成效,也是評價其優(yōu)劣的緊張指標。全文本的數(shù)字化古籍可以實現(xiàn)恣意字符的檢索,但是數(shù)據(jù)正確度孝檢索噪音大的題目尚待進一步辦理;圖像版可以包管信息的正確無誤,但在全文檢索上存在必然缺陷,通過對有用檢索點的標引可以在必然程度上補充上述不敷,但仍不成制止地要遺漏某些信息。由于中醫(yī)古

9、籍中并證、方、藥的同名異義、異名同義征象普及存在,使內(nèi)容的正確檢索越發(fā)困難。怎樣創(chuàng)立后控詞表,實現(xiàn)關(guān)聯(lián)檢索也是中醫(yī)古籍?dāng)?shù)字化面對的一個困難。2.5研究支持成效尚不美滿研究支持成效是指可以或許提供有關(guān)古籍內(nèi)容自己科學(xué)、正確的統(tǒng)計與計量信息,提供與古籍內(nèi)容相干的參考數(shù)據(jù)、幫助東西,這些信息、數(shù)據(jù)或東西都是古籍內(nèi)容的增值或增補2。中醫(yī)古籍具有極高的研究代價,其研究支持成效應(yīng)更強盛。除常用的中醫(yī)古籍研究幫助東西外,還應(yīng)具有差異版本和相干數(shù)據(jù)的鏈接。對并證、方、藥的參考數(shù)據(jù)舉行會聚,對生僻字舉行注解,創(chuàng)立學(xué)術(shù)論壇等,都是研究支持成效的緊張構(gòu)成部門,而如今的中醫(yī)古籍?dāng)?shù)字化結(jié)果在此方面尚顯薄弱。2.6深度開

10、拓不敷中醫(yī)古籍?dāng)?shù)字化不該僅僅滿意于對古籍的閱覽和查詢。古代中醫(yī)藥文獻是一個知識寶庫,在數(shù)字化的底子上開掘古籍中的名貴知識財產(chǎn),實現(xiàn)知識創(chuàng)造和知識拓展,更好地為中醫(yī)藥奇跡的生長和人類康健辦事是中醫(yī)古籍?dāng)?shù)字化的最高目的。3中醫(yī)古籍?dāng)?shù)字化建立的發(fā)起3.1圖文關(guān)聯(lián)是實現(xiàn)中醫(yī)古籍?dāng)?shù)字化的較好方法圖文關(guān)聯(lián)是將古籍文獻別離存儲為圖像、文本兩種情勢。圖文關(guān)聯(lián)是將文本對應(yīng)放在與之相匹配的圖像之下,并創(chuàng)立索引干系,實現(xiàn)圖文比較。此種方法可以補充“圖像在檢索和內(nèi)容編纂上的不敷,又可以校對“文本的正確性,使讀者既能看到原書原貌的古籍文獻,又可以快速正確地查到所必要的內(nèi)容。尤其對付研究者,對原始版本信息和文本的正確性要

11、求更高,而通過圖文比較便可很好地辦理這一題目。3.2中醫(yī)文獻與盤算機專業(yè)職員的通力協(xié)作中醫(yī)古籍?dāng)?shù)字化是古典文化與當(dāng)代技能的結(jié)合,必要有醒目中醫(yī)古籍整理、目次學(xué)和版本學(xué)知識的人才與把握盤算機網(wǎng)絡(luò)知識和多媒體技能的專業(yè)職員通力協(xié)作。中醫(yī)古籍?dāng)?shù)字化雖屬新的古籍整理方法,但仍歸于中醫(yī)文獻整理領(lǐng)域,離不開文獻整理的知識。在整個歷程中,中醫(yī)知識不成或缺;同時,在數(shù)據(jù)處置懲罰、數(shù)據(jù)庫方案、應(yīng)用平臺構(gòu)建等方面都必要盤算機專業(yè)職員到場。中醫(yī)文獻專家的需求和發(fā)起能引導(dǎo)盤算機技能職員對整個體系的方案,進而改進中醫(yī)古籍?dāng)?shù)字化體系的成效。上述兩方面職員的深化互助是創(chuàng)立抱負中醫(yī)古籍?dāng)?shù)字化形式的條件。3.3器重同一尺度的研

12、究和訂定創(chuàng)立完備的中醫(yī)古籍資源庫必要全行業(yè)的互助。因此,有需要創(chuàng)立同一的尺度,包羅中醫(yī)古籍的分類法、著錄規(guī)矩、軟件和數(shù)據(jù)庫的利用、數(shù)字化加工尺度、加工和利用平臺等。同一的尺度是實現(xiàn)中醫(yī)古籍?dāng)?shù)字化資源共享的底子,也是促進中醫(yī)古籍?dāng)?shù)字化建立歷程的有力保障3。3.4同一方案,共建共享中醫(yī)古籍?dāng)?shù)字化是對中華文化遺產(chǎn)的庇護和弘揚,具有猛烈的公益色彩。各單元必要在同一的和和諧向?qū)?創(chuàng)立一個團體的方案。團體方案應(yīng)包羅數(shù)字化東西的內(nèi)容,確定事情重點和互助分工,同時包羅相干尺度、范例的同一,而恰恰這兩方面題目在如今的事情中較為突出4。辦理了這兩方面題目,就制止了重復(fù)建立和資源白費,才氣實現(xiàn)共建共享。4結(jié)語中醫(yī)古籍?dāng)?shù)字化是一項恒久的體系工程,必要中醫(yī)藥科研職員支付恒久的艱辛和積極。固然在建立歷程中另有很多題目有待辦理,但隨著研究的深化,信息技能的飛速生長,中醫(yī)古籍?dāng)?shù)據(jù)庫建立和利用將出現(xiàn)遼闊的遠景

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論