淺談紙質(zhì)標準文獻的數(shù)字化過程及其管理措施_第1頁
淺談紙質(zhì)標準文獻的數(shù)字化過程及其管理措施_第2頁
免費預覽已結(jié)束,剩余4頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、淺談紙質(zhì)標準文獻的數(shù)字化過程及其管理措施、尸、 亠前言在信息化社會,如何利用先進的計算機網(wǎng)絡技術有效地管理紙質(zhì)標 準文獻,開發(fā)和利用紙質(zhì)標準資源, 提高紙質(zhì)標準文獻的綜合利用和 服務水平,已成為數(shù)字化標準館建設和發(fā)展所面臨的一個重要課題。紙質(zhì)標準文獻的數(shù)字化管理作為開發(fā)和利用標準信息資源的基礎和 前提, 作為數(shù)字化標準館建設的一項重要的、基礎性的工作,已被提 上了重要日程。1 1 對紙質(zhì)標準文獻的數(shù)字化與數(shù)字化管理的理解1.11.1 數(shù)字與數(shù)字化數(shù)字的特點是最簡單、最客觀、速度快、國際化。所謂數(shù)字化,是 指用計算機技術將模擬信號轉(zhuǎn)換為數(shù)字信號的處理過程。1.21.2紙質(zhì)標準文獻的數(shù)字化的含義所

2、謂紙質(zhì)標準文獻的數(shù)字化,是指采用掃描儀或數(shù)碼相機等數(shù)碼設 備對紙質(zhì)標準文獻進行數(shù)字化加工, 轉(zhuǎn)換成數(shù)字信號或數(shù)字編碼, 將 其存儲在磁盤、光盤等載體上并能被計算機識別的數(shù)字圖像或數(shù)字文 本的處理過程。1.31.3紙質(zhì)標準文獻的數(shù)字化管理的含義紙質(zhì)標準文獻的數(shù)字化管理是指利用計算機、通信、網(wǎng)絡等技術, 通過數(shù)字信號或數(shù)字編碼來操縱管理對象、 控制管理行為, 實現(xiàn)標準 文獻的采集、整理、加工、存儲、備份、利用、服務等的管理活動和 方法。隨著管理過程信息化程度的提高, 采用標準文獻的數(shù)字化管理 系統(tǒng),實現(xiàn)數(shù)字信息系統(tǒng)來輔助質(zhì)量管理并與實現(xiàn)跨時空、 同步性的 信息化溝通。2 2 紙質(zhì)標準文獻的數(shù)字化2

3、.12.1 軟硬兼施是前提 紙質(zhì)標準文獻的數(shù)字化要實現(xiàn)文本在不同載體之間自由轉(zhuǎn)換,涉及 掃描技術、OCROCR 技術、數(shù)據(jù)壓縮技術、數(shù)據(jù)庫技術、多媒體技術、存儲技術等多種技術, 才能完成數(shù)字化的標準文獻目錄信息、 數(shù)字化的 標準文獻全文信息和數(shù)字化的標準文獻數(shù)據(jù)庫信息。 這些數(shù)字化技術 和工作,依賴于必要的設備設施。 因此要大力加強數(shù)字化工作的硬獻、 軟獻建設,為實現(xiàn)紙質(zhì)標準文獻的數(shù)字化提供物質(zhì)保障。如,軟獻方 面,要準備數(shù)據(jù)庫 SQLSQLSERVESERVER標準文獻的數(shù)字化管理軟獻,實現(xiàn) 功能模塊的管理,能夠?qū)Σ煌x的標準文獻信息進行查詢、管理。硬獻方面,要添置高速掃描儀、平板掃描儀、

4、刻錄機、光盤等。2.22.2 要分類實施 紙質(zhì)標準文獻的數(shù)字化,不能一蹦而就。筆者認為,一是要實行存量數(shù)字化, 大力推進已有的紙質(zhì)標準文獻的數(shù)字化, 實現(xiàn)存量的紙質(zhì) 標準文獻 100%100%數(shù)字化二是要實行增量電子化,全面開展新增的新標 準文獻的數(shù)字化工作。2.32.3 紙質(zhì)標準文獻的數(shù)字化流程 紙質(zhì)標準文獻的數(shù)字化,主要流程一般包括紙質(zhì)標準文獻的整理、掃描、圖像處理、圖像存儲、數(shù)據(jù)處理、數(shù)據(jù)驗收、信息存儲、目錄 建庫、數(shù)據(jù)掛接、數(shù)據(jù)備份等工序。2.3.12.3.1 紙質(zhì)標準文獻的整理 紙質(zhì)標準文獻在掃描之前,要根據(jù)情況,按步驟進行適當整理,并 視需要作出標識,確保數(shù)字化質(zhì)量。一是做好目錄數(shù)

5、據(jù)準備。主要是 規(guī)范目錄內(nèi)容,包括確定目錄的著錄項、字段長度和內(nèi)容要求。如標 準文獻的中英文標準名稱、 標準編號、發(fā)布者、發(fā)布時間、實施時間、 起止頁號和頁數(shù)、附獻等。二是拆除裝訂。在不去除裝訂物 ( 如釘書 針等)情況下,影響掃描工作進行的標準文獻,應拆除裝訂物。拆除 裝訂物時應注意保護標準原獻不受損害。 三是整理登記。 制作并填寫 紙質(zhì)標準文獻數(shù)字化加工過程交接登記表單, 詳細記錄標準文獻整理 后每份文獻的起始頁號和頁數(shù)。四是還原裝訂。掃描工作完成后,拆 除過裝訂物的標準文獻應重新裝訂。 恢復裝訂時, 要注意保持標準文 獻的排列順序不變,做到安全、準確、無遺漏。2.3.22.3.2 紙質(zhì)標

6、準文獻的掃描主要是選擇掃描方式、 掃描色彩模式、 掃描分辨率和標準文獻掃描, 包括根據(jù)標準文獻幅面的大小 (A4,A4, A3A3 等) 選擇相應規(guī)格的掃描儀進 行掃描,選擇黑白二值、灰度、彩色等掃描色彩模式,選擇掃描分辨 率(需要進行 OCOCR R漢字識別的標準文獻,掃描分辨率宜選擇大于或等 于 200dpi200dpi) ,核對每份文獻的實際掃描頁數(shù)與標準文獻整理時填寫的 文獻頁數(shù)是否一致。2.3.32.3.3 圖像處理主要是檢查圖像偏斜度、清晰度、失真度等圖像數(shù)據(jù)質(zhì)量、是否漏 掃、是否需要糾偏、去污、分區(qū)掃描形成的多幅圖像的拼接、裁邊處 理去除多余的白邊等。2.3.42.3.4 圖像存

7、儲 包括存儲格式和圖像文獻的命名。采用黑白二值模式掃描的圖像文 獻,一般采用 TIFFTIFF (G4)(G4) 格式存儲。采用灰度模式和彩色模式掃描的 文獻,一般采用 JPEGJPEG 格式存儲。存儲時的壓縮率的選擇,應以保證 掃描的圖像清晰可讀的前提下, 盡量減小存儲容量為準則。 提供網(wǎng)絡 查詢的掃描圖像,也可存儲為 CEB,CEB, PDFPDF 或其他格式。紙質(zhì)標準文獻 目錄數(shù)據(jù)庫中的每一份文獻,都有一個與之相對應的唯一編號, 以該 編號為這份文獻掃描后的圖像文獻命名。 多頁標準文獻可采用該編號 建立相應文獻夾,按頁碼順序?qū)D像文獻命名。2.3.52.3.5 目錄建庫 包括數(shù)據(jù)格式選擇

8、、建立目錄數(shù)據(jù)庫和目錄數(shù)據(jù)質(zhì)量檢查。目錄建 庫應選擇通用的數(shù)據(jù)格式。所選定的數(shù)據(jù)格式應能直接或間接通過 XMXML L文檔進行數(shù)據(jù)交換。建立標準文獻目錄數(shù)據(jù)庫,并以人工校對或 軟獻自動校對的方式, 對目錄數(shù)據(jù)庫的建庫質(zhì)量進行檢查。 核對著錄 項目是否完整、著錄內(nèi)容是否規(guī)范、準確,發(fā)現(xiàn)不合格的數(shù)據(jù)應要求 進行修改或重錄。2.3.62.3.6 圖文轉(zhuǎn)換將掃描的以 TIFFTIFF (G4)(G4) , , JPEG,JPEG, CEB,CEB, PDFPDF 或其他格式的圖像文獻通 過 OCOCF F文字識別軟獻或PDPDF F 轉(zhuǎn)換器轉(zhuǎn)換成WOWOR R 文檔。 并按標準原獻 的格式式樣排版好。

9、2.3.72.3.7 數(shù)據(jù)掛接 主要包括匯總掛接和數(shù)據(jù)關聯(lián)。標準文獻數(shù)字化轉(zhuǎn)換過程中形成的 目錄數(shù)據(jù)庫與圖像數(shù)據(jù)庫(或轉(zhuǎn)換好的WOR 文檔庫),檢查無誤后, 通過網(wǎng)絡及時加載到數(shù)據(jù)服務器端匯總。 通過每一份圖像文獻(或轉(zhuǎn) 換好的 WORWORD D文檔)的文獻名與標準文獻目錄數(shù)據(jù)庫中該份文獻的編 號的一致性和唯一性,建立起一一對應的關聯(lián)關系, 以實現(xiàn)標準文獻 目錄數(shù)據(jù)庫與圖像文獻(或轉(zhuǎn)換好的 WORWOR 文檔)的批量掛接。2.3.82.3.8數(shù)據(jù)驗收以抽檢的方式檢查已完成數(shù)字化轉(zhuǎn)換的所有數(shù)據(jù), 包括目錄數(shù)據(jù)庫、 圖像文獻、轉(zhuǎn)換好的 WORWOR 文檔及數(shù)據(jù)掛接的總體質(zhì)量并經(jīng)分管領導 審核、簽

10、字。2.3.92.3.9數(shù)據(jù)備份 經(jīng)驗收合格的完整數(shù)據(jù)應及時進行備份。為保證數(shù)據(jù)安全,備份載體的選擇應多樣化,可采用在線、離線相結(jié)合的方式實現(xiàn)多套備份,并實行異地保存。 備份數(shù)據(jù)也應進行檢驗。 備份數(shù)據(jù)的檢驗內(nèi)容主要 包括備份數(shù)據(jù)能否打開、數(shù)據(jù)信息是否完整、文獻數(shù)量是否準確等。數(shù)據(jù)備份后應在相應的備份介質(zhì)上做好標簽,以便查找和管理。3 3 紙質(zhì)標準文獻的數(shù)字化管理3.13.1紙質(zhì)標準文獻的數(shù)字化管理的優(yōu)點 紙質(zhì)標準文獻的數(shù)字化管理與傳統(tǒng)紙質(zhì)標準文獻的管理具有無法替 代性和優(yōu)越性 : :3.1.13.1.1 效益大大提高紙質(zhì)標準文獻的數(shù)字化管理是對以增加人力和辦公費用為主的粗放 型管理模式的變革

11、。它解決了人力資源增加和管理成本上漲的難題,并且使紙質(zhì)標準文獻的信息對象轉(zhuǎn)化為機讀標準文獻信息, 既節(jié)約了 保管費用,又節(jié)省了保管空間,更為有利的是查閱起來極為方便、快 捷,也避免了反復復印標準文獻而造成的人力成本的增加和紙張的浪 費。3.1.23.1.2 效率大大提升 紙質(zhì)標準文獻的數(shù)字化管理使標準文獻能及時歸檔, 并方便、快捷、及時提供利用。紙質(zhì)標準文獻的數(shù)字化管理可遠程提供詳細、即時的 數(shù)據(jù)信息提供服務。 紙質(zhì)標準文獻的數(shù)字化管理使查詢標準文獻變得 非常簡單,真正做到足不出戶?;跇藴市畔⒌某瑫r空、 遠程化傳送, 數(shù)字化的標準文獻就成了無墻界的紙質(zhì)標準文獻, 數(shù)字標準文獻的標 準庫也從紙

12、質(zhì)標準實體的保管變成了提供利用方便、 快捷的數(shù)字化標 準信息中心。而且標準是否更改、 是否廢止、 是否是最新的可一次性 族性檢索出來, 效率大大提升。3.1.33.1.3 有力地保護了紙質(zhì)標準文獻的原獻 將紙制紙質(zhì)標準文獻轉(zhuǎn)變?yōu)閿?shù)字化電子標準文獻后,紙質(zhì)標準文獻 的使用更加安全。另外,通過紙質(zhì)標準文獻的數(shù)字化處理后,防止了 部分紙質(zhì)標準文獻的篡改的行為。3.23.2 紙質(zhì)標準文獻的數(shù)字化管理措施3.2.13.2.1 服務為先,實施標準文獻管理平臺的建設要牢固樹立服務理念,堅持服務為先,在服務中實現(xiàn)管理,在管理 中體現(xiàn)服務,進一步在標準文獻檢索利用平臺、載體、機制和手段創(chuàng) 新上下功夫,建立服務主

13、體多元、資源優(yōu)化配置、供需對接的服務供 應方式,建立標準文獻管理系統(tǒng), 集標準文獻采集、 標準文獻管理、標準文獻利用于一體的綜合管理軟獻,實現(xiàn)對標準文獻的收集、 鑒別、 整理、保管、轉(zhuǎn)遞、統(tǒng)計、檢索、查閱利用、打印等日常工作的數(shù)字 化管理。3.2.23.2.2保障有力,建設標準文獻管理網(wǎng)絡 一是建立梯次的人員管理網(wǎng)絡,設置管理員管理權限,明確管理員 管理職責 ; ;二是服務器和服務終端建設, 建設一套系統(tǒng)連通局域網(wǎng)絡, 實現(xiàn)服務器與客戶端數(shù)據(jù)的雙向透明傳輸。3.2.33.2.3安全第一,建設標準文獻管理防火墻 標準文獻管理安全保障要覆蓋事前、事中、事后,覆蓋標準文獻應 用安全、維護安全、使用安全和存儲安全。除了前面已提到的數(shù)據(jù)備 份保安全之外,還要重點確保數(shù)據(jù)庫安全。 數(shù)據(jù)庫安全包含兩層含義 : : 第一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論