完整2019 2020年整理檔案數(shù)字化加工方案匯編推薦文檔_第1頁(yè)
完整2019 2020年整理檔案數(shù)字化加工方案匯編推薦文檔_第2頁(yè)
完整2019 2020年整理檔案數(shù)字化加工方案匯編推薦文檔_第3頁(yè)
完整2019 2020年整理檔案數(shù)字化加工方案匯編推薦文檔_第4頁(yè)
完整2019 2020年整理檔案數(shù)字化加工方案匯編推薦文檔_第5頁(yè)
已閱讀5頁(yè),還剩20頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、目錄第一節(jié)質(zhì)數(shù)字化加工作業(yè)前期準(zhǔn)備1一、數(shù)字化工作人員準(zhǔn)備1二、數(shù)字化工作軟件、硬件準(zhǔn)備 4三、確定數(shù)字化內(nèi)容、數(shù)量及用戶需求 5第二節(jié)數(shù)字化加工流程及主要技術(shù)方案6一、入庫(kù)提卷、拆卷 6二、標(biāo)引著錄7三、檔案掃描8四、圖像處理11五、全文OCR、生成雙層pdf、板式還原及格式12六、總質(zhì)檢 14七、批量掛接15八、還卷及數(shù)據(jù)備份提交 15第三節(jié) 質(zhì)量控制方案和保證措施 17一、 加工質(zhì)量保障措施 17二、多環(huán)節(jié),多層次的質(zhì)量檢查體系 17三、階段性驗(yàn)收與終驗(yàn)相結(jié)合的嚴(yán)格驗(yàn)收程序是質(zhì)量控制的終級(jí)保障1921第四節(jié) 安全保密控制保密協(xié)議22第五節(jié)售后服務(wù)24項(xiàng)目背景隨著全國(guó)文化信息資源共享工程與

2、中國(guó)數(shù)字圖書館工程的起動(dòng),信息化已 成為國(guó)際潮流,信息資源建設(shè)成為當(dāng)務(wù)之急。信息資源建設(shè)的重點(diǎn)是電子文獻(xiàn)、 各類數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)資源、電子檔案、電子圖書等新型數(shù)字化信息資源的建設(shè)。 在數(shù)字化信息資源建設(shè)中,很大的一個(gè)需求是將現(xiàn)有的紙介質(zhì)印刷品數(shù)字化, 使之成為能夠用計(jì)算機(jī)閱讀、理解、查詢、檢索的電子文件,最終將其應(yīng)用于 數(shù)據(jù)庫(kù)存儲(chǔ),或通過(guò) CD-RO、M Internet 網(wǎng)進(jìn)行出版,或上傳數(shù)字檔案館供用戶 使用。以傳統(tǒng)紙張為載體的保存方式,占據(jù)了大量的空間,需要特殊的環(huán)境,而 且不方便查詢,隨著時(shí)間的推移,還面臨著腐蝕、老化等問(wèn)題。而將紙介質(zhì)文 件信息進(jìn)行電子化處理,保存到光盤上,具有存儲(chǔ)、管理

3、、共享等功能,還可 以減少文件庫(kù)房占地,節(jié)省保管設(shè)備和人員方面開(kāi)支,又方便統(tǒng)計(jì)和進(jìn)行遠(yuǎn)程 查詢。因此,將檔案、期刊、文件等資料通過(guò)掃描儀,掃描成圖像文件,再通過(guò)處理轉(zhuǎn)換成電子文檔,建立目錄和索引,制作成電子文件,已是當(dāng)務(wù)之急第一節(jié) 數(shù)字化加工作業(yè)前期準(zhǔn)備一數(shù)字化工作人員準(zhǔn)備1 . 甲方人員職務(wù):現(xiàn)場(chǎng)交接管理人員人數(shù)要求:一名 專業(yè)要求:為學(xué)校檔案館負(fù)責(zé)檔案管理工作的技術(shù)或管理人員。職責(zé)范圍: . 負(fù)責(zé)與乙方的檔案提卷和還卷等交接工作,協(xié)同甲方人員作好交接清單記錄 并簽字。 . 負(fù)責(zé)監(jiān)督乙方規(guī)范化加工。 隨時(shí)把握乙方加工進(jìn)度并進(jìn)行協(xié)調(diào)。 . 及時(shí)關(guān)注并抽查乙方加工質(zhì)量 .代表甲方與乙方進(jìn)行及時(shí)的

4、溝通及問(wèn)題協(xié)調(diào),確保項(xiàng)目順利完工。2 乙方人員2.1 管理人員主要為:熟悉現(xiàn)場(chǎng)加工管理,熟悉數(shù)字化整體作業(yè)流程,具有較強(qiáng)組織能力和現(xiàn) 場(chǎng)管理及溝通能力的乙方負(fù)責(zé)人。2.2 工程技術(shù)人員主要為:熟悉計(jì)算機(jī)軟、硬件技術(shù),了解檔案數(shù)據(jù)庫(kù)標(biāo)準(zhǔn)和系統(tǒng)開(kāi)發(fā)。了解檔案 管理等相關(guān)專業(yè)知識(shí)的乙方技術(shù)部技術(shù)支持工程師。2.3數(shù)據(jù)采集作業(yè)員主要為:了解檔案數(shù)據(jù)庫(kù)數(shù)據(jù)標(biāo)準(zhǔn)和計(jì)算機(jī)軟件應(yīng)用等相關(guān)知識(shí)的乙方數(shù)字化制作部工作人員。人員安排見(jiàn)表3-1職務(wù)職責(zé)人 員備注管 理 人 員項(xiàng)目負(fù)責(zé) 人1 負(fù)責(zé)人員,資源的調(diào)配工作。2負(fù)責(zé)施工組織設(shè)計(jì)、管理。3負(fù)責(zé)施工條件的保障及與甲乙雙方 關(guān)于項(xiàng)目進(jìn)展?fàn)顟B(tài)的匯報(bào)和協(xié)調(diào)工 作。1人項(xiàng)

5、目負(fù)責(zé)人 不一定要常駐 現(xiàn)場(chǎng),但要通過(guò) 一切通訊手段 和定期到現(xiàn)場(chǎng) 的督導(dǎo),切實(shí)做 到對(duì)該項(xiàng)目加 工進(jìn)度和加工 質(zhì)量的掌控現(xiàn)場(chǎng)主管1. 負(fù)責(zé)與乙方的檔案提卷和還卷等交 接工作2. 負(fù)責(zé)現(xiàn)場(chǎng)的人員管理和加工管理3負(fù)責(zé)數(shù)據(jù)的終驗(yàn)和掛接4.配合項(xiàng)目負(fù)責(zé)人做好與乙方的溝通 協(xié)調(diào)工作。1人數(shù) 據(jù) 采 集 人 員著錄人員負(fù)責(zé)將檔案卷內(nèi)目錄及其匕索引信息 進(jìn)行手工錄入為電子數(shù)據(jù)信息并校對(duì)1人掃描人員負(fù)責(zé)按制定的技術(shù)規(guī)范將檔案資料掃 描1人圖像處理 人員1去污:將掃描獲取的圖像進(jìn)行圖像去 污;去黑邊及去雜點(diǎn)等;2糾偏:將偏斜的圖像進(jìn)行糾正處理;3文字處理:將不清楚的文字進(jìn)行加深 或變淺;4拼接:將頁(yè)面較大的圖

6、像進(jìn)行拼接處理;1人在進(jìn)行圖像處 理的時(shí)候,肯定 是逐頁(yè)處理,所 以要留意每一 頁(yè)掃描的質(zhì)量,發(fā)現(xiàn)掃描質(zhì)量 問(wèn)題立即發(fā)還 上一工序重掃 并作好記錄。圖像矢量 化人員1負(fù)責(zé)將處理好的圖像進(jìn)行全文識(shí)別、 2.校對(duì)、板式還原和格式轉(zhuǎn)換3.對(duì)已經(jīng)產(chǎn)生的成品數(shù)據(jù)進(jìn)行初驗(yàn)后 移交給現(xiàn)場(chǎng)主管終驗(yàn)并掛接。1-3人矢量化人員最 終定員需結(jié)合 矢量化的圖形 數(shù)量和采集難 度。二. 數(shù)字化工作軟、硬件準(zhǔn)備1 .配備硬件數(shù)量及檔次要視數(shù)據(jù)采集工作情況及數(shù)據(jù)量大小。2. 甲方提供PC機(jī)4-6臺(tái)給乙方作為采集作業(yè)使用,其他硬件設(shè)備由乙方自行解 決。3. 場(chǎng)地:甲方提供。4. 辦公用具:甲方提供打印機(jī)(以實(shí)際用量為標(biāo)準(zhǔn))、

7、辦公桌椅、檔案資料的 裝訂及打印機(jī)所用的全部耗材。5. 其他條件:提供電力和飲水。軟硬件準(zhǔn)備詳見(jiàn)表3-2表3-2軟、硬件配備列表軟、硬件名稱數(shù)量詳細(xì)配置響應(yīng)時(shí)間提供方綜合檔案管理系統(tǒng)一套1 需支持全文 檢索使用功 能。2.支持TIFF和 PDF格式數(shù) 據(jù)的批量掛 接功能。項(xiàng)目開(kāi)始需 到位甲方數(shù)字化流程管理和加工軟件、OCR軟件全套能滿足本加 工項(xiàng)目所有的 技術(shù)要求項(xiàng)目開(kāi)始需 到位乙方服務(wù)器一.臺(tái)項(xiàng)目開(kāi)始需 到位甲方掃描儀(A3幅面)一.臺(tái)富士通A3幅面FI-4750C(ADF)項(xiàng)目開(kāi)始需 到位乙方掃描儀(A4幅面)一.臺(tái)A4幅面 虹光-FB6030 (平板)項(xiàng)目開(kāi)始需 到位乙方計(jì)算機(jī)4-6套P

8、C機(jī)項(xiàng)目開(kāi)始需 到位甲方確定數(shù)字化內(nèi)容、數(shù)量及用戶需求在數(shù)據(jù)采集之前,首先要客觀真實(shí)統(tǒng)計(jì)數(shù)字化內(nèi)容和數(shù)量,確定用戶使用需求, 然后制定對(duì)應(yīng)方案和技術(shù)控制以便準(zhǔn)確地進(jìn)行施工安排。表3-3三峽大學(xué)檔案館檔案數(shù)字化用戶需求調(diào)研表檔案類型檔案數(shù)量數(shù)字化準(zhǔn)備情況紙張及保存情況用戶需求招生名冊(cè)廠檔案裝訂檔案著錄廠檔案整理排序”很好p般_1|較差I(lǐng)很差口影像化矢量化學(xué)籍檔案廠檔案裝訂檔案著錄=檔案整理排序好 艮廠一般廠較差r很差影像化廠矢量化學(xué)生成績(jī)廠廠廠檔案裝訂案著錄檔案整理排序黨群檔案檔案裝訂檔案著錄廠檔案整理排序基建檔案檔案裝訂廠檔案著錄廠檔案整理排序科研檔案r檔案裝訂檔案著錄檔案整理排序其它:檔案裝

9、訂檔案著錄 檔案整理排序|r很好 廠一般 廠影像化廠較差I(lǐng) II很差矢量化廠很好廠一般冋影像化了較差石很差好 艮一般較差很差很好丨般較差U很差丄很好丄一般I較差u很差矢量化F|影像化矢量化影像化口矢量化口影像化矢量化填表人職務(wù)第二節(jié)數(shù)字化加工流程及主要技術(shù)方案檔案數(shù)字化加工主要流程包括:提卷 -拆卷-檔案著錄-掃描-圖像處理-OCR-校對(duì)-版式還原-轉(zhuǎn)雙層PDF終驗(yàn)-掛接圖一檔案數(shù)字化加工流程圖單檔案 目錄檔案光盤制件用單光盤樓交溝單7文件屣特電子文件武訂瀟薦單斂需校對(duì)掃擂文件流理單電子 文件程電子 文件電子 文件4丈ft掃描流程單, 批*桂攝入庫(kù)提卷、拆卷1. 從檔案室移交檔案,嚴(yán)格執(zhí)行原始

10、檔案的交接手續(xù),使用雙方項(xiàng)目負(fù)責(zé)人 確認(rèn)的檔案交接清單(完成清點(diǎn)登記)。2檔案整理:編寫頁(yè)碼、核對(duì)紙質(zhì)檔案頁(yè)碼、對(duì)可拆釘?shù)奈募霾疳斕幚硪?適應(yīng)掃描的要求、對(duì)需要修復(fù)的檔案進(jìn)行歸并整理(如果發(fā)現(xiàn)破損嚴(yán)重,無(wú)法 直接進(jìn)行掃描的檔案,應(yīng)先進(jìn)行技術(shù)修復(fù)、折皺不平影響掃描質(zhì)量的原件應(yīng)先 進(jìn)行相應(yīng)處理后再進(jìn)行掃描,發(fā)現(xiàn)破損嚴(yán)重的檔案須立即報(bào)知項(xiàng)目相關(guān)負(fù)責(zé)人)制作卷內(nèi)目錄,掃描文件抽取3按照掃描處理量明確交接周期和檔案交接量 (雙方項(xiàng)目負(fù)責(zé)人簽字,以保 在施工過(guò)程中檔案不損失、不丟失。)4裝訂案卷應(yīng)保證裝訂牢固,案卷整齊,卷內(nèi)材料不松動(dòng),脫落,保持與原 案卷一致。二、標(biāo)引著錄按要求將文件所需信息錄入到軟件

11、數(shù)據(jù)庫(kù)里,標(biāo)引著錄按照國(guó)家檔案局有 關(guān)標(biāo)準(zhǔn)結(jié)合用戶檔案著錄的具體要求進(jìn)行。1. 錄入方式采用手工錄入的方式2. 校對(duì)方式校對(duì)以軟件校對(duì)和打印輸出、對(duì)比校對(duì)相結(jié)合,錯(cuò)誤率在萬(wàn)分之二以下。案卷目錄和卷內(nèi)目錄按照檔案的原始數(shù)據(jù)錄入。卷案目錄和卷內(nèi)目錄的樣 式經(jīng)用戶同意可做相應(yīng)調(diào)整。對(duì)檔案目錄數(shù)據(jù)修改和補(bǔ)充的數(shù)據(jù),須填寫更改 資料、更改資料放入原案卷內(nèi),卷內(nèi)目錄及其他不全的需補(bǔ)充完整。三、檔案掃描1. 掃描方式:根據(jù)檔案幅面的大小選擇相應(yīng)規(guī)格的掃描儀或?qū)I(yè)掃描儀進(jìn) 行掃描。大幅面檔案可采用加長(zhǎng)式掃描或者圖像拼接處理方式處理,同一頁(yè)面 有兩個(gè)以上文件,需分別掃描。2掃描色彩模式:以黑白二值掃描為主,附有

12、灰度(彩色)照片及原件分明度很低的檔案,可視情況采取灰度和24位真彩色掃描。然后以黑白二值保存例:藍(lán)底招生名冊(cè),此種檔案長(zhǎng)見(jiàn)為 A3幅面、紙張很薄,底色與文字的分明度很低。實(shí) 物檔案查看時(shí)都顯吃力,此種檔案如果用黑白二值掃描,則會(huì)出現(xiàn)大幅暗面,文字顯現(xiàn)不清;如果使用彩色掃描,文字部分明度很低。只有使用灰度掃描,效果相對(duì)好一些,如圖三。掃 描后的圖像再輔以黑白二值保存,則最大限度的提高了圖像質(zhì)量,如圖四。圖三灰度掃描效果1110810501 I lllMSq譚玉鳳/女_ 161 -!- - - 1楊飛J1162010590145i -2010073 C1女11510100007561010544

13、孟祥風(fēng)SF女r1521005900252100068 1 .李春* 1女15圖四保存為黑白值后的效果3分辨率:無(wú)全文檢索需求的文檔分辨率調(diào)整為 200DPI最為合適。需要全 文檢索而做ocr識(shí)別的文檔,黑白二值掃描分辨率最佳為400dpi,此分辨率下識(shí) 別成功率最高。24位真彩色掃描分辨率標(biāo)準(zhǔn)為200dpi。4.圖像文件的大?。汉诎锥祾呙?A3頁(yè)面:20K40K;灰度或彩色掃描 A3 頁(yè)面:100 150K。5.如遇字間距和行間距過(guò)密、原件本身是復(fù)印件等字跡不清楚的情況,可 適當(dāng)增加掃描的分辨率,但要保證圖像清晰的同時(shí),又不影響遠(yuǎn)程查詢和瀏覽 的速度。6. 清晰度:掃描圖像字跡清晰、顏色恰當(dāng)

14、,不宜過(guò)淺或過(guò)深,并且不得出 現(xiàn)字跡筆畫殘缺或字跡筆畫疊合而影響閱讀的情況,即使原檔案存在銹斑變質(zhì)、 顏色過(guò)淺或深淺不一致,也保證掃描圖像可讀,掃描留下的墨跡寬度不得超過(guò) 0.5 厘米,并且指印和黑線不能覆蓋或影響正文內(nèi)容。7根據(jù)檔案實(shí)體情況,在檔案電子文件中相對(duì)應(yīng)目錄設(shè)置“復(fù)制件” 、“原 件不清”標(biāo)志。目錄以原有檔案目錄為準(zhǔn),在實(shí)際處理過(guò)程中著有未歸類的新 目錄。可根據(jù)情況修改目錄,增加或調(diào)整標(biāo)準(zhǔn)目錄,對(duì)檔案原目錄數(shù)據(jù)修改或 補(bǔ)充的數(shù)據(jù),需填寫更改資料,更改資料放入原案卷內(nèi),能實(shí)現(xiàn)一條目錄對(duì)應(yīng) 多個(gè)圖像和一個(gè)圖像對(duì)應(yīng)多條目錄的編目。8圖像內(nèi)容:8.1實(shí)時(shí)在屏幕上監(jiān)控掃描全過(guò)程, 遇有漏掃、

15、 重張,圖像黑邊、偏斜、 折角、不清晰等情況,則進(jìn)行重掃或補(bǔ)掃。8.2 檢查掃描件是否合乎要求,掃描圖像必須與原圖頁(yè)面一一對(duì)應(yīng),不 得出現(xiàn)顛倒、缺頁(yè)、重頁(yè)或錯(cuò)頁(yè)情況,不能有遺漏、重復(fù),掃錯(cuò)的現(xiàn)象8.3 掃描的頁(yè)面內(nèi)容居中顯示,不可出現(xiàn)明顯偏左或偏右的現(xiàn)象,正文 內(nèi)容、頁(yè)眉、頁(yè)腳、反面印章、附件、手寫注釋等信息完整;圖像內(nèi)容與書本 面完全對(duì)應(yīng),不得出現(xiàn)書頁(yè)內(nèi)容殘缺或?qū)⑴赃呿?yè)面信息掃入本頁(yè)的現(xiàn)象。 (對(duì)圖 像黑邊、偏斜、折角、不清晰等情況進(jìn)行處理,以達(dá)到用戶需求)8.4 紙張較差檔案掃描方案:由于進(jìn)行數(shù)字化的檔案會(huì)有部分為歷史檔 案,紙張質(zhì)量比較差,對(duì)于這部分紙張質(zhì)量較差的歷史檔案掃描,我們本著以

16、 下原則:8.4.1 保證檔案安全。紙張較差的檔案多為破損檔案,對(duì)于破 損檔案更應(yīng)該在生產(chǎn)流程中加以特殊對(duì)待, 不能造成二次破壞。 保證檔 案的安全是第一要?jiǎng)?wù)。 因此,在處理紙張較差的檔案時(shí), 不允許使用蘸水防滑等有破壞檔案可能性的操作方法。8.4.2 保證掃描質(zhì)量。歷史檔案之所以進(jìn)行檔案數(shù)字化,其中 最主要的目的之一就是搶救這部分歷史檔案,今后在應(yīng)用這部分檔案 時(shí),盡量避免人為翻閱歷史檔案而給檔案造成二次傷害, 而應(yīng)使用電子 系統(tǒng),使用掃描件。這樣檔案掃描的質(zhì)量要盡可能的清晰、干凈,盡可 能的恢復(fù)歷史原貌,這對(duì)掃描質(zhì)量的要求很高。8.4.3 高效高質(zhì)的完成任務(wù)。9. 掃描登記:認(rèn)真填寫紙質(zhì)檔

17、案數(shù)字化轉(zhuǎn)換過(guò)程交接登記表單,登記掃描 的頁(yè)數(shù),核對(duì)每份文件的實(shí)際掃描頁(yè)數(shù)與檔案整理時(shí)填寫的文件頁(yè)數(shù)是否一致, 不一致時(shí)應(yīng)注明具體原因和處理方法。四、圖像處理1. 逐張檢查圖像質(zhì)量(包括黑邊、折角、圖像偏斜度、清晰度、失真度等 進(jìn)行檢查,發(fā)現(xiàn)不符合圖像質(zhì)量要求時(shí),應(yīng)重新進(jìn)行圖像處理) ,檔案順序(頁(yè) 號(hào))是否正確,有無(wú)漏掃、重張等情況(發(fā)現(xiàn)文件漏掃時(shí),應(yīng)及時(shí)補(bǔ)掃并正確 插入圖像。發(fā)現(xiàn)掃描圖像的排列順序與檔案原件不一致時(shí),應(yīng)及時(shí)進(jìn)行調(diào)整。 )2. 糾偏:圖像整體傾斜不得超過(guò) 1 度,不得出現(xiàn)圖像的一部分傾斜或扭曲 而影響閱讀的現(xiàn)象。如果檔案頁(yè)面存在部分傾斜的,以頁(yè)面中標(biāo)題糾正為準(zhǔn)。3 去污:所有

18、掃描留下的黑線、指印、陰影或污點(diǎn)都必須清除干凈(在放大 50%的情況下)由于印刷質(zhì)量或紙張質(zhì)量等造成的頁(yè)面上有零星的污點(diǎn)和反面倒 映文字污點(diǎn)比較多,如果在頁(yè)面視圖下看不清楚,或該污點(diǎn)嵌在文本行中無(wú)法 清除,可以不清除,但應(yīng)盡量保證圖像可讀。4 全文頁(yè)面及局部文字的加深和變淺的處理: 原始檔案的清晰度較低時(shí), 可 提高圖像的清晰度,修正原資料中存在的字間距和行間距過(guò)密,文字較深或較 淺,字跡不清楚的缺陷,確保文字及圖像信息清晰可辨。5 圖像拼接:對(duì)大幅面檔案進(jìn)行分區(qū)掃描形式的多幅圖像, 應(yīng)進(jìn)行拼接處理, 合并為一個(gè)完整的圖像,以保證檔案數(shù)字化圖像的整體性和數(shù)字化檔案的準(zhǔn)確 可讀。6 照片頁(yè)處理:

19、 必要時(shí)采用專業(yè)的圖像處理軟件進(jìn)行處理, 確保照片的清晰 度。7 圖像存儲(chǔ): 存儲(chǔ)格式以 G-4 壓縮 TIFF 格式保存。 A4 幅面檔案保存文件不 得大于100K;其他幅面檔案掃描形成文件在保證影像質(zhì)量的前提下,盡量縮小 文件占用空間。掃描文件存儲(chǔ)命名必須與條目檔案號(hào)一一對(duì)應(yīng)。五、全文識(shí)別(OCR)及生成雙層pdf、版式還原及格式轉(zhuǎn)換將掃描處理完成后的文檔利用專業(yè)的識(shí)別軟件進(jìn)行全文OCR如甲方對(duì)識(shí)別成功率有嚴(yán)格要求的,還需另外進(jìn)行人工校對(duì),校對(duì)結(jié)束后將版式還原及轉(zhuǎn)換 成雙層PDF文件格式。根據(jù)用戶對(duì)識(shí)別率的要求,可選擇性進(jìn)行人工校對(duì)。進(jìn)行人工校對(duì)和不進(jìn)行 校對(duì)的優(yōu)缺點(diǎn)對(duì)比:1不進(jìn)行人工校對(duì)

20、:其原理是在單層 PDF 的基礎(chǔ)上利用計(jì)算機(jī)軟件進(jìn)行全 文OCR識(shí)別后生成雙層PDF文件。從而激活了圖片中所反映的文字,而達(dá)到提 取文字和利用原文所包含的文字進(jìn)行檢索的目的。但是不進(jìn)行人工校對(duì)和版式 還原,識(shí)別的準(zhǔn)確率取決于原始資源的情況及保存現(xiàn)狀。優(yōu)點(diǎn):效率高、成本低、能利用原文檢索 瀏覽速度快。缺點(diǎn):識(shí)別準(zhǔn)確率取決于原件的質(zhì)量,所以準(zhǔn)確率不穩(wěn)定。適應(yīng)范圍: 、原件版面干凈及保存完好的資源。(準(zhǔn)確率可達(dá)95%以上) 、原文中只含部份核心檢索內(nèi)容的資源。(如學(xué)籍檔案,檢索的重點(diǎn)只是圍繞學(xué)生的身份信息)2. 進(jìn)行人工校對(duì):其原理是在 OCR的基礎(chǔ)上,為了確保識(shí)別的準(zhǔn)確率而增 加了人工校對(duì)和版式還

21、原的工序。可實(shí)現(xiàn)無(wú)障礙的全文檢索。優(yōu)點(diǎn):全文檢索無(wú)差錯(cuò),準(zhǔn)確率可達(dá) 99%,且文本層和圖像層一一對(duì) 應(yīng)。缺點(diǎn):效率極低、成本極高、因?yàn)檫M(jìn)行了版式還原,所以原真率不到 98%,而且存儲(chǔ)空間很大而致瀏覽速度降低。適應(yīng)范圍: 、所載信息珍貴且使用頻率很高的資源。 、數(shù)字化項(xiàng)目資金預(yù)算充裕且項(xiàng)目實(shí)施時(shí)間寬松的資源。 、有很好的硬件環(huán)境支持的數(shù)字化項(xiàng)目。六、總質(zhì)檢1. 對(duì)掃描處理完成后的圖像頁(yè)進(jìn)行檢驗(yàn),對(duì)檔案拆分、掃描、修正、去污、 插圖、照片的處理以及文本和圖像頁(yè)的匹配等質(zhì)量進(jìn)行全面檢驗(yàn),對(duì)于質(zhì)量達(dá) 不到要求的進(jìn)行重掃、補(bǔ)掃等操作。2. 對(duì)文本域錄入與文本錄入域的標(biāo)引、文件的頁(yè)號(hào)和頁(yè)數(shù)進(jìn)行對(duì)比,對(duì)掃

22、描前圖像頁(yè)的標(biāo)引與掃描后的圖像頁(yè)的編號(hào)與頁(yè)數(shù)進(jìn)行對(duì)比,發(fā)現(xiàn)不合格的登 記清單重新處理。3. 對(duì)圖像質(zhì)量的檢查,確保圖像版面清晰,干凈,大小一致,方向一致。4主要質(zhì)檢標(biāo)準(zhǔn):4.1加工后的電子影像在總數(shù)量、完整性、清晰度上與源文件保持一 致。4.2案卷著錄、按文件的屬性著錄數(shù)據(jù)庫(kù)字段,檢查“文件路徑”字 段與文件實(shí)際存儲(chǔ)位置一致,差錯(cuò)率控制在千分之五以內(nèi)。4.3電子影像檔案件信息定義數(shù)據(jù)差錯(cuò)率控制在百分之二以內(nèi)。4.4電子影像檔案卷內(nèi)頁(yè)碼差錯(cuò)率控制在千分之一以內(nèi)。4.5每頁(yè)電子影像左右端正度控制在三度以內(nèi)。4.6電子影像漏掃,壓邊率控制在千分之一以內(nèi)。 4.7電子檔案與條目數(shù)據(jù)的掛接一致,差錯(cuò)率小

23、于千分之一以內(nèi)。七、批量掛接1 掃描處理后的圖像成品,按年度、機(jī)構(gòu)上傳至檔案專用服務(wù)器,利用檔案 管理軟件中的對(duì)應(yīng)掛接功能將掃描圖像信息與錄入到檔案管理軟件系統(tǒng)中的目 錄進(jìn)行對(duì)應(yīng)掛接,確保目錄與原文的一一對(duì)應(yīng)。2 掛接到檔案管理系統(tǒng)中區(qū),進(jìn)行再次的成品驗(yàn)收八、還卷及數(shù)據(jù)備份提交1原始檔案還原工作嚴(yán)格按照國(guó)家檔案局規(guī)定的相關(guān)標(biāo)準(zhǔn)和實(shí)際情況進(jìn)行 有序的還原,將還原的檔案資料逐卷精心檢查,確實(shí)沒(méi)有落頁(yè)、掉頁(yè)、折頁(yè)等問(wèn)題后再 歸還檔案管理人員,經(jīng)雙方仔細(xì)核實(shí)無(wú)誤后,在還卷交接單上簽字確認(rèn)。2在數(shù)據(jù)化加工過(guò)程中的各項(xiàng)工作記錄,在數(shù)據(jù)轉(zhuǎn)移完成后、提交給用戶 方。3為了有效地保護(hù)數(shù)據(jù),因此建立數(shù)據(jù)備份制度,

24、在數(shù)字化加工項(xiàng)目工作 結(jié)束,并經(jīng)用戶在終驗(yàn)報(bào)告上簽字確認(rèn)后,將通過(guò)驗(yàn)收后的數(shù)據(jù)利用用戶軟件 的光盤制作功能刻錄成光盤,刻錄到DVD光盤中,刻錄完成后再制作一個(gè)光盤備份,或用移動(dòng)硬盤等存儲(chǔ)介質(zhì),將所有成品數(shù)據(jù)備份,提交給用戶。4刻錄光盤要求:4.1、光盤制作兩份,制作成檔案數(shù)據(jù)格式為多頁(yè) TIFF 的光盤單盤調(diào)閱。4.2、同一份文件不跨越二片DVD片號(hào)(同一份文件頁(yè)數(shù)需在同一 DVD內(nèi))4.3 、電子檔案存在于符合標(biāo)準(zhǔn)的單片包裝光盤4.4、光盤標(biāo)示光盤編號(hào),單片包裝盒上注明光盤內(nèi)主要信息4.5、在光盤刻錄完成后,與硬盤系統(tǒng)中電子檔案進(jìn)行一次比對(duì),確保檔案資 料無(wú)遺漏及正確性。4.6 、制作光盤人

25、員對(duì)于所有光盤序號(hào)進(jìn)行標(biāo)記,并提交相應(yīng)表格。第三節(jié) 質(zhì)量控制方案和保證措施項(xiàng)目加工總體質(zhì)量目標(biāo):保證合格、爭(zhēng)創(chuàng)優(yōu)良!加工質(zhì)量保障措施1 嚴(yán)格遵照?qǐng)?zhí)行我方簽定的不分包、轉(zhuǎn)包三峽大學(xué)檔案數(shù)字化項(xiàng)目承諾書,避免項(xiàng)目轉(zhuǎn)包、分包引起的管理混亂和質(zhì)量風(fēng)險(xiǎn)。2 嚴(yán)格按照我方制定的人員和設(shè)備投入計(jì)劃進(jìn)場(chǎng)加工,確保人員設(shè)備供 應(yīng),為項(xiàng)目進(jìn)度和質(zhì)量提供保障。3 在該項(xiàng)目加工過(guò)程中,我方所有現(xiàn)場(chǎng)加工人員均受我公司數(shù)字化作 業(yè)人員質(zhì)量考核制度的約束,并承擔(dān)相應(yīng)獎(jiǎng)罰結(jié)果。多環(huán)節(jié),多層次的質(zhì)量檢查體系。1. 對(duì)檔案簽收和屬性數(shù)據(jù)錄入的質(zhì)量檢查, 主要內(nèi)容:檔案簽收的準(zhǔn)確性, 完整性和即時(shí)性;數(shù)據(jù)內(nèi)容齊全,屬性數(shù)據(jù)輸入準(zhǔn)確

26、;與數(shù)據(jù)校對(duì)的檔 案交接。2. 對(duì)數(shù)據(jù)校對(duì)處理的質(zhì)量檢查, 主要內(nèi)容: 校對(duì)后的數(shù)據(jù)內(nèi)容齊全, 正確; 紙質(zhì)檔案實(shí)體完整,還案及時(shí)無(wú)誤。3. 對(duì)數(shù)據(jù)遷移的質(zhì)量檢查,主要內(nèi)容:遷移后的數(shù)據(jù)的完整性準(zhǔn)確性;對(duì) 數(shù)據(jù)進(jìn)行組合查詢并且結(jié)果正確;對(duì)數(shù)據(jù)進(jìn)行匯總統(tǒng)計(jì)并輸出標(biāo)準(zhǔn)表 格,試運(yùn)行無(wú)死機(jī)現(xiàn)象。4. 在完成以上每個(gè)環(huán)節(jié)后,檢查人員將其數(shù)據(jù)再次進(jìn)行一遍全面的復(fù)查, 尤其對(duì)檢查記錄單上更正后的錯(cuò)誤進(jìn)行仔細(xì)的檢查,確保掃描得來(lái)的數(shù) 據(jù)與源文件內(nèi)容完全一致。5. 實(shí)施項(xiàng)目負(fù)責(zé)人對(duì)成品數(shù)據(jù)進(jìn)行百分之十的抽查,在抽查時(shí)將該查數(shù)據(jù) 的年度、保管期限、全宗號(hào)、卷號(hào)、卷內(nèi)順序號(hào)等目錄信息是否準(zhǔn)確無(wú) 誤,再對(duì)獲取圖像數(shù)

27、據(jù)的亮度、歪斜、是否錯(cuò)頁(yè)等方面進(jìn)行抽查,如有 不合格的數(shù)據(jù)及時(shí)進(jìn)行統(tǒng)計(jì)和修正,確保最終數(shù)據(jù)的準(zhǔn)確無(wú)誤。三、階段性驗(yàn)收與終驗(yàn)相結(jié)合的嚴(yán)格驗(yàn)收程序是質(zhì)量控制的終極保障階段驗(yàn)收?qǐng)?bào)告項(xiàng)目名稱項(xiàng)目編號(hào)報(bào)告人時(shí)間項(xiàng)目負(fù)責(zé)人所處階段項(xiàng)目狀態(tài)參數(shù)監(jiān)控情況項(xiàng)目狀態(tài)計(jì)劃情況實(shí)際情況偏差掃描糾正措施項(xiàng)目進(jìn)度項(xiàng)目工作量(人時(shí))項(xiàng)目規(guī)模項(xiàng)目外工作 量情況描述(非項(xiàng)目工 作)其他工作中遇到問(wèn)題及困難:需要用戶支持與配合:用戶意見(jiàn):用戶簽字: 簽字日期:終驗(yàn)報(bào)告項(xiàng)目名稱項(xiàng)目編號(hào)報(bào)告人時(shí)間項(xiàng)目負(fù)責(zé)人第()階段本階段項(xiàng)目完成情況驗(yàn)收項(xiàng)目完成情況備注檔案整理(卷)檔案掃描(A4頁(yè),A3頁(yè),其他頁(yè))圖像處理(卷頁(yè))索引目錄錄入(條

28、)全文OCR所有報(bào)表輸出(卷)資料裝訂(卷,件)內(nèi)部驗(yàn)收(頁(yè))目錄與圖像文件的銜接數(shù)據(jù)是否上傳到服務(wù)器數(shù)據(jù)備份本階段驗(yàn)收結(jié)論:雙方于年月日,進(jìn)行了檔案數(shù)字化工作的第階段的成品驗(yàn)收,乙方所提供的數(shù)據(jù)基本滿足甲方的要求,甲方同意通過(guò)驗(yàn)收,進(jìn)入下一個(gè)工作 階段。用戶簽字:日期:項(xiàng)目經(jīng)理簽字:日期:第四節(jié)安全保密控制一、為了確保采集數(shù)據(jù)不外泄,在開(kāi)始進(jìn)行數(shù)字化加工后,我公司將不允許 加工人員攜帶任何存儲(chǔ)介質(zhì)進(jìn)出加工現(xiàn)場(chǎng)。二、為避免采集數(shù)據(jù)在硬盤上的物理磁道上被還原外泄,我公司將使用乙方 提供的電腦用于數(shù)據(jù)采集作業(yè)。三、電腦上所有的可以讀寫存儲(chǔ)介質(zhì)的接口,自進(jìn)場(chǎng)之日起即貼上封條,直 到工程完工。四、為避免數(shù)據(jù)采集過(guò)程中數(shù)據(jù)通過(guò)網(wǎng)絡(luò)外泄,我公司在加工期間將關(guān)閉外 網(wǎng),只使用局域網(wǎng)完成數(shù)字化作業(yè)。五、為了建立并嚴(yán)格落實(shí)安全保密制度,保證檔案資料的安全保密性,做到 絕對(duì)不外泄任何信息。保密協(xié)議將同加工合同同時(shí)簽定并成為合同不可分割 的一部分。見(jiàn)附件附件:保密協(xié)議保密協(xié)議甲方:地址:乙方:數(shù)字科技有限公司地址:鑒于甲方委托乙方承擔(dān)其檔案資料的數(shù)字化加工服務(wù),乙方可能接觸到甲 方某些非公開(kāi)的,涉密的文件、檔案和資料,為了維護(hù)甲方資料的安全,保守 國(guó)家秘密,乙方同意在整理檔案中涉及大量的重要的檔案材料承擔(dān)保密義務(wù), 并遵守

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論