大數(shù)據(jù)背景下企業(yè)數(shù)字檔案館建設策略探析獲獎科研報告_第1頁
大數(shù)據(jù)背景下企業(yè)數(shù)字檔案館建設策略探析獲獎科研報告_第2頁
大數(shù)據(jù)背景下企業(yè)數(shù)字檔案館建設策略探析獲獎科研報告_第3頁
大數(shù)據(jù)背景下企業(yè)數(shù)字檔案館建設策略探析獲獎科研報告_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

大數(shù)據(jù)背景下企業(yè)數(shù)字檔案館建設策略探析獲獎科研報告摘

要:大數(shù)據(jù)時代的來臨給企業(yè)數(shù)字檔案館建設帶來了很大挑戰(zhàn),本文通過對大數(shù)據(jù)的概念和特征的簡單介紹,分析了大數(shù)據(jù)對企業(yè)數(shù)字檔案館建設帶來的影響,并針對影響提出了相關的應對策略。

關鍵詞:大數(shù)據(jù);數(shù)字檔案館;知識管理

引言

隨著互聯(lián)網(wǎng)技術的飛速發(fā)展,特別是物聯(lián)網(wǎng)、社交網(wǎng)絡和云計算的興起,全球數(shù)據(jù)量急劇增長,數(shù)據(jù)種類也越來越多樣化,各種非結構化和半結構化數(shù)據(jù)大量涌現(xiàn),數(shù)據(jù)資源已經(jīng)成為了當今社會增長最快的資源之一。根據(jù)國際數(shù)據(jù)公司IDC監(jiān)測統(tǒng)計,人類產(chǎn)生的數(shù)據(jù)量正在呈指數(shù)級增長,大約每兩年翻一番,并且這個速度在一段時間內(nèi)會繼續(xù)保持下去。海量、多源異構的數(shù)據(jù)給企業(yè)管理和發(fā)展帶了很大挑戰(zhàn),在傳統(tǒng)的數(shù)據(jù)存儲、分析、挖掘技術難以實時處理大量非結構化信息的情況下,大數(shù)據(jù)的概念應運而生。

1.大數(shù)據(jù)的概念與特征

大數(shù)據(jù)是一個比較抽象的概念,在信息科學領域至今尚無確切、統(tǒng)一的定義,在維基百科中對大數(shù)據(jù)如此定義:大數(shù)據(jù)是指利用常用軟件工具來獲取、管理和處理數(shù)據(jù)所消耗時間超過可容忍時間的數(shù)據(jù)集。這是一個模糊性的定義,因為它對常用軟件和可容忍時間的范圍并未明確界定。研究機構Gartner也對大數(shù)據(jù)進行了定義:大數(shù)據(jù)是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量的、高增長率和多樣化的信息資產(chǎn)。這是一個描述性的定義,在數(shù)據(jù)處理的基礎上加入此類數(shù)據(jù)的一些特征,并用這些特征描述大數(shù)據(jù)??偟膩碚f,盡管各方對大數(shù)據(jù)的表述不一,但其內(nèi)涵一致,從本質(zhì)上來說,大數(shù)據(jù)主要解決的是海量數(shù)據(jù)存儲、計算、挖掘和展示的問題。

國內(nèi)外學者經(jīng)過多年的研究,目前,盡管對大數(shù)據(jù)的定義尚有分歧但對于大數(shù)據(jù)的特征已經(jīng)達成了共識:數(shù)據(jù)規(guī)模大(Volume),數(shù)據(jù)種類多(Variety),處理速度快(Velocity),數(shù)據(jù)價值密度低(Value),稱之為四“V”特性。

2.大數(shù)據(jù)對企業(yè)數(shù)字檔案館建設的影響

由于大數(shù)據(jù)具有數(shù)據(jù)量巨大、數(shù)據(jù)類型繁多、價值密度低和處理速度快的四“V”特點,因此大數(shù)據(jù)不僅對企業(yè)信息化工作帶來了新的挑戰(zhàn),也對數(shù)字檔案館建設與發(fā)展產(chǎn)生了很大的影響。

2.1檔案大數(shù)據(jù)的獲取

在信息化高速發(fā)展的今天,檔案信息資源也呈現(xiàn)出復雜性和多樣性的特點,從技術實施的角度來看,檔案大數(shù)據(jù)可以從兩個維度來考慮:數(shù)據(jù)結構類型和實效性。從數(shù)據(jù)結構類型上分析,要同時支持結構化數(shù)據(jù)(來源于關系數(shù)據(jù)庫)、半結構化數(shù)據(jù)(來源于格式化文件如XML)、非結構化數(shù)據(jù)(電子照片、音頻文件和視頻文件等)。2019年12月26日,我國最高人民法院公布了《最高人民法院關于修改的決定》,該決定第四十條規(guī)定,電子數(shù)據(jù)包括網(wǎng)頁、博客、微博客等網(wǎng)絡平臺發(fā)布的信息;手機短信、電子郵件、即時通信、通訊群組等網(wǎng)絡應服務的通訊信息都可以作為正式打官司的證據(jù),進一步說明了檔案資源的數(shù)據(jù)類型與獲取渠道將日益廣泛化。從實效性的維度分析,由于大數(shù)據(jù)反映的是一種趨勢,通過數(shù)據(jù)量的變化推斷出事件發(fā)生的概率,數(shù)據(jù)量越大概率也會越準確,因此單一數(shù)據(jù)的時效性和價值將會逐漸弱化。

2.2檔案大數(shù)據(jù)的應用

知識管理是檔案管理發(fā)展的趨勢,檔案用戶已不滿足于數(shù)據(jù)或文件的查詢利用,更希望獲取數(shù)據(jù)背景后的信息和蘊藏的知識,這就對檔案大數(shù)據(jù)的應用提出了更高的要求。因此,檔案大數(shù)據(jù)的應用,應該從源頭進行規(guī)劃,建立一套邏輯結構元數(shù)據(jù)和檔案業(yè)務元數(shù)據(jù)系統(tǒng)來進行數(shù)據(jù)的管理和維護,實現(xiàn)數(shù)據(jù)的關聯(lián)性分析、元數(shù)據(jù)查詢以及檔案數(shù)據(jù)治理等功能。此外,為了展現(xiàn)海量數(shù)據(jù)的查詢結果多樣性、多角度、多層次,檔案大數(shù)據(jù)需要應用數(shù)據(jù)可視化的相關技術,因為可視化技術是最佳的結果展示方式之一,通過清晰的圖形圖像可以直觀反映出最終結果。

2.3數(shù)字檔案館云平臺建設

由于檔案數(shù)字資源龐大、種類繁多、結構復雜,不同的檔案數(shù)據(jù)中蘊含的價值差異很大,因此不可避免的會導致用戶獲取有價值信息的難度增大。數(shù)字檔案館云平臺就是解決這類問題的有效途徑,云平臺可以基于現(xiàn)有的IT基礎設施進行建設,也可以依托大數(shù)據(jù)專業(yè)機構提供的云服務。EMC存儲專家和資深產(chǎn)品經(jīng)理李君鵬認為,大數(shù)據(jù)本身就是一個問題集,云技術是目前解決大數(shù)據(jù)問題集最有效的手段。

3.企業(yè)數(shù)字檔案館建設的策略

隨著大數(shù)據(jù)時代的到來,企業(yè)數(shù)字檔案館建設也將面臨新的挑戰(zhàn),如何對大數(shù)據(jù)進行管理、儲存、信息挖掘和提供利用都將是亟待解決的問題,這就要求企業(yè)在建設數(shù)字檔案館的時候,要從整體進行規(guī)劃,結合企業(yè)實際需求和發(fā)展趨勢,確定功能定位,制定數(shù)字檔案館建設的策略,應對大數(shù)據(jù)可能對企業(yè)生產(chǎn)經(jīng)營活動造成的影響。

3.1加強數(shù)字檔案館頂層設計

企業(yè)數(shù)字檔案館建設是一個不斷完善和持續(xù)改進的過程,在推進過程中,檔案部門應當做好頂層規(guī)劃設計,充分考慮檔案工作的發(fā)展趨勢并論證方案的可行性,才能更好地推進數(shù)字檔案館建設。企業(yè)檔案部門應當根據(jù)數(shù)字檔案館系統(tǒng)建設、業(yè)務集成、數(shù)據(jù)共享及運行服務等需求,加快相關規(guī)范、制度和標準的出臺,使企業(yè)檔案工作有章可循。在制定規(guī)章制度時,應首先考慮采用國際標準,其次才是國家、行業(yè)以及地方標準,并盡可能采用適用范圍比較廣泛的標準。

3.2

提高企業(yè)檔案信息化設施水平

加大投入改善檔案軟、硬件設施水平。首先,優(yōu)化配置各種資源,企業(yè)根據(jù)實際需要,為檔案管理部門配備必要的硬件設施,并隨著需求發(fā)展不斷升級完善,從長遠考慮為滿足數(shù)字檔案館建設的需要,逐步實現(xiàn)檔案云平臺建設目標。其次,立足于公司發(fā)展的需要,建立大數(shù)據(jù)采集系統(tǒng),豐富信息資源體系。最后,為方便知識的利用,企業(yè)應以內(nèi)部局域網(wǎng)為依托,采用標準的B/S(瀏覽器/服務器)模式,以數(shù)據(jù)庫技術為支撐,基于智能檢索技術和網(wǎng)絡技術,不斷優(yōu)化檔案可視化技術,以滿足多樣化、個性化的利用需求。

3.3建立一支專業(yè)的檔案信息化人才隊伍

數(shù)字檔案館建設、應用與維護等工作與信息技術的發(fā)展有著非常緊密的聯(lián)系,這就決定了數(shù)字檔案館的運營模式有別于傳統(tǒng)實體檔案館,經(jīng)營管理數(shù)字檔案館的工作團隊不僅要掌握檔案專業(yè)管理知識,還要擁有一定的信息技術水平,熟練掌握常用的計算機技術、網(wǎng)絡技術以及數(shù)據(jù)庫技術,能夠獨立承擔起數(shù)字檔案館日常運行和維護工作。這就需要企業(yè)建立一支專業(yè)的信息化人才隊伍,承擔起大數(shù)據(jù)時代下的企業(yè)數(shù)字檔案館建設和檔案信息化工作的重任。

4.結束語

建設數(shù)字檔案館是一項長期復雜的系統(tǒng)工程,其建設內(nèi)容包括頂層架構設計、檔案數(shù)據(jù)資源的整合利用、檔案信息云平臺搭建、人才隊伍培養(yǎng)以及系統(tǒng)運行維護等多個方面。而大數(shù)據(jù)時代的到來,對企業(yè)數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論