版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
數(shù)據(jù)實時同步軟件行業(yè)發(fā)展基本情況數(shù)據(jù)庫行業(yè)背景及發(fā)展趨勢分析中國數(shù)據(jù)庫市場將迎來高增長態(tài)勢,首先是政策利好,國家大力支持國產(chǎn)數(shù)據(jù)庫廠商的發(fā)展;其次是需求拉動,國產(chǎn)化和數(shù)字化轉(zhuǎn)型帶動需求的爆發(fā)式增長;同時,供給端傳統(tǒng)、初創(chuàng)和跨界各類型廠商厚積薄發(fā),產(chǎn)品和技術(shù)經(jīng)歷了多年工程實踐的打磨走向成熟;此外,國內(nèi)企業(yè)對基礎(chǔ)軟件的付費意愿和IT支出占比在逐年提升,有利于市場的長期發(fā)展。未來,中國數(shù)據(jù)庫多場景現(xiàn)狀與融合需求長期并存,云數(shù)據(jù)庫(包括公有、非公有各種形式)成為主流;開源成為產(chǎn)業(yè)互聯(lián)網(wǎng)時代數(shù)據(jù)庫廠商的破局之刃;人工智能延伸DBA的能力半徑,優(yōu)化數(shù)據(jù)庫性能,是數(shù)據(jù)庫下一步發(fā)展的目標(biāo)。數(shù)據(jù)庫領(lǐng)域的技術(shù)發(fā)展趨勢隨著數(shù)據(jù)庫發(fā)展進(jìn)入后關(guān)系型階段,數(shù)據(jù)結(jié)構(gòu)也越來越多樣化,半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)占比不斷提升。對于數(shù)據(jù)結(jié)構(gòu)多樣但是每種數(shù)據(jù)存儲功能需求不高的用戶來說,不同的數(shù)據(jù)結(jié)構(gòu)采用不同數(shù)據(jù)庫存儲的話成本較高,使用也比較繁瑣。多模數(shù)據(jù)庫的出現(xiàn)滿足了靈活的數(shù)據(jù)存儲的管理需求,將各種類型的數(shù)據(jù)進(jìn)行統(tǒng)一的管理,降低了運維和開發(fā)成本,是未來數(shù)據(jù)庫技術(shù)發(fā)展的趨勢。對于搜索引擎數(shù)據(jù)庫來說,多模型可能更加重要,能夠在不同的數(shù)據(jù)結(jié)構(gòu)中實現(xiàn)高精度的搜索是搜索引擎數(shù)據(jù)庫一直追求的目標(biāo);在大數(shù)據(jù)時代,傳統(tǒng)數(shù)據(jù)庫的業(yè)務(wù)能力逐漸無法滿足龐大的數(shù)據(jù)處理與分析需求,越來越多的數(shù)據(jù)庫廠商將人工智能技術(shù)融入到了數(shù)據(jù)庫領(lǐng)域,通過AI來使得數(shù)據(jù)庫實現(xiàn)計算和存儲資源的優(yōu)化、異常識別、數(shù)據(jù)可視化等功能,確保數(shù)據(jù)庫高效運行。在搜索引擎數(shù)據(jù)庫領(lǐng)域,機器學(xué)習(xí)算法也已經(jīng)得到了廣泛應(yīng)用。Elasticsearch中現(xiàn)在已經(jīng)內(nèi)置了機器學(xué)習(xí)模塊,可以方便地實現(xiàn)可視化、數(shù)據(jù)分類、異常檢測等功能。近年來數(shù)據(jù)泄露等安全事件頻發(fā),以及數(shù)據(jù)上云的趨勢顯著,數(shù)據(jù)庫面臨的安全隱患也更加多樣,對數(shù)據(jù)庫的數(shù)據(jù)安全提出了挑戰(zhàn)。在我國信創(chuàng)產(chǎn)業(yè)發(fā)展的大趨勢下,數(shù)據(jù)庫的自主可控與安全更是重要的基礎(chǔ)?;陔[私計算和區(qū)塊鏈技術(shù)的數(shù)據(jù)庫產(chǎn)品是近期的發(fā)展方向,協(xié)助提升數(shù)據(jù)可信與安全。數(shù)據(jù)庫行業(yè)面臨的機遇與挑戰(zhàn)(一)數(shù)據(jù)庫行業(yè)面臨的機遇1、數(shù)據(jù)庫存量市場巨大根據(jù)信通院發(fā)布的《數(shù)據(jù)庫發(fā)展研究報告(2021年)》,2020年全球數(shù)據(jù)庫市場規(guī)模達(dá)到671億美元,其中中國數(shù)據(jù)庫市場規(guī)模為240.9億元,占比約5.2%,市場空間廣闊。新基建及國家信息化建設(shè)政策的不斷推進(jìn)將有利于達(dá)夢數(shù)據(jù)的快速發(fā)展。達(dá)夢數(shù)據(jù)在產(chǎn)品成熟度、兼容性、遷移方法等多方面得到了大量用戶的認(rèn)可,在參加的多次國產(chǎn)數(shù)據(jù)庫選型測試中均滿足了用戶對于系統(tǒng)功能、性能等多方面的要求。2、數(shù)據(jù)庫下游行業(yè)的高速發(fā)展在大數(shù)據(jù)和5G通信技術(shù)迅猛發(fā)展的背景下,數(shù)據(jù)傳輸速率大幅提升,越來越多的數(shù)據(jù)密集型應(yīng)用應(yīng)運而生。人們需要面對的數(shù)據(jù)結(jié)構(gòu)愈發(fā)復(fù)雜,需要存儲和處理的數(shù)據(jù)量也愈發(fā)增多。根據(jù)信通院發(fā)布的《數(shù)據(jù)庫發(fā)展研究報告(2021年)》,預(yù)計到2025年,全球數(shù)據(jù)庫市場規(guī)模將達(dá)到798億美元,其中中國數(shù)據(jù)庫市場總規(guī)模將達(dá)到688億元,年復(fù)合增長率為23.4%。在海量復(fù)雜數(shù)據(jù)的存儲、調(diào)用、處理和分析等工作中,數(shù)據(jù)庫管理系統(tǒng)軟件扮演著不可或缺的重要角色。在未來,數(shù)據(jù)庫行業(yè)的市場空間仍較為廣闊,數(shù)據(jù)量的增加和數(shù)據(jù)復(fù)雜度的提升將驅(qū)動數(shù)據(jù)庫市場的長期快速發(fā)展。3、數(shù)據(jù)庫國家產(chǎn)業(yè)政策利好為了促進(jìn)國產(chǎn)軟件行業(yè)更快更好發(fā)展,國家頒布了《十四五國家信息化規(guī)劃》《十四五推進(jìn)國家信息化規(guī)劃》《中華人民共和國國民經(jīng)濟(jì)和社會發(fā)展第十四個五年規(guī)劃和2035年遠(yuǎn)景目標(biāo)綱要》《新時期促進(jìn)集成電路產(chǎn)業(yè)和軟件產(chǎn)業(yè)高質(zhì)量發(fā)展的若干政策》等一系列法規(guī)和政策,兩次修訂《著作權(quán)法》和《計算機軟件保護(hù)條例》,對各行業(yè)信息化建設(shè)的總體部署、主攻方向、重大任務(wù)和重點工程、優(yōu)先行動、組織實施;信息化的總體要求與任務(wù);稅收、投資、收入分配、人才吸引與培養(yǎng)、產(chǎn)業(yè)技術(shù)開發(fā)、行業(yè)組織與管理和知識產(chǎn)權(quán)保護(hù)等多個方面給予政策保障和支持。國家產(chǎn)業(yè)政策為國產(chǎn)數(shù)據(jù)庫行業(yè)未來的發(fā)展?fàn)I造了良好的環(huán)境。在新基建及信息化安全產(chǎn)業(yè)政策的大背景下,預(yù)計基礎(chǔ)軟件行業(yè)將在未來3-5年保持快速發(fā)展。4、數(shù)據(jù)庫信息安全重要性提高在大數(shù)據(jù)與人工智能時代,數(shù)據(jù)庫軟件已經(jīng)深入滲透到關(guān)乎國計民生的各行各業(yè),成為生產(chǎn)生活不可或缺的基礎(chǔ)設(shè)施。而在當(dāng)前日益復(fù)雜的國際局勢下,政府、金融等關(guān)鍵領(lǐng)域的信息安全對國家而言至關(guān)重要。近年來國際發(fā)生了數(shù)次重大信息安全事件,為防范信息泄露風(fēng)險,關(guān)鍵的政、商等領(lǐng)域使用的數(shù)據(jù)庫產(chǎn)品必須具備極高的安全性。(二)數(shù)據(jù)庫行業(yè)面臨的挑戰(zhàn)1、數(shù)據(jù)庫軟件領(lǐng)域高端人才稀缺人力成本高企行業(yè)屬于軟件和信息技術(shù)服務(wù)業(yè),為技術(shù)和人才高度密集型產(chǎn)業(yè),人力成本較高。行業(yè)內(nèi)人才的專業(yè)素質(zhì)和技術(shù)水平是影響企業(yè)市場競爭力的關(guān)鍵因素,而受限于國內(nèi)數(shù)據(jù)庫行業(yè)起步較晚,數(shù)據(jù)庫技術(shù)的專業(yè)人才仍存在較大的缺口。當(dāng)前,行業(yè)研發(fā)人才儲備模式主要還是以校園招聘與內(nèi)部培養(yǎng)為主,人才儲備數(shù)量與質(zhì)量均存在不足。在分布式數(shù)據(jù)庫、云數(shù)據(jù)庫等新興先進(jìn)數(shù)據(jù)庫技術(shù)不斷加速發(fā)展的背景下,行業(yè)未來需要進(jìn)一步完善人才培養(yǎng)機制,建立健全人才招聘網(wǎng)絡(luò),更多引入在數(shù)據(jù)庫、存儲、操作系統(tǒng)等領(lǐng)域的頂尖人才,也因此面對著人力成本與資金壓力的挑戰(zhàn)。2、互聯(lián)網(wǎng)科技巨頭加速布局?jǐn)?shù)據(jù)庫產(chǎn)業(yè)近年來,國內(nèi)互聯(lián)網(wǎng)科技巨頭紛紛加速布局?jǐn)?shù)據(jù)庫產(chǎn)業(yè),借助云計算優(yōu)勢進(jìn)行相關(guān)數(shù)據(jù)庫服務(wù)的研發(fā)。2010年,螞蟻金服正式推出自主研發(fā)的金融級分布式關(guān)系型數(shù)據(jù)庫OceanBase;2017年,阿里云推出自研關(guān)系型云數(shù)據(jù)庫PolarDB;華為在2019年5月發(fā)布了企業(yè)級AI-Native數(shù)據(jù)庫GaussDB;騰訊云于2020年宣布將原TDSQL、CynosDB、TBase三個數(shù)據(jù)庫品牌整合升級為統(tǒng)一的企業(yè)級分布式數(shù)據(jù)庫TDSQL。互聯(lián)網(wǎng)企業(yè),特別是云計算巨頭,通過把握公有云平臺入口,控制數(shù)據(jù)庫服務(wù)流量,結(jié)合云計算巨頭自身的低成本自研/開源產(chǎn)品,對傳統(tǒng)數(shù)據(jù)庫產(chǎn)品構(gòu)成了強勁競爭。針對這一挑戰(zhàn),作為獨立數(shù)據(jù)庫產(chǎn)品提供商的達(dá)夢,采取多云、跨云策略,可在多種云平臺中提供達(dá)夢數(shù)據(jù)庫服務(wù),有效避免平臺綁定,為用戶提供多種選擇。3、數(shù)據(jù)庫產(chǎn)品技術(shù)仍需持續(xù)發(fā)展改進(jìn)國外數(shù)據(jù)庫產(chǎn)品應(yīng)用場景豐富,尤其在高端場景的應(yīng)用廣度和深度上仍有優(yōu)勢。基于龐大的客戶基數(shù)與運行時間所積累的技術(shù)改進(jìn)與運維經(jīng)驗也是其數(shù)據(jù)庫軟件產(chǎn)品性能得以不斷迭代、改進(jìn)的重要因素。數(shù)據(jù)庫行業(yè)未來發(fā)展趨勢(一)市場規(guī)模持續(xù)擴(kuò)大,數(shù)據(jù)庫行業(yè)需求具備成長空間根據(jù)信通院發(fā)布的《數(shù)據(jù)庫發(fā)展研究報告(2021年)》,2020年全球數(shù)據(jù)庫市場規(guī)模達(dá)到671億美元,其中中國數(shù)據(jù)庫市場規(guī)模為240.9億元,占比約5.2%,市場空間廣闊。預(yù)計到2025年,全球數(shù)據(jù)庫市場規(guī)模將達(dá)到798億美元,其中中國數(shù)據(jù)庫市場總規(guī)模將達(dá)到688億元,年復(fù)合增長率為23.4%。伴隨著數(shù)據(jù)規(guī)模的高速增長,全球數(shù)據(jù)庫市場增長迅速,整體市場空間巨大。(二)信息安全備受重視,數(shù)據(jù)庫國產(chǎn)率顯著提升長期以來,以Intel、Microsoft、Apple、Oracle、IBM、Qualcomm、Google、Cisco等國際巨頭為首的國外IT廠商在操作系統(tǒng)、數(shù)據(jù)庫、芯片、服務(wù)器、辦公軟件、智能終端等領(lǐng)域占據(jù)了市場的較大份額,深入了政府、海關(guān)、郵政、金融、鐵路、民航、醫(yī)療等各行業(yè)環(huán)節(jié)。與此同時,近年來信息泄露事件層出不窮,信息安全和供應(yīng)鏈安全越來越得到國家、公眾的重視。為保證信息安全,信息化安全建設(shè)勢在必行。從整體IT產(chǎn)業(yè)鏈來看,我國數(shù)據(jù)庫產(chǎn)業(yè)屬于較具競爭力的一環(huán),初步邁向好用階段。從技術(shù)水平來看,經(jīng)過多年的研發(fā)和實踐,國產(chǎn)數(shù)據(jù)庫已經(jīng)走過了學(xué)習(xí)摸索的階段,進(jìn)入到了服務(wù)市場乃至引領(lǐng)創(chuàng)新的全新階段,在集群技術(shù)、安全技術(shù)、分布式技術(shù)等領(lǐng)域取得了顯著進(jìn)展。從市場收入來看,國產(chǎn)廠商近年來得到快速發(fā)展。據(jù)賽迪顧問數(shù)據(jù),2011年主要中國數(shù)據(jù)庫廠商市場收入總和僅1.56億元,而2020年主要中國數(shù)據(jù)庫廠商市場收入已達(dá)到16.43億元,增長逾10倍。(三)事務(wù)和分析齊頭并重,數(shù)據(jù)庫生態(tài)呈多樣性發(fā)展在數(shù)據(jù)量爆炸式增長的大數(shù)據(jù)時代,數(shù)據(jù)存儲結(jié)構(gòu)也越來越靈活多樣。日益變革的新興業(yè)務(wù)不斷催生了愈發(fā)豐富的數(shù)據(jù)庫技術(shù)和產(chǎn)品形態(tài)需求。這些變化對現(xiàn)有的聯(lián)機事務(wù)處理(OLTP)與聯(lián)機分析處理(OLAP)涇渭分明的架構(gòu)提出了挑戰(zhàn)。傳統(tǒng)架構(gòu)下,企業(yè)通常選擇建立、維護(hù)不同數(shù)據(jù)庫以便支持兩類不同的任務(wù)。其管理和維護(hù)成本往往較高,且在OLTP與OLAP系統(tǒng)間也存在較大的數(shù)據(jù)延遲,企業(yè)難以開展敏捷、實時的數(shù)據(jù)商業(yè)分析活動。因此,能夠統(tǒng)一支持OLTP和OLAP的數(shù)據(jù)庫成為了眾多企業(yè)的需求。目前,產(chǎn)業(yè)界正基于創(chuàng)新的計算存儲框架研發(fā)HTAP數(shù)據(jù)庫,通過實現(xiàn)基于同一引擎同時支撐業(yè)務(wù)系統(tǒng)運行和分析決策場景的功能,避免傳統(tǒng)架構(gòu)中在線與離線數(shù)據(jù)庫之間大量的數(shù)據(jù)交互,提升信息化系統(tǒng)的整體性能。(四)AI技術(shù)發(fā)展迅速,數(shù)據(jù)庫智能化程度逐步提升面對大規(guī)模數(shù)據(jù)和不同的應(yīng)用場景,傳統(tǒng)數(shù)據(jù)庫組件存在業(yè)務(wù)類型不敏感、查詢優(yōu)化能力弱等問題。目前有研究通過將機器學(xué)習(xí)算法替代傳統(tǒng)數(shù)據(jù)庫組件的方式以實現(xiàn)更高的查詢和存儲效率并自動化處理各種任務(wù),例如自動管理計算與存儲資源、自動防范惡意訪問與攻擊、主動實現(xiàn)數(shù)據(jù)庫智能調(diào)優(yōu)等。機器學(xué)習(xí)算法可以分析大量數(shù)據(jù)記錄,標(biāo)記異常值和異常模式,幫助企業(yè)提高安全性,防范入侵者破壞,還可以在系統(tǒng)運行時自動、連續(xù)、無人工干預(yù)地執(zhí)行修補、調(diào)優(yōu)、備份和升級操作,盡可能減少人為錯誤或惡意行為,確保數(shù)據(jù)庫高效運行、安全無失。(五)云計算成為新一代IT基礎(chǔ)設(shè)施,云原生數(shù)據(jù)庫得到發(fā)展在云計算技術(shù)的不斷發(fā)展催生出將數(shù)據(jù)庫部署在云上的需求后,通過云服務(wù)形式提供數(shù)據(jù)庫功能的云數(shù)據(jù)庫應(yīng)運而生。與傳統(tǒng)數(shù)據(jù)中心采用的物理服務(wù)器、物理網(wǎng)絡(luò)、物理存儲設(shè)施不同,云計算環(huán)境下普遍采用基于容器化、微服務(wù)、Serverless等理念進(jìn)行基礎(chǔ)設(shè)施的架構(gòu),對數(shù)據(jù)庫的運行環(huán)境假定提出了挑戰(zhàn)。云原生數(shù)據(jù)庫技術(shù)以云化運行環(huán)境為前提,在設(shè)計上通常結(jié)合分布式技術(shù)并普遍采用計算存儲分離、日志即數(shù)據(jù)的設(shè)計思想,能夠靈活調(diào)動資源進(jìn)行擴(kuò)縮容,可進(jìn)一步實現(xiàn)資源池化、彈性變配、集約運維等能力,以應(yīng)對更便捷、更低門檻實現(xiàn)云上數(shù)字化轉(zhuǎn)型與升級的挑戰(zhàn)。(六)開源與非開源數(shù)據(jù)庫共存,形成市場互補態(tài)勢開源數(shù)據(jù)庫通常是免費的社區(qū)數(shù)據(jù)庫,其源代碼對外開放,開發(fā)人員可以在其原始設(shè)計基礎(chǔ)上修改或使用。它以較低的成本、豐富的產(chǎn)品和活躍的社區(qū)支持為日益復(fù)雜的企業(yè)需求提供了相應(yīng)的解決方案。開源數(shù)據(jù)庫雖然避免了高昂的授權(quán)費用和服務(wù)費用,但在易用性、配套能力、服務(wù)能力、版本更新方面往往存在一定的缺陷,從而增加了額外成本和使用風(fēng)險。對于大型企業(yè)用戶,非開源商業(yè)數(shù)據(jù)庫廠商在知識產(chǎn)權(quán)、信息安全、產(chǎn)品功能完善度、代碼理解程度、技術(shù)服務(wù)水平等方面具有更大的優(yōu)勢。未來一段時間內(nèi),開源數(shù)據(jù)庫和非開源數(shù)據(jù)庫在市場上將面向不同用戶群體,形成市場互補態(tài)勢。數(shù)據(jù)庫市場方興未艾,關(guān)系型數(shù)據(jù)庫仍為主流關(guān)系型數(shù)據(jù)庫占據(jù)數(shù)據(jù)庫市場絕對主流,搜索引擎數(shù)據(jù)庫份額較低。從全球范圍來看,關(guān)系型數(shù)據(jù)庫仍是目前的主流市場。根據(jù)DB-Engines統(tǒng)計,關(guān)系型數(shù)據(jù)庫流行度占比高達(dá)71.3%,非關(guān)系型數(shù)據(jù)庫僅為28.7%,其中搜索引擎數(shù)據(jù)庫占4.6%。所有數(shù)據(jù)庫綜合排名TOP10中有7家為關(guān)系型數(shù)據(jù)庫。從中國范圍來看,目前我國數(shù)據(jù)庫產(chǎn)品數(shù)量分布呈現(xiàn)以關(guān)系型為主,非關(guān)系型數(shù)據(jù)庫為輔的局面。根據(jù)墨天輪統(tǒng)計,截至2022年11月,我國數(shù)據(jù)庫產(chǎn)品中有關(guān)系型數(shù)據(jù)庫159個,非關(guān)系型數(shù)據(jù)庫87個,其中流行度排名前十的全部是關(guān)系型數(shù)據(jù)庫。國產(chǎn)搜索引擎數(shù)據(jù)庫產(chǎn)品僅有兩款。數(shù)據(jù)庫管理系統(tǒng)市場持續(xù)加快增長。據(jù)Gartner報告顯示,2021年全球數(shù)據(jù)庫管理系統(tǒng)市場收入接近800億美元,相比2020年增加了145億美元,同比增速達(dá)到22.3%,2020年這個數(shù)字是19%,市場規(guī)模正在加速增長。據(jù)統(tǒng)計,數(shù)據(jù)庫管理系統(tǒng)市場已連續(xù)六年實現(xiàn)增長,自2017年以來,市場規(guī)模已經(jīng)翻了一倍,四年的年復(fù)合增長率達(dá)到19.7%。非關(guān)系型數(shù)據(jù)庫市場規(guī)模增速顯著高于整體市場,收入占比逐年提升,互聯(lián)網(wǎng)廠商占據(jù)較大市場份額。據(jù)Gartner統(tǒng)計,2021年全球非關(guān)系型數(shù)據(jù)庫管理系統(tǒng)的收入達(dá)到148億美元,約占全球數(shù)據(jù)庫管理系統(tǒng)總收入的19%,在2017年時該占比僅為8%,五年內(nèi)占比也翻了一倍。其中純非關(guān)系型數(shù)據(jù)庫管理系統(tǒng)廠商(Aerospike,Couchbase,Neo4j,MongoDB等8家)的收入達(dá)到23億美元,大部分收入仍來自于互聯(lián)網(wǎng)廠商的非關(guān)系型數(shù)據(jù)庫產(chǎn)品,其中亞馬遜的非關(guān)系型數(shù)據(jù)庫收入達(dá)到64億美元,占據(jù)非關(guān)系型數(shù)據(jù)庫總收入的43.2%,谷歌的非關(guān)系型數(shù)據(jù)庫收入達(dá)到28億美元,占非關(guān)系型數(shù)據(jù)庫總收入的18.6%。中國數(shù)據(jù)庫市場規(guī)模增速較快,國產(chǎn)化率有望提升。據(jù)中國信通院發(fā)布的《數(shù)據(jù)庫發(fā)展研究報告2021》統(tǒng)計,2025年中國的數(shù)據(jù)庫市場規(guī)模將達(dá)到688億元,5年年復(fù)合增長率達(dá)23.4%。目前,海外巨頭仍占據(jù)國內(nèi)數(shù)據(jù)庫市場較大份額,但國產(chǎn)數(shù)據(jù)庫經(jīng)歷多年沉淀,已經(jīng)具備初步競爭力。據(jù)《中國信創(chuàng)產(chǎn)業(yè)發(fā)展報告2021》統(tǒng)計,2020年數(shù)據(jù)庫國產(chǎn)化率已達(dá)47.4%。根據(jù)IDC統(tǒng)計,目前華為、達(dá)夢、人大金倉、阿里云等國產(chǎn)數(shù)據(jù)庫軟件已經(jīng)在市場中占有一定份額,未來隨著國產(chǎn)數(shù)據(jù)庫技術(shù)不斷提升,數(shù)據(jù)庫國產(chǎn)化率有望進(jìn)一步擴(kuò)張。從行業(yè)來看,2021年在國內(nèi)數(shù)據(jù)庫市場份額中占比最高的是金融行業(yè),達(dá)到了20.2%,其辦公系統(tǒng)和一般系統(tǒng)使用我國數(shù)據(jù)庫產(chǎn)品的機構(gòu)數(shù)量已經(jīng)超過40%。搜索引擎數(shù)據(jù)庫簡介搜索引擎數(shù)據(jù)庫是一類專門用于數(shù)據(jù)內(nèi)容搜索的NoSQL數(shù)據(jù)庫,是非結(jié)構(gòu)化大數(shù)據(jù)處理分析領(lǐng)域中重要的基礎(chǔ)支撐軟件。在數(shù)據(jù)爆炸式增長的當(dāng)下,非結(jié)構(gòu)化數(shù)據(jù)已經(jīng)成為了全球數(shù)據(jù)量的主要來源。非結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)復(fù)雜,沒有預(yù)定義的數(shù)據(jù)模型,不方便用傳統(tǒng)的數(shù)據(jù)庫二維邏輯來表現(xiàn),但卻蘊含著巨量的價值信息,如何高效地處理分析非結(jié)構(gòu)化數(shù)據(jù)是數(shù)據(jù)庫領(lǐng)域面臨的機遇和挑戰(zhàn)。在這樣的時代背景下,搜索引擎數(shù)據(jù)庫的概念逐漸發(fā)展起來。它可以提供快速的數(shù)據(jù)檢索服務(wù),是搜索引擎系統(tǒng)的底層支撐。而常見的谷歌、百度等是搜索引擎,它的概念更加寬泛,不僅涵蓋搜索引擎數(shù)據(jù)庫,還包含了爬蟲、網(wǎng)頁權(quán)重計算、檢索詞糾錯、知識圖譜和個性化推薦等模塊。搜索引擎數(shù)據(jù)庫的應(yīng)用廣泛。搜索引擎數(shù)據(jù)庫早期又稱全文數(shù)據(jù)庫、非結(jié)構(gòu)化數(shù)據(jù)庫等,因為搜索引擎數(shù)據(jù)庫誕生的初期主要是解決關(guān)系型數(shù)據(jù)庫中長文本檢索效率低下的問題而誕生的,但是隨著技術(shù)的發(fā)展,目前的搜索引擎數(shù)據(jù)庫已經(jīng)不僅僅可以處理長文本數(shù)據(jù),也可以處理常見的數(shù)值、日期等結(jié)構(gòu)化數(shù)據(jù),還可以處理IP、地理位置信息、圖片、音視頻等非結(jié)構(gòu)化數(shù)據(jù)。憑借在數(shù)據(jù)查詢效率方面的優(yōu)勢,搜索引擎數(shù)據(jù)庫在數(shù)據(jù)處理方面的地位越來越高,并在應(yīng)用程序搜索、網(wǎng)站搜索、企業(yè)搜索、智能問答、圖像與語音搜索、語義搜索、業(yè)務(wù)分析和安全分析等方面有著廣泛的應(yīng)用。搜索引擎數(shù)據(jù)庫伴隨著搜索引擎的發(fā)展而發(fā)展?;ヂ?lián)網(wǎng)上第一個真正意義的搜索引擎是由蒙特利爾大學(xué)學(xué)生AlanEmtage于1990年開發(fā)的Archie,開創(chuàng)了現(xiàn)代搜索引擎領(lǐng)域。雖然當(dāng)時WorldWideWeb還未出現(xiàn),但網(wǎng)絡(luò)中文件傳輸已經(jīng)相當(dāng)頻繁,而這一搜索引擎用于FTP服務(wù)器上的文件。1995年,全文檢索引擎AltaVista推出,迅速成為當(dāng)時最受歡迎的搜索引擎;同年,中國公司易寶北信推出了全文檢索數(shù)據(jù)庫TRSDatabaseServer,隨后獲得了國家科技進(jìn)步二等獎。1997年Google、2001年百度搜索引擎相繼問世,DougCutting開發(fā)的開源全文索引引擎Lucene加入了Apache基金會,為后續(xù)多個搜索引擎數(shù)據(jù)庫的誕生提供了基礎(chǔ),Solr、Elasticsearch等常用的搜索引擎數(shù)據(jù)庫都是基于Lucene開發(fā)的。Elastic公司于2011年成立,之后迅速成為全球領(lǐng)先的搜索引擎數(shù)據(jù)庫廠商,并于2018年上市。國內(nèi)廠商星環(huán)科技于2020年發(fā)布了新一代搜索引擎NewSearch,并在2021年更名為Scope。搜索引擎數(shù)據(jù)庫關(guān)注度正在提升。2022年11月17日,中國信通院組織召開了搜索型數(shù)據(jù)庫技術(shù)研討會,會議重點討論了搜索型數(shù)據(jù)庫的市場前景、技術(shù)趨勢、應(yīng)用場景、發(fā)展態(tài)勢等議題,專家們認(rèn)為我國在搜索型數(shù)據(jù)庫領(lǐng)域存在取得全球領(lǐng)先地位的可能性,同時搜索型數(shù)據(jù)庫的數(shù)據(jù)安全問題日益受到業(yè)界的關(guān)注。在信創(chuàng)產(chǎn)業(yè)發(fā)展的大背景下,我國關(guān)系型數(shù)據(jù)庫的發(fā)展如火如荼,已有多款關(guān)系型數(shù)據(jù)庫產(chǎn)品入選了國家信創(chuàng)產(chǎn)品目錄,一些產(chǎn)品性能已經(jīng)達(dá)到國際領(lǐng)先水平,但是搜索引擎數(shù)據(jù)庫領(lǐng)域的發(fā)展仍較為滯后。隨著信創(chuàng)政策不斷推進(jìn),搜索引擎數(shù)據(jù)庫作為高效處理非結(jié)構(gòu)化數(shù)據(jù)的基礎(chǔ)軟件,關(guān)注度正在逐步提
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 美甲店工資體系合同模板
- 茶地管理協(xié)議合同模板
- 食堂燃油采購合同模板
- 場地?zé)o償使用合同模板
- 輪胎經(jīng)銷合同模板
- 鋼板買賣合同模板
- 2024年股權(quán)投資合作協(xié)議標(biāo)準(zhǔn)模板一
- 租房用水電合同模板
- 投資合同模板樣板
- 合伙開醫(yī)院合同模板
- 中學(xué)歷史探究教學(xué)調(diào)查問卷及分析報告
- 2024-2030年中醫(yī)理療行業(yè)市場發(fā)展分析及前景趨勢與投資研究報告
- 服裝采購合同電子版
- 2024-2025學(xué)年新教材高中化學(xué) 第二章 海水中的重要元素-鈉和氯 1 鈉及其化合物教案 新人教版必修1
- 《火針療法》課件
- 中國綠電制氫行業(yè)投資分析、市場運行態(tài)勢、未來前景預(yù)測報告
- DL-T5710-2014電力建設(shè)土建工程施工技術(shù)檢驗規(guī)范
- 2024勞動合同職業(yè)危害告知書
- 《大學(xué)生職業(yè)發(fā)展與就業(yè)指導(dǎo)》課程標(biāo)準(zhǔn)
- (高清版)JTGT 5440-2018 公路隧道加固技術(shù)規(guī)范
- 天津市2023-2024學(xué)年九年級上冊期中考試物理試題(附答案)
評論
0/150
提交評論