下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 基于大數(shù)據(jù)對(duì)專利信息的分析 摘 要:大數(shù)據(jù)時(shí)代已經(jīng)到來(lái),發(fā)達(dá)國(guó)家多已進(jìn)行政府大數(shù)據(jù)管理,我國(guó)政府也應(yīng)把握這一機(jī)遇,尤其是在信息數(shù)據(jù)資源急速增長(zhǎng)的知識(shí)產(chǎn)權(quán)領(lǐng)域。由于經(jīng)濟(jì)飛速發(fā)展和科技的不斷創(chuàng)新,商標(biāo)和專利等數(shù)據(jù)激增。目前對(duì)于知識(shí)產(chǎn)權(quán)的保護(hù)技術(shù)和管理水平已無(wú)法滿足現(xiàn)代社會(huì)的要求。本文基于大數(shù)據(jù)對(duì)專利信息進(jìn)行了相應(yīng)的分析,以供參考。關(guān)鍵詞:大數(shù)據(jù);專利信息;專利分析1大數(shù)據(jù)概述大數(shù)據(jù)是近來(lái)的一個(gè)技術(shù)熱點(diǎn),但從名字就能判斷出來(lái)它并不是什么新詞。畢竟,大數(shù)據(jù)是一個(gè)相對(duì)概念。歷史上,數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)集市等信息管理領(lǐng)域的技術(shù),很大程度上也是為了解決大規(guī)模數(shù)據(jù)的問題。首先,大數(shù)據(jù)要對(duì)數(shù)據(jù)抽取與集成。大
2、數(shù)據(jù)的一個(gè)重要特點(diǎn)就是多樣性,這就意味著數(shù)據(jù)來(lái)源極其廣泛,數(shù)據(jù)類型極為繁雜。這種復(fù)雜的數(shù)據(jù)環(huán)境給大數(shù)據(jù)的處理帶來(lái)了極大的挑戰(zhàn)。要想處理大數(shù)據(jù),首先必須對(duì)所需數(shù)據(jù)源的數(shù)據(jù)進(jìn)行抽取和集成,從中提取出關(guān)系和實(shí)體,經(jīng)過(guò)關(guān)聯(lián)和聚合之后采用統(tǒng)一定義的結(jié)構(gòu)來(lái)存儲(chǔ)這些數(shù)據(jù)。在數(shù)據(jù)集成和提取時(shí)需要對(duì)數(shù)據(jù)進(jìn)行清洗,保證數(shù)據(jù)質(zhì)量及可信性?,F(xiàn)有的數(shù)據(jù)抽取與集成方式可以大致分為以下4種類型:數(shù)據(jù)整合、數(shù)據(jù)聯(lián)邦、數(shù)據(jù)傳播和混合方法等。數(shù)據(jù)分析是大數(shù)據(jù)的處理核心。傳統(tǒng)的分析技術(shù)如數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)分析等在大數(shù)據(jù)時(shí)代需要做出調(diào)整,因?yàn)檫@些技術(shù)在大數(shù)據(jù)時(shí)代面臨著一些新的挑戰(zhàn):例如,數(shù)據(jù)量大并不一定意味著數(shù)據(jù)價(jià)值的增加,相
3、反這往往意味著數(shù)據(jù)噪音的增多;大數(shù)據(jù)時(shí)代的算法需要進(jìn)行調(diào)整。雖然數(shù)據(jù)分析是大數(shù)據(jù)處理的核心,但是用戶往往更關(guān)心結(jié)果的展示,這就需要數(shù)據(jù)解釋。如果分析的結(jié)果正確但是沒有采用適當(dāng)?shù)慕忉尫椒ǎ瑒t所得到的結(jié)果很可能讓用戶難以理解,極端情況下甚至?xí)`導(dǎo)用戶。大數(shù)據(jù)時(shí)代的數(shù)據(jù)分析結(jié)果往往也是海量的,同時(shí)結(jié)果之間的關(guān)聯(lián)關(guān)系極其復(fù)雜,采用傳統(tǒng)的解釋方法基本不可行,可以考慮引入可視化技術(shù),提升數(shù)據(jù)解釋能力,讓用戶能夠在一定程度上了解和參與具體的分析過(guò)程。然而,大數(shù)據(jù)作為一個(gè)專有名詞成為熱點(diǎn),主要應(yīng)歸功于近年來(lái)互聯(lián)網(wǎng)、云計(jì)算、移動(dòng)和物聯(lián)網(wǎng)的迅猛發(fā)展。無(wú)所不在的移動(dòng)設(shè)備、rfid、無(wú)限傳感器每分每秒都在產(chǎn)生數(shù)據(jù),數(shù)
4、以億計(jì)用戶的互聯(lián)網(wǎng)服務(wù)時(shí)時(shí)刻刻在產(chǎn)生巨量的交互要處理的數(shù)據(jù)量太長(zhǎng),增長(zhǎng)太快,而業(yè)務(wù)需求和競(jìng)爭(zhēng)壓力對(duì)數(shù)據(jù)處理的實(shí)時(shí)性、有效性又提出了更高要求,傳統(tǒng)的常規(guī)技術(shù)手段根本無(wú)法應(yīng)付。在這種情況下,技術(shù)人員紛紛研發(fā)和采用了一批新技術(shù)。2基于大數(shù)據(jù)對(duì)專利信息的深度分析隨著科學(xué)技術(shù)的迅速發(fā)展,國(guó)內(nèi)外企業(yè)之間的競(jìng)爭(zhēng)日趨激烈。企業(yè)要想在競(jìng)爭(zhēng)中立于不敗之地,就一定要具備技術(shù)能力,要搶先參與開發(fā)新技術(shù)、獲取和利用新技術(shù)的競(jìng)爭(zhēng)。專利是世界上最大的技術(shù)信息源,但如此巨大的信息資源卻遠(yuǎn)未被人們充分利用。因此,只要應(yīng)用大數(shù)據(jù)對(duì)其進(jìn)行分析和挖掘,便可以實(shí)現(xiàn)其特有的經(jīng)濟(jì)價(jià)值。2.1大數(shù)據(jù)分析與傳統(tǒng)數(shù)據(jù)分析的區(qū)別大數(shù)據(jù)分析與傳統(tǒng)的
5、數(shù)據(jù)分析方法(如查詢、報(bào)表、聯(lián)機(jī)應(yīng)用分析)的本質(zhì)區(qū)別是大數(shù)據(jù)是在沒有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識(shí)。大數(shù)據(jù)所得到的信息應(yīng)具有先未知、有效和可實(shí)用3個(gè)特性。(1)“先未知”性是指該信息是預(yù)先未曾預(yù)料到的,即大數(shù)據(jù)是要發(fā)現(xiàn)那些不能靠直覺發(fā)現(xiàn)的信息或知識(shí),甚至是違背直覺的信息或知識(shí),挖掘出的信息越是出乎意料就可能越有價(jià)值。(2)“有效”性指的是大數(shù)據(jù)是面向海量數(shù)據(jù)的,而任何傳統(tǒng)的統(tǒng)計(jì)、分析方法對(duì)此則是束手無(wú)策的,因此可以說(shuō)大數(shù)據(jù)技術(shù)為解決“數(shù)據(jù)爆炸但知識(shí)貧乏”的問題提供了出路。(3)“可實(shí)用”性是指大數(shù)據(jù)技術(shù)已經(jīng)不再是“實(shí)驗(yàn)室里的玩具”。大數(shù)據(jù)利用現(xiàn)代的軟件技術(shù)和計(jì)算機(jī)技術(shù),把對(duì)于普通用戶來(lái)說(shuō)
6、是高深復(fù)雜的技術(shù)封裝起來(lái);并且可以利用多種技術(shù)的結(jié)合實(shí)現(xiàn)傳統(tǒng)分析方法所不能完成的內(nèi)容,具有方便快捷、可視化程度高的優(yōu)點(diǎn)。2.2大數(shù)據(jù)分析拓展專利信息分析的深度和廣度基于大數(shù)據(jù)技術(shù)的專利信息分析即以專利數(shù)據(jù)以及期刊文獻(xiàn)為研究對(duì)象,將專利信息的技術(shù)內(nèi)容集成化、數(shù)據(jù)化、然后進(jìn)行加工和分析、識(shí)別有效的、新穎的、潛在有用的,以及最終可理解的知識(shí)的過(guò)程。大數(shù)據(jù)分析就是在現(xiàn)有分析方法上架設(shè)了一個(gè)800萬(wàn)倍顯微鏡,并可以進(jìn)行更深、更細(xì)微層次的系統(tǒng)性分析。用此方法處理專利信息,易于綜合地把握大量專利信息。實(shí)際應(yīng)用中,大量的應(yīng)用大數(shù)據(jù)技術(shù)的目的是搜集、分析特定技術(shù)或產(chǎn)品的專利信息,掌握該專利領(lǐng)域中不同公司的專利技
7、術(shù)研究情況,并把每個(gè)單一的情報(bào)綜合起來(lái),然后采取統(tǒng)計(jì)分析、技術(shù)群組、文本挖掘、組合理論、專利地圖等技術(shù),對(duì)其進(jìn)行信息分析,并以統(tǒng)計(jì)圖譜、關(guān)聯(lián)圖譜和報(bào)告等形式展現(xiàn)出來(lái),即通過(guò)復(fù)雜計(jì)算,發(fā)現(xiàn)隱藏在大數(shù)據(jù)中的各種潛在相關(guān)模式,而這些淹沒在近于無(wú)窮的大數(shù)據(jù)中的相關(guān)模式是無(wú)法被人通過(guò)有限的檢索策略與傳統(tǒng)分析方法發(fā)現(xiàn)的。2.3大數(shù)據(jù)分析專利信息的流程基于大數(shù)據(jù)的專利信息分析過(guò)程包括專利申請(qǐng)數(shù)據(jù)的獲取、數(shù)據(jù)預(yù)處理、數(shù)據(jù)重構(gòu),以及數(shù)據(jù)分析。2.3.1數(shù)據(jù)獲取可通過(guò)中國(guó)知識(shí)產(chǎn)權(quán)局網(wǎng)站,專利商業(yè)網(wǎng)站patentics,incopat等獲取專利申請(qǐng)數(shù)據(jù)作為數(shù)據(jù)來(lái)源,將所需的某個(gè)公司或者某個(gè)技術(shù)領(lǐng)域的申請(qǐng)數(shù)據(jù)進(jìn)行提取
8、,導(dǎo)出,保存,以便為后續(xù)處理使用。2.3.2數(shù)據(jù)預(yù)處理數(shù)據(jù)清理是大數(shù)據(jù)分析的必要環(huán)節(jié),由于數(shù)據(jù)在傳輸過(guò)程中極易受到造勢(shì)數(shù)據(jù)、空缺數(shù)據(jù)和不一致數(shù)據(jù)的侵?jǐn)_,若不進(jìn)行數(shù)據(jù)清理則建立的數(shù)據(jù)庫(kù)的可用性將大大降低,而以此數(shù)據(jù)庫(kù)進(jìn)行的數(shù)據(jù)挖掘得到的分析結(jié)果質(zhì)量將難以保障。通過(guò)各種轉(zhuǎn)換方法將數(shù)據(jù)轉(zhuǎn)換成有效形式,為今后的數(shù)據(jù)挖掘做好了準(zhǔn)備工作。同時(shí),通過(guò)數(shù)據(jù)轉(zhuǎn)變,可以對(duì)數(shù)據(jù)做簡(jiǎn)單的泛化處理。2.3.3數(shù)據(jù)重構(gòu)數(shù)據(jù)重構(gòu)就是將在數(shù)據(jù)挖掘過(guò)程中獲取的海量數(shù)據(jù)經(jīng)過(guò)融合和集成,形成一個(gè)龐大而又復(fù)雜的本地?cái)?shù)據(jù)庫(kù),在對(duì)數(shù)據(jù)進(jìn)行分析之前存在一個(gè)中間過(guò)程。此中間過(guò)程即為根據(jù)分析需求,通過(guò)概念理解、生成規(guī)則、方法選取、最后是算法實(shí)
9、現(xiàn),將原始數(shù)據(jù)重構(gòu)或者提煉一個(gè)數(shù)據(jù)全面、準(zhǔn)確而又合乎分析需求的數(shù)據(jù)庫(kù)的過(guò)程。2.3.4基于文本大數(shù)據(jù)技術(shù)的專利分析項(xiàng)目(1)專利申請(qǐng)類型分析。我國(guó)的專利申請(qǐng)有發(fā)明專利、實(shí)用新型、外觀設(shè)計(jì)專利3種。對(duì)這3種不同類型的專利申請(qǐng)所占的份額加以比較,可以幫助判斷該領(lǐng)域技術(shù)的發(fā)展情況。(2)專利申請(qǐng)量分析。專利申請(qǐng)量在一定程度上講是市場(chǎng)需求的表現(xiàn),針對(duì)申請(qǐng)量的逐年變化情況進(jìn)行統(tǒng)計(jì)分析,對(duì)了解技術(shù)的發(fā)展和市場(chǎng)需求情況均有裨益。(3)技術(shù)構(gòu)成分析。通過(guò)分析專利涉及的所有ipc分類號(hào),以及這些ipc分類號(hào)下分別包括的專利數(shù)量,就能獲知整個(gè)區(qū)域的技術(shù)構(gòu)成情況,以及該區(qū)域內(nèi)市場(chǎng)經(jīng)營(yíng)主體關(guān)注的技術(shù)熱點(diǎn)。(4)時(shí)間趨
10、勢(shì)分析。是在上述技術(shù)構(gòu)成分析的基礎(chǔ)上加入了時(shí)間維度所形成的一種分析方法,即考察不同ipc分類號(hào)下或不同技術(shù)分類、技術(shù)效果等領(lǐng)域內(nèi)的專利數(shù)量隨時(shí)間的分布情況,由此繪出的專利地圖可以直觀地判斷技術(shù)發(fā)展的潮流趨勢(shì)和發(fā)展?fàn)顩r。(5)關(guān)聯(lián)分析。目的是找出專利情報(bào)中隱藏的有趣的關(guān)聯(lián)網(wǎng),描述一組專利之間的密切度。具體操作方法包括關(guān)聯(lián)矩陣和基于距離測(cè)度理論的關(guān)聯(lián)圖。2.3.5知識(shí)表示將分析結(jié)果以用戶容易理解的方式(關(guān)聯(lián)圖和統(tǒng)計(jì)表)把挖掘到的知識(shí)呈現(xiàn)出來(lái),使用戶可洞察最前沿的科研動(dòng)態(tài),迅速把握特定技術(shù)發(fā)展的方向,準(zhǔn)確預(yù)測(cè)未來(lái)技術(shù)創(chuàng)新的趨勢(shì)。4結(jié)束語(yǔ)大數(shù)據(jù)時(shí)代的到來(lái)為專利分析提供了新的技術(shù)工具和技術(shù)思路,這對(duì)于從業(yè)者來(lái)說(shuō)既是挑戰(zhàn)又是機(jī)遇。未來(lái),專利分析的重要研究方向是充分利
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年電影院廣告投放與品牌合作合同2篇
- 二零二五年知識(shí)產(chǎn)權(quán)許可特別合同2篇
- 二零二五年度留學(xué)國(guó)家與學(xué)校選擇合同2篇
- 二零二五年網(wǎng)紅直播廣告合作合同1200字范本3篇
- 二零二五版礦山資產(chǎn)轉(zhuǎn)讓與資源補(bǔ)償合同3篇
- 二零二五年度邊溝工程防滲漏與防水害合同2篇
- 二零二五年度跨江大橋PC構(gòu)件預(yù)制及吊裝工程合同3篇
- 二零二五年度軟件許可與維護(hù)合同3篇
- 2025年度網(wǎng)絡(luò)安全防護(hù)軟件開發(fā)類框架合同3篇
- 小區(qū)物業(yè)保潔勞務(wù)合同(2篇)
- 2025年下半年貴州高速公路集團(tuán)限公司統(tǒng)一公開招聘119人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 資產(chǎn)評(píng)估服務(wù)房屋征收項(xiàng)目測(cè)繪實(shí)施方案
- 2025年經(jīng)濟(jì)形勢(shì)會(huì)議講話報(bào)告
- 北師大版小學(xué)三年級(jí)上冊(cè)數(shù)學(xué)第五單元《周長(zhǎng)》測(cè)試卷(含答案)
- 國(guó)家安全責(zé)任制落實(shí)情況報(bào)告3篇
- 2024年度順豐快遞冷鏈物流服務(wù)合同3篇
- 六年級(jí)下冊(cè)【默寫表】(牛津上海版、深圳版)(漢譯英)
- 合同簽訂培訓(xùn)
- 電工基礎(chǔ)知識(shí)培訓(xùn)課程
- 鐵路基礎(chǔ)知識(shí)題庫(kù)單選題100道及答案解析
- 金融AI:顛覆與重塑-深化理解AI在金融行業(yè)的實(shí)踐與挑戰(zhàn)
評(píng)論
0/150
提交評(píng)論