版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、中國專利數(shù)據(jù)庫標引質量測評D01:10.3969/j.issn.l00808 21.2010.12.016Evaluation on China Patent Databases Indexing QualityLi Hongfang Zou Xiaozhu(Institute of Scientific Technology Information Nanjing University of Aeronautics and Astronautics ,Nanjing 210016 , China )AbstractPate nt in formati on resourcesconstruc
2、tion plays an important role on the construction of innovative country.The indexing of patent database plays a fundamental role on the intelligence mining of patent information.Though analysing the related subject retrieval of data,discussing the depth of the patent indexing,keywords,average word lo
3、ng,consistency and relatively equal ratio,assessing patent databases indexing status,providing standard for China patent databases construction.Keywords pate nt database;indexing;retrieval;quality隨著現(xiàn)代信息技術的迅速發(fā)展, 網(wǎng)絡信息的日益膨脹, 專利 對保護自主知識產權方面起著重要的作用, 專利信息也是首選的 競爭情報源,是取之不盡、用之不竭的寶庫。對專利信息進行分 析,是科研機構進行科學研究,企業(yè)
4、進行發(fā)展決策、國家進行戰(zhàn) 略決策的重要參考依據(jù)。 當各種專利數(shù)據(jù)庫不斷涌現(xiàn)時, 其中出 現(xiàn)的問題也不斷暴露, 如專利數(shù)據(jù)庫的標引問題。 專利標引是建 立專利數(shù)據(jù)庫系統(tǒng), 進行專利檢索的重要環(huán)節(jié), 是進行專利信息 分析獲取競爭情報的基礎和關鍵, 專利數(shù)據(jù)庫的標引質量日益成 為值得研究的課題。1我國專利數(shù)據(jù)庫標引概況1. 1我國專利數(shù)據(jù)庫簡介我國專利數(shù)據(jù)庫眾多, 為了對專利標引問題進行研究, 主要 選取其中較權威的 3個專利數(shù)據(jù)庫: 國家知識產權局專利檢索系 統(tǒng)、中國專利信息中心、中國知識產權網(wǎng)進行比較6。中國專利信息中心,建于 1988 年 5 月,可檢索國內外專利 數(shù)據(jù)庫,使用該系統(tǒng)前應先行注
5、冊,分為免費和交會員費用戶。 收錄了我國自 1985 年出版專利文獻以來的發(fā)明專利信息和實用 新型專利信息。 可瀏覽或保存專利的主附圖、 公開說明書以及授 權說明書的信息圖片( tif 文件),需下載瀏覽器插件。中國知識產權網(wǎng)是中外專利數(shù)據(jù)庫服務平臺, 主要提供對中 國專利和國外(美國、日本、英國、德國、法國、歐洲專利局、 WIPO瑞士)專利檢索。收錄 1985年以來的全部發(fā)明專利、實 用新型專利、外觀設計專利??梢钥闯?,在 3個數(shù)據(jù)庫中, 國家知識產權局和中國知識產 權網(wǎng)均不需注冊, 即可免費查找和檢索全部專利信息, 而中國專 利信息中心則需進行注冊,會員還需交費。此外,中國專利信息 中心并
6、不涉及外觀設計專利。1 . 2我國專利數(shù)據(jù)庫標引加工現(xiàn)狀情報檢索語言的全面性和專指性對情報檢索效率有著重要 影響,同樣,專利檢索語言對專利數(shù)據(jù)庫的檢索效率也有著重要 影響。情報檢索語言按其結構原理,可分為分類檢索語言、主題 檢索語言、代碼檢索語言三大類型3。其中常用的主要是分 類和主題檢索語言, 分析 3 個數(shù)據(jù)的檢索字段可得到其標引現(xiàn)狀 如表1所示:表1 3 個專利數(shù)據(jù)庫標引現(xiàn)狀2 標引數(shù)據(jù)獲取與分析2 . 1 標引數(shù)據(jù)獲取方法筆者采用定量與定性相結合的方法對專利數(shù)據(jù)庫的標引工 作進行了研究,文中采用的 63 個以“傳動”為主題的專利數(shù)據(jù) 是通過對中國知識產權局、 專利信息中心和知識產權網(wǎng)
7、3 個專利 數(shù)據(jù)庫進行多字段綜合檢索, 與行業(yè)專家溝通, 按“傳動特點” 篩選出 63 個密切相關的專利。同時,采用的其他專利數(shù)據(jù),也 是對專利數(shù)據(jù)庫進行綜合檢索的結果。2 . 2 專利標引質量分析從專利數(shù)據(jù)庫檢索和標引兩個角度對我國專利標引質量的 若干問題進行測評。2 . 2 . 1標引深度專利標引深度是指一個專利中所論述的主題概念被確認并 轉化為檢索標識的完備程度, 是根據(jù)專利主題概念內容揭示的廣 度衡量標引質量的一個因素。 專利標引深度的選取對用戶檢索的 查全率和查準率有著重要的影響。國家知識產權局專利檢索系統(tǒng)、 中國專利信息中心和中國知 識產權網(wǎng)都對專利數(shù)據(jù)進行了不同的標引, 但仍存在
8、標引深度不 夠的問題。如:專利名稱為“行星齒輪箱”的 4個不同專利, 均是發(fā)明 專利,專利號分別為“ 03119913.5”、“200480031236.6”、 “200480030916.6”、“200580004698.3”, 但是簡單地從其標 引項中并不能對其專利進行區(qū)分, 必須對這 4 個專利說明書進行 主題分析、深度挖掘才能區(qū)分。如通過對專利內容進行分析: “03119913.5”專利實現(xiàn)了傳動大速比, 應用了圓柱齒輪, 而且 主要應用于印刷機方面; “200480031236.6”專利在潤滑發(fā)明進 行了改進;“ 200480030916.6”專利采用了滑動套筒、定心束, 實現(xiàn)了微振
9、動; “200580004698.3”使用了間隙調整件, 實現(xiàn)了 4 個專利的區(qū)分。筆者結合漢語主題詞表和航天科學技術敘詞表,分 別對主題為“傳動”的專利進行深度標引,每個專圖1 手工標 引流程利選取510個主題詞。設第i個專利的主題詞個數(shù)為ai, n個專利的平均標引深度為?A疲岐? i/n ? B ?則本主題平 均標引深度為 6.1 ,無疑如果進行這樣的標引將大大提高標引深 度。2 . 2 . 3相對先組度復合概念可以由一個或多個單元詞進行組配, 也可以用一個 先組詞(復合詞)進行組配。先組度是指先組詞在主題表中所占 比例。因為漢語中分詞很困難, 所以采用“相對先組度”進行計 算。即相對先組
10、度=主題詞所包含單元詞的個數(shù)/主題詞總數(shù)。筆者對有關“傳動”的 63 個專利的主題詞進行先組度計 算,結果見表3:表3 相對先組度詞 長個 數(shù)詞 長個 數(shù) 11539255683159714125平均詞長3.19由表3可知, 主題詞主要集中在詞長為 3和 4的詞中, 通過 先組度,可以測量專利標引的質量。 在標引工作中, 先組度越高, 專利的專指度越高,從而提供的檢索入口越多,檢準率越高。2. 2 . 4標引的一致性 專利標引的一致性是指對相同主題的專利賦予檢索標識的 一致性程度。既可以指不同標引人員標引同一主題專利的一致 性,也可以指相同標引人員先后標引同一主題的一致性。 專利數(shù) 據(jù)庫標引的
11、一致性程度越高,檢索出的專利集中程度越高。筆者對“傳動”為主題的 63 個專利的分類標引數(shù)據(jù)進行統(tǒng)計,其中分類號統(tǒng)計見表4,范疇分類號統(tǒng)計見表5,通過兩個 表看我國專利數(shù)據(jù)庫的相同主題的專利集中程度, 以此來判斷專利標引質量的一致性程度。表4 分類號統(tǒng)計 分類號統(tǒng) 計分類號統(tǒng) 計B24B4F02N2B41F1F03D12B63H4F16C3B64C1F16D2E02F1F16H85E21D1H02K2表5 范疇分類號統(tǒng)計 范疇分類號統(tǒng) 計范疇分類號統(tǒng) 計27D5117J126E132E132G137A136A129B126F228C428B237B122A138B126D127B1從上面兩個表
12、可以看出, 專利的分類號標引和范疇標引一致性較好,集中程度較高,分別集中在“ F16H和“ 27D,即主 要集中在傳動裝置方面。下面對“傳動”主題的主要主題標引詞進行統(tǒng)計, 結果見表6:表6 主題詞統(tǒng)計主題詞個 數(shù)主題詞個 數(shù)傳動 60變速 1 6行星齒輪 58風力發(fā)電 14功率 33承載力 8減速器 28扭矩 6太陽輪 18由表6可以看出, 通過主題標引, 可以明顯的揭示專利的主題,以“傳動”為中心,集中度較高,一致性較好。同時可以得到專利所使用的技術, 實現(xiàn)的功能等方面的信息, 為專利信息的采集與利用打下了基礎,也為專利數(shù)據(jù)分析節(jié)省了人力和時間。在專利信息分析中, 進行分類號和主題詞的分析, 可以研究 專利的技術領域、 核心技術, 分析出某個國家或地區(qū)的技術競爭 優(yōu)勢等,取得學習和借鑒,進行技術創(chuàng)新。從表4、5、6三個 統(tǒng)計結果可以看出, 我國專利數(shù)據(jù)庫的分類號、 范疇分類號的標 引一致性較好, 但是對于主題標引工作有所欠缺, 由于分類標引 與主題標引作用的不同,應該加強主題標引。2 . 2 . 5相對等同率相對等同率是指相同主題的專利標引詞中, 非標準主題詞與 標準主題詞
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度個人珠寶首飾分期購買合同6篇
- 二零二五年度棉被產品售后服務協(xié)議4篇
- 2025年度個人住宅地下室防水防潮合同范本4篇
- 二零二五年度美團商家入駐信息安全管理合同4篇
- 2025年個人購房貸款利率變動通知合同2篇
- 建筑設計協(xié)調合同(2篇)
- 支模超高施工方案
- 施工方案五必須
- 2025年銷售部勞動合同加班補貼范本
- 2025年銷售經理崗位競聘協(xié)議范本2篇
- 天津市武清區(qū)2024-2025學年八年級(上)期末物理試卷(含解析)
- 《徐霞客傳正版》課件
- 江西硅博化工有限公司年產5000噸硅樹脂項目環(huán)境影響評價
- 高端民用航空復材智能制造交付中心項目環(huán)評資料環(huán)境影響
- 量子醫(yī)學成像學行業(yè)研究報告
- DB22T 3268-2021 糧食收儲企業(yè)安全生產標準化評定規(guī)范
- 辦事居間協(xié)議合同范例
- 正念減壓療法詳解課件
- GB 30254-2024高壓三相籠型異步電動機能效限定值及能效等級
- 阿米巴落地實操方案
- 藥物制劑工(三級)理論試題題庫及答案
評論
0/150
提交評論