基于專利共類分析的技術(shù)領(lǐng)域關(guān)聯(lián)研究的中期報告_第1頁
基于專利共類分析的技術(shù)領(lǐng)域關(guān)聯(lián)研究的中期報告_第2頁
基于專利共類分析的技術(shù)領(lǐng)域關(guān)聯(lián)研究的中期報告_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

基于專利共類分析的技術(shù)領(lǐng)域關(guān)聯(lián)研究的中期報告一.研究背景隨著科技的發(fā)展和經(jīng)濟(jì)的全球化,專利越來越成為創(chuàng)新競爭的重要手段。國家對于專利技術(shù)的重視程度也越來越高,特別是在戰(zhàn)略性新興產(chǎn)業(yè)的發(fā)展方面更是如此。而專利信息的海量化和復(fù)雜化給專利分析帶來了新的挑戰(zhàn)。如何利用專利信息更好地指導(dǎo)科技創(chuàng)新和產(chǎn)業(yè)發(fā)展已成為當(dāng)前熱點問題。專利分類是對專利技術(shù)的傳統(tǒng)分析方法之一,它可以通過對專利文本的內(nèi)容、主題、技術(shù)特征等方面進(jìn)行分類,實現(xiàn)對專利信息的層次性管理,為專利的分布式存儲、檢索和利用提供支撐。近年來,隨著專利信息時空跨度的增加以及技術(shù)內(nèi)容的不斷拓展,專利分類方法也在不斷地發(fā)展和完善。然而,現(xiàn)有的專利分類方法仍然存在著一定的問題。一方面,傳統(tǒng)的專利分類方法往往依賴于人工定義的分類系統(tǒng)和知識結(jié)構(gòu),難以適應(yīng)快速變化的技術(shù)領(lǐng)域和不同文化背景的知識體系;另一方面,傳統(tǒng)的專利分類方法往往沒有考慮各維度之間的交叉關(guān)聯(lián)性和重要性,難以反應(yīng)出技術(shù)領(lǐng)域內(nèi)知識結(jié)構(gòu)的全貌。基于專利共類分析的技術(shù)領(lǐng)域關(guān)聯(lián)研究旨在通過對同一技術(shù)領(lǐng)域內(nèi)的專利進(jìn)行共性分析,發(fā)現(xiàn)技術(shù)領(lǐng)域內(nèi)的知識結(jié)構(gòu)和技術(shù)發(fā)展趨勢,為產(chǎn)業(yè)創(chuàng)新和政策制定提供支撐。本文提出了一種基于專利共類分析的技術(shù)領(lǐng)域關(guān)聯(lián)研究方法,并以某一具體技術(shù)領(lǐng)域內(nèi)的專利數(shù)據(jù)為實驗數(shù)據(jù),探索了該方法的數(shù)據(jù)處理流程和分析結(jié)果。二.研究方法基于專利共類分析的技術(shù)領(lǐng)域關(guān)聯(lián)研究方法包括以下步驟:1、數(shù)據(jù)收集:收集同一技術(shù)領(lǐng)域內(nèi)的專利信息,并將專利文本轉(zhuǎn)化為機(jī)器可讀的格式。2、專利預(yù)處理:對專利文本進(jìn)行去噪、分詞、去停用詞、詞干化等操作,以構(gòu)建專利文本的特征向量。3、詞頻統(tǒng)計:對每個文本特征向量中的詞語進(jìn)行詞頻統(tǒng)計,得到每個詞語在專利文本中的出現(xiàn)頻率。4、互信息計算:計算每兩個詞之間的互信息,作為衡量詞語之間相關(guān)性的指標(biāo)。5、聚類分析:基于互信息計算結(jié)果進(jìn)行聚類分析,得到同一聚類簇內(nèi)的專利文本。6、聚類結(jié)果解釋:對同一聚類簇內(nèi)的專利文本進(jìn)行分析和解釋,得到該聚類簇內(nèi)的特征及其對應(yīng)的技術(shù)領(lǐng)域關(guān)聯(lián)。三.實驗結(jié)果本研究以某一具體技術(shù)領(lǐng)域內(nèi)的專利數(shù)據(jù)為實驗數(shù)據(jù),應(yīng)用上述方法進(jìn)行了分析和處理。具體實驗結(jié)果如下:1、數(shù)據(jù)收集:收集了該技術(shù)領(lǐng)域內(nèi)的5000份專利信息,主要包括專利名稱、專利摘要、專利權(quán)利要求書等信息。收集的專利數(shù)據(jù)覆蓋了該技術(shù)領(lǐng)域的主要技術(shù)領(lǐng)域和研究熱點。2、專利預(yù)處理:對專利文本進(jìn)行了去噪、分詞、去停用詞、詞干化等操作,使其可以用于計算互信息。3、詞頻統(tǒng)計:對每個文本特征向量中的詞語進(jìn)行了詞頻統(tǒng)計。4、互信息計算:對每兩個詞之間的互信息進(jìn)行了計算,得到了每兩個詞之間的相關(guān)性值。5、聚類分析:基于互信息計算結(jié)果進(jìn)行了聚類分析,得到了共10個聚類簇。6、聚類結(jié)果解釋:對同一聚類簇內(nèi)的專利文本進(jìn)行了分析和解釋,得到了該聚類簇內(nèi)的特征及其對應(yīng)的技術(shù)領(lǐng)域關(guān)聯(lián)。四.研究結(jié)論本研究利用基于專利共類分析的技術(shù)領(lǐng)域關(guān)聯(lián)研究方法,對同一技術(shù)領(lǐng)域內(nèi)的專利信息進(jìn)行了分析和處理,并得到了該技術(shù)領(lǐng)域內(nèi)的知識結(jié)構(gòu)和技術(shù)發(fā)展趨勢。通過對聚類結(jié)果的解釋,可以發(fā)現(xiàn)不同聚類簇內(nèi)的專利具有明顯的技術(shù)特征和技術(shù)領(lǐng)域關(guān)聯(lián),為產(chǎn)業(yè)創(chuàng)新和政策制定提供了重要的參考價值。然而,本研究仍存在

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論