唯一的檢索系統(tǒng)-patentics企業(yè)版.ppt_第1頁
唯一的檢索系統(tǒng)-patentics企業(yè)版.ppt_第2頁
唯一的檢索系統(tǒng)-patentics企業(yè)版.ppt_第3頁
唯一的檢索系統(tǒng)-patentics企業(yè)版.ppt_第4頁
唯一的檢索系統(tǒng)-patentics企業(yè)版.ppt_第5頁
已閱讀5頁,還剩40頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1,唯一的檢索系統(tǒng)-patentics,Patentics 創(chuàng)新,P為當今世界上僅有可以自動理解全世界專利的第一個超大型概念搜索引擎; 在搜索(包括專利)歷史上的首次,Patentics的自動計算排序結果,與全世界專利審查員遞交PCT的X/Y/A搜索報告進行大規(guī)模比對; 統(tǒng)計測試比對包括全部 USPTO2000-2009年遞交PCT共133,126篇(英文); EPO2000-2009年遞交PCT共122,301篇(英文); JPO2000-2009年遞交PCT共114,953篇(英文); KIPO2001-2009年遞交PCT共16,839篇(英文); SIPO2004-2009年遞交PCT

2、共15,522篇(中、英文)。,2,核心思想,“R/”:將檢索結果根據某個語義來排序。可以在檢索結果非常多的情況下將最相關的文獻呈現(xiàn)到最前面。是與傳統(tǒng)檢索系統(tǒng)的主要區(qū)別;大幅提升檢索效果的主要手段。,第一步:不輸入任何檢索要素,直接對數(shù)據庫中的所有結果排序。大量統(tǒng)計分析表明有50%的案子能夠很容易獲得對比文件。 R/CN101091890 and di/2007-07-26sipo審查員給出的X對比文件(CN1857239)排在第一位。瀏覽1篇文獻即可獲得對比文件,完成檢索需要5分鐘。,第一類任務(50%案子),5,第一步:r/cn101079912 and di/20070711,直接對所有

3、專利排序,假設,感覺排在前面的專利不太合適,無法用作對比文件。 注:受傳統(tǒng)系統(tǒng)限制, PCT檢索報告,用了10個以上的關鍵詞來限定,第二類任務(40%案子),6,第二步:只需要使用一個關鍵詞“氣味”,獲得21222篇文獻,然后系統(tǒng)自動根據與本案的語義相關度排序,審查員給出的X對比文件(CN1727009 ;CN1568083 ;CN1484163 )都排在第一屏。約40%的案子可以用這樣的簡單策略完成檢索。這類檢索平均耗時1小時。,7,第三類任務(10%案子),第一步:直接對所有專利排序,假設,感覺排在前面的專利不太合適,無法用作對比文件。,第二步:增加一個關鍵詞作為限定,假設,感覺排在前面的

4、專利還是不太合適。,第三步:再增加一個關鍵詞,PCT檢索報告中給出的對比文件位于前列。,8,成為唯一選擇的原因,唯一選擇是只用這個,而不需要再使用其他檢索系統(tǒng)。 唯一選擇是所有案子都用,而不是部分案子用。 唯一選擇是所有用戶都可以用,而不是有很高檢索經驗的人用。,9,成為唯一選擇的原因,數(shù)據量 6,256,574篇美國授權/申請全文 : 1971/4/132009/12/8 2,943,534篇中國發(fā)明/實用申請全文 :1985/9/102009/12/2 1,270,475篇EP申請全文 : 1978/12/202009/7/22 1,275,752篇WO申請全文 : 1978/12/720

5、09/7/9 29,406,252篇42國英文摘要 : 1900/1/22009/7/30 并實時更新。 多于SIPO+EPO+USPTO+出版社全文,10,成為唯一選擇的原因,任何系統(tǒng)漏檢的原因檢索要素是漏檢之源。檢索要素用于從全部數(shù)據中劃分出一部分數(shù)據,任何的考慮不周都會導致一部分合適的結果沒有被劃分進入。遺憾的是,考慮不周無法避免。,成為唯一選擇的原因,審查員檢索過程:,審查員在常規(guī)檢索系統(tǒng)中,需要將多個檢索要素相與,從而將檢索結果限定到可閱讀的范圍。 “錢包”的各種表達形式,已經導至漏檢的可能性不可避免!,12,成為唯一選擇的原因,漏檢的計算傳統(tǒng)系統(tǒng)中為了將檢索結果限定到合理的范圍需要

6、多個檢索要素的組合。四個檢索要素是非常常見的: 檢索要素A*檢索要素B*檢索要素C*檢索要素D熟練檢索員:90%*90%*90%*90%=66%(漏檢34%) 普通檢索員:80%*80%*80%*80%=41%(漏檢59%),13,成為唯一選擇的原因,Patentics的原理: 有了語義技術以后,就不需要將檢索結果限定都合理的范圍,所以不用很多檢索要素。不用或用很少的檢索要素,通過語義對大量文獻排序,最相關的就會呈現(xiàn)在所有結果的最上面。,14,成為唯一選擇的原因,PATENTICS絕大部分案子不需要任何檢索要素(約50%)或只用一個檢索要素(約40%),很少一部分需要用多個檢索要素(約10%)

7、。避免漏檢的能力成倍提高。 理論上的最壞極端情況(幾乎不會出現(xiàn)) :常規(guī)檢索系統(tǒng)用幾個檢索要素,我們也用幾個。漏檢的可能性相同。,15,成為唯一選擇的原因,瀏覽效率提高 常規(guī)系統(tǒng)的檢索結果是根據公開時間排序的,即使獲得100個結果,也許可用的結果會在70位,則需要瀏覽70個才發(fā)現(xiàn); 而PATENTICS通過語義排序后,最相關的在最前面,瀏覽效率大大提高。,案例: CN1989859 特別用于運動鞋的內靴 權1: 一種內靴,特別地用于運動鞋諸如滑雪鞋、直排輪旱冰鞋或滑冰鞋,包括前部(2)和后部(6),前部覆蓋使用者的腳趾和前腳部分,后部在腳弓到腳跟的區(qū)域延伸;前部(2)通過一個或多個相互連接波紋

8、帶(14)連接到后部(6),波紋帶(14)在靜止位置具有最大伸長量。,成為唯一選擇的原因,審查員的檢索過程:(bellow or bellows or flexible or deformable) and (inner or inside) and (A43B5/16 OR A43B5/04 OR A43B5/18)/IC對比文件是:EP0308368(同族US4893417), US4268931,成為唯一選擇的原因,在patentics中也可用同樣的檢索式檢索所有中/英文專利; 如果是根據公開日排序的話,該對比文件出現(xiàn)在280多位; 而同樣的檢索結果,根據該案的語義排序,該對比文件出現(xiàn)在

9、第6位。僅僅需要瀏覽1/50的文檔。瀏覽效率提高50倍。,(B/bellow or B/bellows or B/flexible or B/deformable) and (B/inner or B/inside) AND ICL/(A43B5/16 OR A43B5/04 OR A43B5/18) AND R/CN1989859 AND DI/20051229,其實,我們不輸入任何檢索要素也能獲得該對比文件!,也僅需要瀏覽13篇即可獲得,瀏覽效率是傳統(tǒng)方法的20多倍! 節(jié)省傳統(tǒng)復雜檢索表達式的嘗試、瀏覽過程,檢少漏檢可能!,更多X文獻可能在這里,即那些在傳統(tǒng)方法中可能漏檢的,中國公開號直接

10、輸入,直接選英文庫,?,21,成為唯一選擇的原因,對用戶的要求常規(guī)系統(tǒng)需要組合多個檢索要素,每個檢索要素中還包括一個或多個關鍵詞和/或分類號,難度很大。Patentics:如果直接輸入公開號獲得對比文件,不需要任何經驗的人都會;如果需要一兩個檢索要素的,通過今天的培訓都會。,22,成為唯一選擇的原因,通過實測來證明Patentics的正確性! 通過實測來給用戶信心! 大量統(tǒng)計數(shù)據證明1 分析了SIPO2004-2009所做的15522個PCT檢索,其中的中文XY對比文件,我們的機器自動對所有300多萬篇中國專利排序,不需要任何人的智慧,就能容易獲得很多對比文件。效果是非常驚人的。 ,統(tǒng)計測試結

11、果,全部:6603個X 引用;命中: 4051個 (61%) ; 沒有命中:2552個(39%); TOP 1: 395個 5.98%第一位置 TOP 20: 1674個 25.35%第一屏 TOP 100: 2831個 41.0980%前5屏 TOP 400: 4051個 61.35%前20屏 不需任何檢索策略,盡輸入一專利公開號, Patentics智能排序引擎,能實現(xiàn); 6%可能排序第一位置的是審查員心目中的X文獻; 25%可能在第一屏發(fā)現(xiàn)X文獻; 41%可能在前五屏發(fā)現(xiàn)X文獻!,23,24,成為唯一選擇的原因,證據證明2:傳統(tǒng)系統(tǒng)存在大量漏檢,patentics能幫助改善 很多SIPO

12、復審委的無效決定中給出的新對比文件,在patentics中位于前列; 很多EPO的B1中沒有的而在B2中無效請求人提交的對比文件,在patentics中位于前列; 很多SIPO的PCT檢索中只給出了A,而EPO給出的XY,在patentics中位于前列。,25,全面解決問題的方法,基礎模式:用檢索要素限定范圍或不限定范圍 and r/排序基準,26,全面解決問題的方法,排序基準:就是你想讓什么樣的文獻排在最上面,如果是查新檢索,我們當然希望與案子最相關的在最上面,所以排序基準就是該案子的整個文檔,排序基準的文本內容越多,排序效果越好; 普通檢索建議直接用公開號做排序基準; 如果是PCT檢索還沒

13、有文本,那么可以手工輸入摘要或權利要求等內容作為排序基準; 在英文庫也可以用中國專利作為排序基準。,27,全面解決問題的方法,用檢索要素限定范圍或不限定范圍; 能限定范圍就限定范圍,主要采用關鍵詞(常規(guī)檢索系統(tǒng)具有的檢索功能,patentics都具有,各種分類號,連詞符,截詞符等都可以用); 無法限定范圍或不想限定范圍就什么都不做,不限定就是對所有文獻排序,取400個最相關的排出。,28,全面解決問題的方法,推介的方法:1)先不限定范圍,直接用公開號對所有專利排序,看看排在前面的是否直接能用,有的話檢索結束。2)然后,采用B/關鍵詞 and r/公開號限定出一個范圍,可能是幾萬篇或幾千篇,再用

14、案子排序。,29,全面解決問題的方法,關鍵詞選擇原則:不一定要是發(fā)明點原則是要能有一定的限定功能,且盡可能不導致漏檢,通俗的說就是我想要的對比文件中一定會出現(xiàn)的詞。,30,全面解決問題的方法,中國專利公開號:CN1728450用于移動終端的天線支架,優(yōu)先權日20040721 檢索員通過分析申請,認為對比文件中必須包含這兩個詞:antenna和rotatable用這兩個關鍵詞在美國申請和美國專利庫中獲得公開日在20040721前的5251項結果。常規(guī)檢索系統(tǒng)中,檢索員還必須進一步限定。否則無法閱讀。如果用戶需要增加移動電話這個檢索要素,所以輸入了關鍵詞MOBILE。就會導致US5771466的漏

15、檢,US5771466中沒有用MOBILE這個詞,而是“Portable radio transceiver”。檢索要素越多,漏檢的可能越大。而PATENTICS不需要進一步限定,可以將獲得的5251項結果根據CN1728450來排序。即:(B/antenna AND B/rotatable) and R/ CN1728450 and DI/20040721檢索結果還是5251項,但是最相關跑到了前面。US5771466位于第二位。,步驟一:直接輸入公開號即可獲得50%的對比文件。US6445611是SIPO漏檢,而EPO獲得的X對比文件。這類檢索平均耗時半小時。,步驟一:直接輸入專利號,瀏覽

16、前面的文檔,如果覺得沒有合適的,則進入步驟二。 步驟二:增加一個關鍵詞,“氯化血紅素”,X文獻就位于第一位了。 如果用戶熟練以后,能夠判斷對比文件中必須要包括“氯化血紅素”這個詞,也可以直接使用步驟二。 有40%的對比文件可以通過這種方法獲得。這類檢索平均耗時1小時。,33,步驟二:如果要找抵觸申請,時間限制可以選擇申請日“da”。,步驟二:如果用戶認為必須要在摘要中出現(xiàn)某個關鍵詞,才有可能是對比文件,則可以通過ab/,在摘要中限定某個關鍵詞。,步驟一:直接輸入公開號,瀏覽前面的文獻,如果覺得沒有獲得XY文獻,則進入步驟二。 步驟二: r/CN1665545 and di/20020705 a

17、nd b/腫瘤 ,還是沒有獲得對比文件,則在添加一個關鍵詞。 步驟三:r/CN1665545 and di/20020705 and b/腫瘤 and b/鹽酸。 10%的對比文件通過這類方式獲得。約耗時1.5小時。,36,全面解決問題的方法,幾個常用功能的介紹 關鍵詞擴充; 全文閱讀,高亮顯示; 輸入文檔作為排序基準。,37,世界上最智能中/英關鍵詞擴充,選中文從中國專利庫中 自動聯(lián)想,選英文從英文專利庫中自動聯(lián)想,38,全文閱讀,高亮顯示,在此篇沒有出現(xiàn),點擊此處瀏覽全文,39,輸入文檔作為排序基準,三種輸入方法:1)手工輸入2)從本地的文件導入3)從web導入,40,輸入文檔作為排序基準

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論