(12.7.3.8)-搜索引擎司法鑒定的奧秘_第1頁
(12.7.3.8)-搜索引擎司法鑒定的奧秘_第2頁
(12.7.3.8)-搜索引擎司法鑒定的奧秘_第3頁
(12.7.3.8)-搜索引擎司法鑒定的奧秘_第4頁
(12.7.3.8)-搜索引擎司法鑒定的奧秘_第5頁
已閱讀5頁,還剩90頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

搜索引擎相關概念IP地址:Internet上每臺計算機相對應的地址,是一連串的數(shù)字。域名:與數(shù)字型IP地址相對應的字符型地址,有類別域名和行政區(qū)域名兩套。

類別域名:

AC科研機構COM工、商、金融等企業(yè)EDU教育機構GOV政府部門

NET互聯(lián)網(wǎng)絡、接入網(wǎng)絡的信息中心(NIC)和運行中心(NOC)

ORG各種非盈利性的組織

行政區(qū)域名是按照各個行政區(qū)劃劃分而成的。

URL:統(tǒng)一資源定位器,即平時所說的網(wǎng)頁地址。其格式為:傳輸協(xié)議://主機IP地址或域名地址/資源所在路徑和文件名

網(wǎng)絡信息資源的特點(1)信息數(shù)量龐大且重復。網(wǎng)頁就有上百億個(2)信息處于動態(tài)變化之中(3)信息組織上處于無結構化、半結構化之中信息通常是無組織的,沒有數(shù)據(jù)庫中數(shù)據(jù)的結構化特性,或者是只有有限的結構特性(4)無統(tǒng)一的信息評價機制和標準.

隨意發(fā)布信息,信息雜亂無章,質量無法保證(5)信息發(fā)布在異構平臺上概念

搜索引擎(SearchEngine)是通過因特網(wǎng)查詢網(wǎng)絡信息的重要工具。搜索引擎是一種網(wǎng)絡資源的檢索工具,是一種網(wǎng)頁網(wǎng)址檢索系統(tǒng)。有的提供分類和關鍵詞檢索途徑,有的僅提供關鍵詞檢索途徑。是將因特網(wǎng)上的網(wǎng)站資源地址或/和內(nèi)容收集、整理后,加以分類,形成網(wǎng)絡資源數(shù)據(jù)庫,作為一種新的網(wǎng)絡資源提供給人們使用。搜索引擎的工作原理

1.從互聯(lián)網(wǎng)上抓取網(wǎng)頁

2.建立索引數(shù)據(jù)庫

3.在索引數(shù)據(jù)庫中搜索排序搜索引擎分類1.全文搜索引擎(Searchengine)

國內(nèi)著名的有百度(Baidu)、一搜等,國外具代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等。它們都是通過從互聯(lián)網(wǎng)上提取的各個網(wǎng)站的信息(以網(wǎng)頁文字為主)而建立。2.目錄索引類(SearchIndex/Directory):

按目錄分類的網(wǎng)站鏈接列表而查找。YAHOO。

3.元搜索引擎(MetaSearchEngine):基本的工作原理是在接受用戶查詢請求后,同時在其他多個引擎上進行搜索,并將結果返回給用戶。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的有搜星搜索引擎。搜索引擎的使用(一)分類瀏覽(二)關鍵詞檢索

1.詞組或短語搜索

2.二次檢索

3.邏輯運算:“與”、“或”、“非”三種基本形式,邏輯運算符號分別用and(+或空格)、or、not(-或andnot)4.字段限制檢索

5.截詞和通配符檢索

6.大小寫區(qū)分:對于人名、地名(如GeorgeBush,Taxas)、專有詞(AIDS、Aids)檢索有幫助。

7.臨近檢索:

有的搜索引擎提供臨近檢索符搜索引擎存在的問題(1)檢索精度差(2)沒有有效地適應信息源變化的機制,無效鏈接經(jīng)常出現(xiàn)(3)動態(tài)網(wǎng)頁索引能力較差(4)檢索結果顯示方式過于簡單(5)人機交互較為簡單,沒有考慮用戶的反饋(6)主動性信息服務功能差,注重”拉”,忽視”推”綜合性搜索引擎介紹YAHOO()Vivisimo(http://)Google()YAHOO(http://)

早期的YAHOO!只有分類目錄,是目錄型搜索引擎的代表。如今它也提供關鍵詞檢索。http:///dirVivisimo()

字面上的意思是美觀、亮麗、聰明,是一個聚類搜索引擎,有目前最好的搜索結果自動分類技術。這個搜索引擎是美國卡耐基大學(CarnegieUniversity)的作品,除了常用搜索引擎的索引與查尋服務外,還提供了其他搜索引擎的集成查尋功能。同時,Vivisimo還對其搜索引擎技術隨時進行改進,目前還開發(fā)出了Clusty聚類功能。

Clusty是VIVISIMO開發(fā)并擁有的利用自己的特有的聚類搜索引擎技術,將搜索到的結果放到相似的文件夾里面。利于用戶集中精力看自己感興趣的內(nèi)容而不是所有檢索結果。禽流感Google20

Google()是一個搜索引擎,由兩個斯坦福大學博士生LarryPage與SergeyBrin于1998年9月發(fā)明,GoogleInc.于1999年創(chuàng)立。2000年7月份,Google替代Inktomi成為Yahoo公司的搜索引擎,同年9月份,Google成為中國網(wǎng)易公司的搜索引擎。是目前最優(yōu)秀的搜索引擎之一。Google(http://)Google提供的服務Google提供的服務(續(xù))基本檢索技術:邏輯運算1.邏輯“與”:Google無需用明確的符號表示,只要在關鍵詞間留一空格即可。

2.邏輯“或”:用大寫“OR”表示。OR的前面必須有空格。

3.邏輯“非”:用“-”表示,“-”號前必須有空格。將輸入的詞作為整體來檢索,可提高查準率表達方式:“檢索詞”例:查找lungcancer基本檢索技術:詞組檢索

不加引號:19,200,000條結果

加上引號:15,000,000條結果表達方式:使用截詞符“*”。例:張衡是*人基本檢索技術:截詞檢索智能化檢索按鈕,直接跳到它認為最符合要求的網(wǎng)站,不出現(xiàn)其他結果。例:輸入”重慶醫(yī)科大學”,然后按”手氣不錯”按鈕。(用于查找、訪問特定的網(wǎng)站)特色功能:手氣不錯

重慶醫(yī)科大學可搜索文件標題或內(nèi)容中含有檢索詞的特定類型文件,有有PDF、PPT、XLS、DOC、SWF、DWF等多種類型。表達方式:檢索詞

filetype:文件類型例:文獻檢索filetype:ppt30特色功能:特定類型文檔搜索

31在某個特定的域或站點中進行搜索(可用于查找政府/組織出版物)表達方式:檢索詞

site:域名例:全科醫(yī)師崗位培訓工作評估指標體系

site:特色功能:指定網(wǎng)域搜索

32指定檢索詞出現(xiàn)在網(wǎng)頁的標題欄表達方式:“intitle”和“allintitle”兩種格式,相當于“題名檢索”。例:intitle:重慶醫(yī)科大學畢業(yè)生allintitle:重慶醫(yī)科大學畢業(yè)生4,200

條結果

166

條結果

特色功能:網(wǎng)頁標題搜索

33特色功能:圖片搜索

34特色功能:地圖搜索

查看字詞或詞組的定義,舉例:輸入:定義納米35特色功能:定義搜索

36只需輸入一個關鍵詞(“翻譯”,“fy”和“FY”任選其一)和要查的中(英)文單詞,Google會直接顯示您要查的單詞的英文(或中文)翻譯。如輸入:翻譯維他命如輸入:翻譯禽流感特色功能:中英文翻譯

可從Google服務器緩存中調出網(wǎng)頁。當網(wǎng)頁因移動或刪除而無法顯示時可使用此功能。特色功能:網(wǎng)頁快照

高級檢索界面不了解檢索規(guī)則時可利用高級檢索完成復雜的檢索專業(yè)搜索1、HealthWeb2、H0Ncode3、scirus4、Medscape5、MedFinder6、Google學術搜索7、CNKI知識搜索HealthWeb

http://

是美國中西部各醫(yī)學中心的醫(yī)學信息專家管理的一個搜索引擎,目的是為健康工作者和健康消費者提供各種醫(yī)學信息資源。它根據(jù)疾病所屬學科的第一個字母進行分類,同時提供簡單檢索和高級檢索功能。在高級檢索中可以用醫(yī)學主題詞(MeSH)進行檢索。提供有關愛滋病的有關學會、會議、電子文獻、資源庫以及其預防、研究、治療等方面的信息。簡單檢索高級檢索HON(http://www.hon.ch)

由在瑞士日內(nèi)瓦的非盈利性組織“網(wǎng)絡健康基金會”(TheHealthontheNetFoundation)1996年建立的一個醫(yī)學信息站點,該站點專門診斷因特網(wǎng)所提供的信息的正確性和可靠性,并提倡網(wǎng)絡倫理。這個組織發(fā)展了一套用以檢測網(wǎng)站信息的正確性和可靠性的系統(tǒng),運用此系統(tǒng),上網(wǎng)者可隨時確知自己瀏覽的資料的可信度。HON醫(yī)學搜索引擎

HON建立的醫(yī)學搜索引擎,包括MedHunt和HONselect。

HON還根據(jù)使用信息對象的不同,提供三種不同對象的登陸入口,包括個人、醫(yī)學專業(yè)人員和網(wǎng)絡出版者,針對不同的用戶群體提供一些他們感興趣的信息。

HONcoderen認證的網(wǎng)站

醫(yī)藥網(wǎng)站

查詢MeSH主題詞

新聞

醫(yī)學會議

醫(yī)學圖片患者/個人醫(yī)學專業(yè)人士網(wǎng)站發(fā)行者對一些值得特別關注的專題進行深入報道報道新聞主持、資助的項目制定醫(yī)藥衛(wèi)生領域的網(wǎng)站開發(fā)者的道德規(guī)范scirus科技檢索引擎SCIRUS

Scirus是目前互聯(lián)網(wǎng)上最全面、綜合性最強的科技文獻門戶網(wǎng)站之一。其涵蓋的資源大體分為網(wǎng)絡站點資源和科技文獻資源兩大部分。目前Scirus搜集的與科技相關的網(wǎng)頁已超過1.5億,其中包括:?4,500,000.edusites?14,800,000.orgsites?5,500,000.ac.uksites?18,000,000.comsites?4,700,000.govsites

?40,000,000STMandUniversitysitesSCIRUS從SCIRUS可以檢索到文獻資源有:?1千3百萬篇MEDLINE文摘;?4千5百萬篇ScienceDirect全文?1百萬篇美國專利?675,000Beilstein化學化工文摘?10,600NASA技術報告?1,070BioMedCentral生物醫(yī)學全文?20余萬篇電子預印本簡介:共收藏了近20個臨床學科2.5萬篇文獻,是Web上最大的免費提供臨床醫(yī)學全文文獻和繼續(xù)醫(yī)學教育資源的網(wǎng)點檢索方法:分類和關鍵詞檢索特點:可檢索圖像、聲頻、視頻資料。MedScape

http://MedScape

http://根據(jù)疾病名稱、所屬學科和內(nèi)容性質(會議報告、雜志文章的全文或摘要等)的英文逐個字母的分類檢索??梢赃M行MEDLINE檢索。直接查閱《Merriam-Webster》醫(yī)學詞典中55,000條目的內(nèi)容。直接查詢其中200,000種藥物的使用劑量、毒副作用、使用注意事項等內(nèi)容最新動態(tài)新聞醫(yī)學繼續(xù)教育新聞資源中心患者教育期刊資料專家觀點MedFinder

http://

是一個由專家手工編制的醫(yī)學專業(yè)搜索引擎,可按主題詞進行檢索,也可按提供的分類進行檢索,其特點是影像學方面的內(nèi)容特別豐富,該網(wǎng)站提供了大量的病理切片、ECG、CT、MRI、核醫(yī)學、超聲醫(yī)學方面的內(nèi)容,其形式包括各種圖片、照片、視頻和動畫。在提供資源的同時,還可以進行交互性學習。提供MEDLINE檢索進行注冊資源介紹檢索讀者教育Google學術搜索

(Googlescholar)61概況

Google學術搜索提供可廣泛搜索學術文獻的簡便方法。您可以從一個位置搜索眾多學科和資料來源:來自學術著作出版商、專業(yè)性社團、預印本、各大學及其他學術組織的經(jīng)同行評論的文章、論文、圖書、摘要和文章。Google學術搜索可幫助您在整個學術領域中確定相關性最強的研究。

Googlescholar的訪問方式Googlescholar的訪問方式http:///Googlescholar的主界面Googlescholar高級檢索自由詞、句題名作者名刊名出版時間舉例檢索刊登在“中華病理學雜志”上,2000以來,題名含有SARS的學術資料檢索結果被引次數(shù)演示點擊題名的顯示結果小結將Googlescholar作為跨庫檢索平臺Googlescholar提供引用次數(shù)可作為重要的學術評價參考數(shù)據(jù)Googlescholar的“圖書館搜索”便于館際互借Googlescholar的相關文獻及被引文獻可作為重要的相關文獻查找方法。CNKI知識搜索

http:///搜索引擎使用中的注意事項選擇合適的搜索引擎應該使用新浪還是搜狐?Google還是百度?分析你的需求,比較不同搜索引擎的強項和弱點,然后為這次搜索選擇最適合的搜索工具。合理使用各種運算符

短語檢索。

AND/OR/NOT邏輯運算符通配符 *?各個搜索引擎在支持運算方面不盡相同,表示方法上也不完全一樣。搜索引擎使用中的注意事項充分利用各搜索引擎的特色檢索如:Google的文件類型檢索、URL檢索、圖像檢索 百度的MP3檢索、FLASH檢索搜索引擎使用中的注意事項根據(jù)檢索結果不斷調整檢索策略 選擇更恰當?shù)臋z索詞。 如果是太多,可以利用邏輯運算限定檢索。如果檢索結果太少或沒有,則可能需要減少檢索詞數(shù)量甚至更換檢索詞重新檢索。搜索引擎使用中的注意事項多積累,多總結每次成功檢索后可略作一些分析和小結。 對網(wǎng)絡資源特點作較深的了解。搜索引擎使用中的注意事項搜索引擎中常見的錯誤錯誤1:錯別字經(jīng)常發(fā)生的一種錯誤是,你輸入的關鍵詞含有錯別字。筆者所做的統(tǒng)計表明,常有大量的錯誤搜索,光一個謝霆鋒就有“謝霆鋒”、“謝庭鋒”、“謝霆峰”、“謝廷鋒”、“謝庭峰”、“謝廷峰”6種查法,還有什么“星際爭吧”、“以德制國”之類的,這樣的關鍵詞能搜索到什么有用資料嗎?所以每當你覺得某種內(nèi)容網(wǎng)上應該有不少、卻搜索不到結果時,你應該先查一下是否有錯別字。搜索引擎中常見的錯誤錯誤2:關鍵詞太常見

如,搜索“電話”,有無數(shù)網(wǎng)站提供跟“電話”相關的信息,從網(wǎng)上黃頁到電話零售商到個人電話號碼都有。所以當搜索結果太多太亂的時候,你應該嘗試使用更多的關鍵詞或者減號來搜索,不使用過于通用的詞匯來搜索,設計一個類似“上海常用電話”這樣特殊的搜索關鍵詞,會給你真正有用的結果。搜索引擎中常見的錯誤錯誤3:多義詞的使用

要小心使用多義詞,比如搜索“Java”,你要找的信息究竟是太平洋上的一個島、一種著名的咖啡、還是一種計算機語言?搜索引擎是不能理解辨別多義詞的。最好的解決辦法是,在搜索之前先問自己這個問題,然后用短語、用多個關鍵詞或者用其他的詞語來代替多義詞作為搜索關鍵詞。比如用“爪哇印尼”、“爪哇咖啡”、“Java語言”分別搜索可以滿足不同的需求。

搜索引擎中常見的錯誤錯誤4:在不支持自然語言查詢的搜索引擎中使用自然語言查詢

搜索失敗的另一個常見原因是類似這樣的搜索:“現(xiàn)代愛情故事歌詞”、“信息早報在濟南發(fā)行情況”、“羚羊車的各種圖案”、“上海到成都列車時刻表”。應該這樣搜索:“現(xiàn)代愛情故事歌詞”、“信息早報濟南發(fā)行”、“鈴羊車圖案”“上海成都列車時刻表”。搜索引擎中常見的錯誤錯誤5:在錯誤的地方搜索

2001年7月23日這一天,正逢高考發(fā)榜,各大搜索引擎竟有超過100萬次以上的搜索跟高考查分有關??忌鷤儾恢?,搜索引擎從抓取網(wǎng)頁、解析、索引到提供檢索是有一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論