精選搜索引擎的檢索方法和技巧講義_第1頁
精選搜索引擎的檢索方法和技巧講義_第2頁
精選搜索引擎的檢索方法和技巧講義_第3頁
精選搜索引擎的檢索方法和技巧講義_第4頁
精選搜索引擎的檢索方法和技巧講義_第5頁
已閱讀5頁,還剩83頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

(優(yōu)選)搜索引擎的檢索方法與技巧課件當(dāng)前第1頁\共有88頁\編于星期一\10點(diǎn)2023/6/112為什么使用搜索引擎2012年8月1日,CNNIC發(fā)布了最新的《2009年中國搜索引擎用戶行為研究報(bào)告》。報(bào)告中顯示,截至2012年8月底,中國搜索引擎用戶規(guī)模達(dá)到4.51億人。當(dāng)前第2頁\共有88頁\編于星期一\10點(diǎn)2023/6/113中國搜索引擎用戶規(guī)模和使用率當(dāng)前第3頁\共有88頁\編于星期一\10點(diǎn)2023/6/114搜索引擎的用戶感受當(dāng)前第4頁\共有88頁\編于星期一\10點(diǎn)2023/6/115當(dāng)前第5頁\共有88頁\編于星期一\10點(diǎn)2023/6/116搜索引擎的應(yīng)用現(xiàn)狀從用戶使用的角度,國外的調(diào)查發(fā)現(xiàn):網(wǎng)上搜索信息的人很少考慮如何找到他們所需要的信息,因此搜索信息時(shí)象動(dòng)物獵食般盲目;只有18%的用戶表示總能在網(wǎng)上搜索到需要的信息。68%的用戶說他們對(duì)搜索引擎很失望;平均每個(gè)搜搜者在12分鐘的徒勞搜索后就感到惱火和受挫。46%的人只會(huì)用同一個(gè)關(guān)鍵詞搜啊搜啊,而且是在同一個(gè)搜索引擎。當(dāng)前第6頁\共有88頁\編于星期一\10點(diǎn)2023/6/117國外的應(yīng)用狀況那些每周平均花5個(gè)小時(shí)以上時(shí)間上網(wǎng)的人,將其上網(wǎng)時(shí)間的71%都花在了搜索引擎上;人機(jī)界面高手nielsen(google的設(shè)計(jì)者)研究表明:略超過1/2的互聯(lián)網(wǎng)用戶屬于search-dominant,約1/5用戶屬于link-dominant,其它用戶的搜索傾向?qū)儆诨旌闲袨樾?。search-dominant在到達(dá)一個(gè)網(wǎng)站后直接就奔向搜索按鈕,他們對(duì)瀏覽網(wǎng)站不感興趣,他們有明確的目的,傾向于以最快速度找到信息。相反,link-dominant喜歡點(diǎn)擊瀏覽一個(gè)網(wǎng)站,即使他們想找特殊信息時(shí)也是這樣,只有在他們用點(diǎn)擊超鏈的方法已經(jīng)實(shí)在找不到了,才會(huì)想起搜索按鈕。當(dāng)前第7頁\共有88頁\編于星期一\10點(diǎn)2023/6/118什么是搜索引擎

搜索引擎其實(shí)也是一個(gè)網(wǎng)站,只不過該網(wǎng)站專門為你提供信息“檢索”服務(wù)

搜索引擎是指根據(jù)一定的策略、運(yùn)用特定的計(jì)算機(jī)程序從互聯(lián)網(wǎng)上搜集信息,在對(duì)信息進(jìn)行組織和處理后,為用戶提供檢索服務(wù),將用戶檢索相關(guān)的信息展示給用戶的系統(tǒng)。

搜索引擎包括全文索引、目錄索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、門戶搜索引擎與免費(fèi)鏈接列表等。

當(dāng)前第8頁\共有88頁\編于星期一\10點(diǎn)2023/6/119值得推薦的幾個(gè)中文搜索引擎全文搜索衡量搜索引擎的指標(biāo):查全率查準(zhǔn)率速度哪個(gè)重要?Google:(需要出國訪問權(quán)限)新浪使用了它的全文搜索引擎服務(wù)說明:這是2004年4月的情形,各大門戶網(wǎng)站使用的搜索引擎服務(wù)經(jīng)常會(huì)變化,留意Poweredby…百度:當(dāng)前第9頁\共有88頁\編于星期一\10點(diǎn)2023/6/1110搜索引擎的分類及原理按照信息搜集方法和服務(wù)提供方式的不同,搜索引擎系統(tǒng)可以分為三大類:1.目錄式搜索引擎:以人工方式或半自動(dòng)方式搜集信息,由編輯員查看信息之后,人工形成信息摘要,并將信息置于事先確定的分類框架中。信息大多面向網(wǎng)站,提供目錄瀏覽服務(wù)和直接檢索服務(wù)。該類搜索引擎因?yàn)榧尤肓巳说闹悄埽孕畔?zhǔn)確、導(dǎo)航質(zhì)量高,缺點(diǎn)是需要人工介入、維護(hù)量大、信息量少、信息更新不及時(shí)。這類搜索引擎的代表是:Yahoo、LookSmart、OpenDirectory、GoGuide等。當(dāng)前第10頁\共有88頁\編于星期一\10點(diǎn)2023/6/1111搜索引擎分類2.機(jī)器人搜索引擎:由一個(gè)稱為蜘蛛(Spider)的機(jī)器人程序以某種策略自動(dòng)地在互聯(lián)網(wǎng)中搜集和發(fā)現(xiàn)信息,由索引器為搜集到的信息建立索引,由檢索器根據(jù)用戶的查詢輸入檢索索引庫,并將查詢結(jié)果返回給用戶。服務(wù)方式是面向網(wǎng)頁的全文檢索服務(wù)。該類搜索引擎的優(yōu)點(diǎn)是信息量大、更新及時(shí)、毋需人工干預(yù),缺點(diǎn)是返回信息過多,有很多無關(guān)信息,用戶必須從結(jié)果中進(jìn)行篩選。這類搜索引擎的代表是:AltaVista、NorthernLight、Excite、Infoseek、Inktomi、FAST、Lycos、Google;國內(nèi)代表為:"天網(wǎng)"、悠游、OpenFind等。當(dāng)前第11頁\共有88頁\編于星期一\10點(diǎn)2023/6/1112分類3.元搜索引擎:這類搜索引擎沒有自己的數(shù)據(jù),而是將用戶的查詢請(qǐng)求同時(shí)向多個(gè)搜索引擎遞交,將返回的結(jié)果進(jìn)行重復(fù)排除、重新排序等處理后,作為自己的結(jié)果返回給用戶。服務(wù)方式為面向網(wǎng)頁的全文檢索。這類搜索引擎的優(yōu)點(diǎn)是返回結(jié)果的信息量更大、更全,缺點(diǎn)是不能夠充分使用所使用搜索引擎的功能,用戶需要做更多的篩選。這類搜索引擎的代表是WebCrawler、InfoMarket等。當(dāng)前第12頁\共有88頁\編于星期一\10點(diǎn)2023/6/1113主要技術(shù)一個(gè)搜索引擎由搜索器、索引器、檢索器和用戶接口等四個(gè)部分組成。搜索器搜索器的功能是在互聯(lián)網(wǎng)中漫游,發(fā)現(xiàn)和搜集信息。它常常是一個(gè)計(jì)算機(jī)程序,日夜不停地運(yùn)行。它要盡可能多、盡可能快地搜集各種類型的新信息,同時(shí)因?yàn)榛ヂ?lián)網(wǎng)上的信息更新很快,所以還要定期更新已經(jīng)搜集過的舊信息,以避免死連接和無效連接。當(dāng)前第13頁\共有88頁\編于星期一\10點(diǎn)2023/6/1114索引器2.索引器索引器的功能是理解搜索器所搜索的信息,從中抽取出索引項(xiàng),用于表示文檔以及生成文檔庫的索引表。索引項(xiàng)有客觀索引項(xiàng)和內(nèi)容索引項(xiàng)兩種:客觀項(xiàng)與文檔的語意內(nèi)容無關(guān),如作者名、URL、更新時(shí)間、編碼、長(zhǎng)度、鏈接流行度(LinkPopularity)等等;內(nèi)容索引項(xiàng)是用來反映文檔內(nèi)容的,如關(guān)鍵詞及其權(quán)重、短語、單字等等。內(nèi)容索引項(xiàng)可以分為單索引項(xiàng)和多索引項(xiàng)(或稱短語索引項(xiàng))兩種。單索引項(xiàng)對(duì)于英文來講是英語單詞,比較容易提取,因?yàn)閱卧~之間有天然的分隔符(空格);對(duì)于中文等連續(xù)書寫的語言,必須進(jìn)行詞語的切分當(dāng)前第14頁\共有88頁\編于星期一\10點(diǎn)2023/6/1115檢索器和用戶接口3.檢索器檢索器的功能是根據(jù)用戶的查詢?cè)谒饕龓熘锌焖贆z出文檔,進(jìn)行文檔與查詢的相關(guān)度評(píng)價(jià),對(duì)將要輸出的結(jié)果進(jìn)行排序,并實(shí)現(xiàn)某種用戶相關(guān)性反饋機(jī)制。檢索器常用的信息檢索模型有集合理論模型、代數(shù)模型、概率模型和混合模型四種。4.用戶接口用戶接口的作用是輸入用戶查詢、顯示查詢結(jié)果、提供用戶相關(guān)性反饋機(jī)制。主要的目的是方便用戶使用搜索引擎,高效率、多方式地從搜索引擎中得到有效、及時(shí)的信息。用戶接口的設(shè)計(jì)和實(shí)現(xiàn)使用人機(jī)交互的理論和方法,以充分適應(yīng)人類的思維習(xí)慣。當(dāng)前第15頁\共有88頁\編于星期一\10點(diǎn)2023/6/1116搜索引擎示意Google服務(wù)器Google工作電腦Google爬蟲網(wǎng)頁Google存儲(chǔ)系統(tǒng)當(dāng)前第16頁\共有88頁\編于星期一\10點(diǎn)2023/6/1117

提綱1、Google簡(jiǎn)介2、Goolge功能與特色3、網(wǎng)頁搜索技巧4、其它特色服務(wù)與功能略解當(dāng)前第17頁\共有88頁\編于星期一\10點(diǎn)2023/6/1118

Google是一個(gè)搜索引擎,由兩個(gè)斯坦福大學(xué)博士生LarryPage與SergeyBrin于1998年9月發(fā)明,GoogleInc.于1999年創(chuàng)立。2000年7月份,Google替代Inktomi成為Yahoo公司的搜索引擎,同年9月份,Google成為中國網(wǎng)易公司的搜索引擎。98年至今,Google已經(jīng)獲得30多項(xiàng)業(yè)界大獎(jiǎng)。一、Google簡(jiǎn)介當(dāng)前第18頁\共有88頁\編于星期一\10點(diǎn)2023/6/1119當(dāng)前第19頁\共有88頁\編于星期一\10點(diǎn)2023/6/1120當(dāng)前第20頁\共有88頁\編于星期一\10點(diǎn)2023/6/1121當(dāng)前第21頁\共有88頁\編于星期一\10點(diǎn)2023/6/1122當(dāng)前第22頁\共有88頁\編于星期一\10點(diǎn)2023/6/1123全球英文網(wǎng)站當(dāng)前第23頁\共有88頁\編于星期一\10點(diǎn)2023/6/1124Google英文網(wǎng)站服務(wù)項(xiàng)目當(dāng)前第24頁\共有88頁\編于星期一\10點(diǎn)2023/6/1125中文網(wǎng)站.hk當(dāng)前第25頁\共有88頁\編于星期一\10點(diǎn)2023/6/1126中文網(wǎng)站當(dāng)前第26頁\共有88頁\編于星期一\10點(diǎn)2023/6/1127100億個(gè)網(wǎng)頁支持多達(dá)132種語言,包括簡(jiǎn)體中文和繁體中文;

提供搜索引擎功能,沒有花里胡哨的累贅;

速度極快,據(jù)說有8000多臺(tái)服務(wù)器,200多條T3級(jí)寬帶;專利網(wǎng)頁級(jí)別技術(shù)PageRank能夠提供高命中率的搜索結(jié)果;

搜索結(jié)果摘錄查詢網(wǎng)頁的部分具體內(nèi)容,而不僅僅是網(wǎng)站簡(jiǎn)介;

智能化的“手氣不錯(cuò)”功能,提供可能最符合要求的網(wǎng)站;

“網(wǎng)頁快照”功能,能從Google服務(wù)器里直接取出緩存的網(wǎng)頁。二、Google功能與特色當(dāng)前第27頁\共有88頁\編于星期一\10點(diǎn)2023/6/1128Google常用工具當(dāng)前第28頁\共有88頁\編于星期一\10點(diǎn)2023/6/1129“+”或空格表示邏輯“與”操作(A、B同時(shí)有)“-”表示邏輯“非”操作,減號(hào)前留一空格(A-B)“OR”表示邏輯“或”操作(A或B只要其一)OR要大寫三、網(wǎng)頁搜索技巧其它小技巧………1、簡(jiǎn)單搜索當(dāng)前第29頁\共有88頁\編于星期一\10點(diǎn)2023/6/1130不支持通配符,如“*”、“?”英文字符大小不分詞組或句子作關(guān)鍵詞須加引號(hào)通配符、大小寫、句子當(dāng)前第30頁\共有88頁\編于星期一\10點(diǎn)2023/6/1131搜索所有網(wǎng)頁當(dāng)前第31頁\共有88頁\編于星期一\10點(diǎn)2023/6/1132當(dāng)前第32頁\共有88頁\編于星期一\10點(diǎn)2023/6/1133當(dāng)前第33頁\共有88頁\編于星期一\10點(diǎn)2023/6/1134找到最相關(guān)的網(wǎng)頁當(dāng)前第34頁\共有88頁\編于星期一\10點(diǎn)2023/6/1135當(dāng)前第35頁\共有88頁\編于星期一\10點(diǎn)2023/6/1136搜索設(shè)置當(dāng)前第36頁\共有88頁\編于星期一\10點(diǎn)2023/6/1137語言工具當(dāng)前第37頁\共有88頁\編于星期一\10點(diǎn)2023/6/11382、高級(jí)搜索當(dāng)前第38頁\共有88頁\編于星期一\10點(diǎn)2023/6/1139

高級(jí)菜單搜索

簡(jiǎn)單命令搜索包含以下全部的字詞+包含以下的完整字句“

”包含以下任何一個(gè)字詞OR不包括以下字詞-搜索網(wǎng)頁語言是可以在使用偏好中設(shè)置顯示使用以下文件格式的結(jié)果(pdf,ps,ppt,doc,xls,rtf)“firewall”filtype:pdf限定要顯示的網(wǎng)頁更新日期應(yīng)于(過去3/6/12個(gè)月)“firewall”date:2005/05/28查詢字詞位于網(wǎng)頁內(nèi)任何地方網(wǎng)頁的標(biāo)題網(wǎng)頁的內(nèi)文網(wǎng)頁內(nèi)的網(wǎng)址在網(wǎng)頁的鏈接內(nèi)直接輸入關(guān)鍵詞intitle:或allintitle:allintext:allinurl:allinanchor:"firewall"搜索以下網(wǎng)站或網(wǎng)域“Firewall”site:搜索類似以下網(wǎng)頁的網(wǎng)頁related:/index.shtml搜索與該網(wǎng)頁存在鏈接的網(wǎng)頁link:當(dāng)前第39頁\共有88頁\編于星期一\10點(diǎn)2023/6/11403.搜索實(shí)例1)何謂“冬蟲夏草”簡(jiǎn)單界面直接輸入點(diǎn)擊手氣不錯(cuò)當(dāng)前第40頁\共有88頁\編于星期一\10點(diǎn)2023/6/11413.搜索實(shí)例2)“松香毛有毒”簡(jiǎn)單界面直接輸入點(diǎn)擊手氣不錯(cuò)當(dāng)前第41頁\共有88頁\編于星期一\10點(diǎn)2023/6/11423.搜索實(shí)例3)查找元數(shù)據(jù)規(guī)范文檔資料當(dāng)前第42頁\共有88頁\編于星期一\10點(diǎn)2023/6/11433.搜索實(shí)例4)查找虛擬參考咨詢課件當(dāng)前第43頁\共有88頁\編于星期一\10點(diǎn)2023/6/1144四、其它主要特色服務(wù)與功能略解網(wǎng)頁搜索特色

Print

BETA其它:分類目錄、新聞、論壇、專家咨詢…..略當(dāng)前第44頁\共有88頁\編于星期一\10點(diǎn)2023/6/11454.1當(dāng)前第45頁\共有88頁\編于星期一\10點(diǎn)2023/6/1146當(dāng)前第46頁\共有88頁\編于星期一\10點(diǎn)2023/6/1147當(dāng)前第47頁\共有88頁\編于星期一\10點(diǎn)2023/6/1148當(dāng)前第48頁\共有88頁\編于星期一\10點(diǎn)2023/6/1149簡(jiǎn)單運(yùn)算郵政區(qū)號(hào)名詞概念定義手機(jī)歸屬地4.2當(dāng)前第49頁\共有88頁\編于星期一\10點(diǎn)2023/6/11504.3當(dāng)前第50頁\共有88頁\編于星期一\10點(diǎn)2023/6/1151當(dāng)前第51頁\共有88頁\編于星期一\10點(diǎn)2023/6/1152當(dāng)前第52頁\共有88頁\編于星期一\10點(diǎn)2023/6/1153輸入檢索詞當(dāng)前第53頁\共有88頁\編于星期一\10點(diǎn)2023/6/1154找什么在哪兒4.5當(dāng)前第54頁\共有88頁\編于星期一\10點(diǎn)2023/6/1155當(dāng)前第55頁\共有88頁\編于星期一\10點(diǎn)2023/6/1156當(dāng)前第56頁\共有88頁\編于星期一\10點(diǎn)2023/6/1157當(dāng)前第57頁\共有88頁\編于星期一\10點(diǎn)2023/6/11584.6當(dāng)前第58頁\共有88頁\編于星期一\10點(diǎn)2023/6/1159當(dāng)前第59頁\共有88頁\編于星期一\10點(diǎn)2023/6/1160免費(fèi)瀏覽圖書內(nèi)容目次,交費(fèi)后可閱讀全文,直接鏈接網(wǎng)上書店當(dāng)前第60頁\共有88頁\編于星期一\10點(diǎn)2023/6/1161當(dāng)前第61頁\共有88頁\編于星期一\10點(diǎn)2023/6/1162百度當(dāng)前第62頁\共有88頁\編于星期一\10點(diǎn)2023/6/1163

李彥宏徐勇當(dāng)前第63頁\共有88頁\編于星期一\10點(diǎn)2023/6/1164百度,2000年1月創(chuàng)立于北京中關(guān)村,是全球最大的中文搜索引擎。2000年1月1日,公司創(chuàng)始人李彥宏、徐勇攜120萬美元風(fēng)險(xiǎn)投資,從美國硅谷回國,創(chuàng)建了百度公司。2000年5月,百度首次為門戶網(wǎng)站——硅谷動(dòng)力提供搜索技術(shù)服務(wù),之后迅速占領(lǐng)中國搜索引擎市場(chǎng),成為最主要的搜索技術(shù)提供商。2001年8月,發(fā)布B搜索引擎Beta版,從后臺(tái)服務(wù)轉(zhuǎn)向獨(dú)立提供搜索服務(wù),并且在中國首創(chuàng)了競(jìng)價(jià)排名商業(yè)模式,2001年10月22日正式發(fā)布Baidu搜索引擎。2005年8月5日,百度在美國納斯達(dá)克上市。概況當(dāng)前第64頁\共有88頁\編于星期一\10點(diǎn)2023/6/1165“百度”二字取自辛棄疾的《青玉案》“眾里尋她千百度”。現(xiàn)在百度已成為世界上最大的中文搜索引擎,用戶能夠訪問超過10億的中文網(wǎng)頁.特點(diǎn)當(dāng)前第65頁\共有88頁\編于星期一\10點(diǎn)2023/6/1166當(dāng)前第66頁\共有88頁\編于星期一\10點(diǎn)2023/6/1167網(wǎng)頁搜索功能百度快照相關(guān)搜索拼音提示錯(cuò)別字提示英漢互譯詞典計(jì)算器和度量衡轉(zhuǎn)換專業(yè)文檔搜索股票、列車時(shí)刻表和飛機(jī)航班查詢高級(jí)搜索語法高級(jí)搜索、地區(qū)搜索和個(gè)性設(shè)置天氣查詢當(dāng)前第67頁\共有88頁\編于星期一\10點(diǎn)2023/6/1168百度快照每個(gè)被收錄的網(wǎng)頁,在百度上都存有一個(gè)純文本的備份,稱為“百度快照”。百度速度較快,您可以通過“快照”快速瀏覽頁面內(nèi)容。如果無法打開某個(gè)搜索結(jié)果,或者打開速度特別慢,“百度快照”能幫您解決問題。當(dāng)前第68頁\共有88頁\編于星期一\10點(diǎn)2023/6/1169相關(guān)搜索搜索結(jié)果不佳,有時(shí)候是因?yàn)檫x擇的查詢?cè)~不是很妥當(dāng)。您可以通過參考別人是怎么搜的,來獲得一些啟發(fā)。百度的“相關(guān)搜索”,就是和您的搜索很相似的一系列查詢?cè)~。百度相關(guān)搜索排布在搜索結(jié)果頁的下方,按搜索熱門度排序。

當(dāng)前第69頁\共有88頁\編于星期一\10點(diǎn)2023/6/1170當(dāng)前第70頁\共有88頁\編于星期一\10點(diǎn)2023/6/1171專業(yè)文檔搜索很多有價(jià)值的資料,在互聯(lián)網(wǎng)上并非以普通的網(wǎng)頁形式出現(xiàn),而是以Word、PowerPoint、PDF等文檔格式存在。百度支持對(duì)Office文檔(包括Word、Excel、PowerPoint)、AdobePDF文檔、RTF文檔的全文搜索。方法為在搜索的關(guān)鍵詞后面加一個(gè)“filetype:”文檔類型限定?!癴iletype:”后可以跟以下文件格式:DOC、XLS、PPT、PDF、RTF、ALL。其中,ALL包含所有文件類型。當(dāng)前第71頁\共有88頁\編于星期一\10點(diǎn)2023/6/1172當(dāng)前第72頁\共有88頁\編于星期一\10點(diǎn)2023/6/1173高級(jí)搜索把搜索范圍限定在網(wǎng)頁標(biāo)題中——intitle標(biāo)題通常是對(duì)網(wǎng)頁內(nèi)容提綱挈領(lǐng)式的歸納。把查詢內(nèi)容范圍限定在網(wǎng)頁標(biāo)題中,有時(shí)能獲得良好的效果。當(dāng)前第73頁\共有88頁\編于星期一\10點(diǎn)2023/6/1174當(dāng)前第74頁\共有88頁\編于星期一\10點(diǎn)2023/6/1175高級(jí)搜索把搜索范圍限定在特定站點(diǎn)中——site有時(shí)候,您如果知道某個(gè)站點(diǎn)中有自己需要找的東西,就可以把搜索范圍限定在這個(gè)站點(diǎn)中,提高查詢效率。使用的方式,是在查詢內(nèi)容的后面,加上“site:站點(diǎn)域名”。

當(dāng)前第75頁\共有88頁\編于星期一\10點(diǎn)2023/6/1176當(dāng)前第76頁\共有88頁\編于星期一\10點(diǎn)2023/6/1177高級(jí)搜索把搜索范圍限定在url鏈接中——inurl

網(wǎng)頁url中的某些信息,常常有某種有價(jià)值的含義。于是,您如果對(duì)搜索結(jié)果的url做某種限定,就可以獲得良好的效果。實(shí)現(xiàn)的方式,是用“inurl:”,后跟需要在url中出現(xiàn)的關(guān)鍵詞

當(dāng)前第77頁\共有88頁\編于星期一\10點(diǎn)2023/6/1178當(dāng)前第78頁\共有88頁\編于星期一\10點(diǎn)2023/6/1179高級(jí)搜索精確匹配——雙引號(hào)和書名號(hào)

如果輸入的查詢?cè)~很長(zhǎng),百度給出的搜索結(jié)果中的查詢?cè)~可能是拆分的。如果給查詢?cè)~加上雙引號(hào),就可以精確檢索。被書名號(hào)擴(kuò)起來的內(nèi)容,也不會(huì)被拆分,比如,查電影“手機(jī)”,如果不加書名號(hào),很多情況下出來的是通訊工具——手機(jī),而加上書名號(hào)后,《手機(jī)》結(jié)果就都是關(guān)于電影方面的了。當(dāng)前第79頁\共有88頁\編于星期一\10點(diǎn)2023/6/1180當(dāng)前第80頁\共有88頁\編于星期一\10點(diǎn)2023/6/1181高級(jí)搜索要求搜索結(jié)果中不含特定查詢?cè)~——

減號(hào)-

如果您發(fā)現(xiàn)搜索結(jié)果中,有某一類網(wǎng)頁是您不希望看見的,那么用減號(hào)語法,就可以去除所有這些含有特定關(guān)鍵詞的網(wǎng)頁。注意,前一個(gè)關(guān)鍵詞,和減號(hào)之間必須有空格,否則,減號(hào)會(huì)被當(dāng)成連字符處理,而失去減號(hào)語法功能。當(dāng)前第81頁\共有88頁\編于星期一\10點(diǎn)2023/6/1182當(dāng)前第82頁\共有88頁\編于星期一\10點(diǎn)2023/6/1183為什么搜索引擎搜不到?有些內(nèi)容,網(wǎng)上明明存在,但是用搜索引擎搜不到。如果事先理解搜索引擎能做的和不能做的,就可以設(shè)計(jì)更佳的搜索策略。而搜索之前思考一下搜索策略,是搜索成功最關(guān)鍵的一步。這樣的內(nèi)容,主要有3類:1、網(wǎng)上有,但是搜索引擎庫里沒有spider未能正確處理的網(wǎng)頁性質(zhì)及文件類型(如某些動(dòng)態(tài)網(wǎng)頁及frame、數(shù)據(jù)庫)沒有指向鏈接的孤島網(wǎng)頁

spider訪問時(shí)因?yàn)槟承┰蛘檬撬梨溄颖徽J(rèn)為是劣質(zhì)網(wǎng)頁而不抓因?yàn)?色情/反動(dòng)/spam/等問題而不抓的非法網(wǎng)頁需要輸入用戶名、密碼方可打開的網(wǎng)頁網(wǎng)站用robots協(xié)議拒絕搜索引擎抓取的網(wǎng)頁搜索引擎還未來得及抓取的新網(wǎng)頁當(dāng)前第83頁\共有88頁\編于星期一\10點(diǎn)2023/6/1184為什么搜不到?之二2、搜索引擎庫里有,但是未能正確索引網(wǎng)頁中信息分詞引起誤差圖型中的文字信息你看得懂但搜索引擎看不懂停用詞等搜索引擎故意不索引的信息搜索引擎對(duì)某些網(wǎng)頁有選擇的索引,未索引全部網(wǎng)頁信息3、搜索引擎正確索引了網(wǎng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論