版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、常見(jiàn)檢索技術(shù)作者:陳亞萍 學(xué)號(hào):1101212925手工檢索(manual retrieval)是一種傳統(tǒng)的檢索方法,即以手工翻檢的方式,利用工具書(shū)(包括圖書(shū)、期刊、目錄卡片等)來(lái)檢索信息的一種檢索手段。與之對(duì)應(yīng)的計(jì)算機(jī)檢索(computer-based retrieval)簡(jiǎn)稱機(jī)檢,是指利用計(jì)算機(jī)通過(guò)各種數(shù)據(jù)庫(kù)查找所需文獻(xiàn)信息的方法,檢索過(guò)程是由人操縱計(jì)算機(jī)完成的,其匹配是由計(jì)算機(jī)進(jìn)行的。在檢索過(guò)程中,人是整個(gè)檢索方案的計(jì)設(shè)者和操縱者。利用機(jī)器及計(jì)算機(jī),配合以相應(yīng)的搜索語(yǔ)言和邏輯對(duì)相關(guān)課題進(jìn)行檢索是檢索技術(shù)的發(fā)展趨勢(shì)。檢索表達(dá)式,又稱檢索式、檢索提問(wèn)式,是機(jī)檢中用來(lái)表達(dá)檢索提問(wèn)的一種邏輯運(yùn)算
2、式。構(gòu)建檢索表達(dá)式需要用到相關(guān)邏輯檢索及檢索技術(shù)。(一) 常用檢索方法概述1. 布爾邏輯運(yùn)算檢索是指利用布爾運(yùn)算符連接各個(gè)檢索詞,然后由計(jì)算機(jī)進(jìn)行相應(yīng)邏輯運(yùn)算,以找出所需信息的方法。它使用面最廣、使用頻率最高。2. 位置運(yùn)算檢索位置算符檢索是用一些特定的算符(位置算符)來(lái)表達(dá)檢索詞與檢索詞之間的臨近關(guān)系,并且可以不依賴主題詞表而直接使用自由詞進(jìn)行檢索的技術(shù)方法。3. 截詞檢索與詞根檢索截詞檢索是預(yù)防漏檢提高查全率的一種常用檢索技術(shù),大多數(shù)系統(tǒng)都提供截詞檢索的功能。截詞是指在檢索詞的合適位置進(jìn)行截?cái)?,然后使用截詞符進(jìn)行處理,這樣既可節(jié)省輸入的字符數(shù)目,又可達(dá)到較高的查全率。詞根檢索是指輸入某一單
3、詞,系統(tǒng)會(huì)自動(dòng)匹配與該詞具有相同詞根的其他詞。4. 字段檢索限定如主題、關(guān)鍵詞等某個(gè)字段進(jìn)行檢索。5. 全文檢索將文件中所有文本與檢索項(xiàng)匹配的文字資料檢索方法。6. 精確檢索指檢索詞與結(jié)果完全匹配的檢索技術(shù)。與之對(duì)應(yīng)的模糊檢索,則是指檢索詞的基礎(chǔ)上進(jìn)行相應(yīng)的擴(kuò)展。7. 其他檢索技術(shù)(禁用詞、嵌套、限制詞、大小寫(xiě)敏感詞等)(二) 分述1. 布爾邏輯檢索(Boolean retrieval)喬治布爾(George Boole,1815年11月1864年),愛(ài)爾蘭數(shù)學(xué)家,哲學(xué)家。1848年,布爾出版了The Mathematical Analysis of Logic,這是他對(duì)符號(hào)邏輯諸多貢獻(xiàn)中的第
4、一次。1854年,他出版了The Laws of Thought,這是他最著名的著作。在這本書(shū)中布爾介紹了現(xiàn)在以他的名字命名的布爾代數(shù)。由于其在符號(hào)邏輯運(yùn)算中的特殊貢獻(xiàn),很多計(jì)算機(jī)語(yǔ)言中將邏輯運(yùn)算稱為布爾運(yùn)算,將其結(jié)果稱為布爾值。布爾邏輯在檢索中主要分為與、邏輯或、邏輯非。(1) 邏輯與含義表示檢出同時(shí)含有A、B兩個(gè)檢索詞的記錄。用法常用于連接不同概念的檢索詞,以表達(dá)復(fù)雜的主題運(yùn)算符AND 或*檢索式A AND B 或A*B例如:分別在中英文數(shù)據(jù)庫(kù)中,用題名字段檢索智能機(jī)器人控制方面的文獻(xiàn)。示例數(shù)據(jù)庫(kù):CNKI 檢索式:智能機(jī)器人*控制 示例數(shù)據(jù)庫(kù):ScienceDirect 檢索式:inte
5、lligent robot AND control由結(jié)果可見(jiàn),邏輯與重在“同時(shí)”,及檢索字段里出現(xiàn)and/*前后的檢索詞。(2) 邏輯或含義表示檢出含有A詞或者B詞的記錄。用法常用于連接同一概念的不同表達(dá)方式,或者相關(guān)詞,以防漏檢。運(yùn)算符OR 或者+檢索式A OR B 或者A+B例如:在中文數(shù)據(jù)庫(kù)中檢索二氧化硫方面的文章數(shù)據(jù)庫(kù):CNKI 檢索式:二氧化硫OR SO2在英文數(shù)據(jù)庫(kù)中檢索傳感器方面的文章示例數(shù)據(jù)庫(kù):CSA 檢索式:sensor OR detector由上述檢索結(jié)果可見(jiàn),邏輯或的意義為OR/+前后的檢索詞“出現(xiàn)其一或同時(shí)出現(xiàn)”,這樣能夠保證課題的查全率。(3) 邏輯非含義檢出含有A詞
6、,但同時(shí)不含有B詞的記錄。用法常用于排除某些概念,以達(dá)到精確檢索的目的。運(yùn)算符NOT 或-檢索式A NOT B 或者A-B例如:在中文數(shù)據(jù)庫(kù)中查非酒精飲料方面的文章示例數(shù)據(jù)庫(kù):萬(wàn)方 檢索式:飲料NOT 酒精(4) 注意邏輯運(yùn)算符在中文數(shù)據(jù)庫(kù)中多使用符號(hào)*,+,-,在英文數(shù)據(jù)庫(kù)中使用字母and,or,not,具體如何使用,請(qǐng)參考數(shù)據(jù)庫(kù)的幫助或說(shuō)明。 邏輯運(yùn)算順序:如果有括號(hào),先執(zhí)行括號(hào)內(nèi)的運(yùn)算;沒(méi)有括號(hào)時(shí),各系統(tǒng)有不同的規(guī)定,檢索時(shí),請(qǐng)參考數(shù)據(jù)庫(kù)的幫助或說(shuō)明。2. 位置算符檢索用法:用來(lái)指定詞與詞的位置關(guān)系(1) W/n 算符兩側(cè)的兩個(gè)檢索詞按此前后銜接的順序排列,詞序不可變,詞與詞之間相互距離
7、不超過(guò)n個(gè)詞(注意:是單詞,不是字母)。W即with。示例數(shù)據(jù)庫(kù):World Scientific 檢索式:solar Near/2 energy(2) N/n 算符兩側(cè)的檢索詞之間的距離不超過(guò)n個(gè)詞,詞序可變。N即Near。示例數(shù)據(jù)庫(kù):World Scientific 檢索式:solar Near/2 energy(3) Same 算符兩側(cè)的檢索詞在同一個(gè)子字段或同一個(gè)自然句中,使用 SAME 運(yùn)算符(而非 AND 運(yùn)算符)是縮小檢索范圍的好方法。(4) Paragraph算符兩側(cè)的檢索詞在同一個(gè)段落中。3. 截詞檢索與詞根檢索(1) 截詞檢索截詞檢索或稱通配符擴(kuò)展檢索,是預(yù)防漏檢提高查全率
8、的一種常用檢索技術(shù),大多數(shù)系統(tǒng)都提供截詞檢索的功能。截詞是指在檢索詞的合適位置進(jìn)行截?cái)啵缓笫褂媒卦~符進(jìn)行處理,這樣既可節(jié)省輸入的字符數(shù)目,又可達(dá)到較高的查全率。用某個(gè)符號(hào)來(lái)代替英文單詞的一部分,通常用于相同詞干或部分拼寫(xiě)相同的詞,常用的截詞符有* ? 等。?代表任意一個(gè)字符,*代表零個(gè)或多個(gè)字符。截詞檢索可分為:n 有限截詞放在詞中間或末尾,一個(gè)符號(hào)表示一個(gè)字母。例如:示例數(shù)據(jù)庫(kù):Web of Science (SCI) 輸入wom*n 檢出woman,womenn 無(wú)限截詞放在詞的末尾,一個(gè)符號(hào)表示任意多個(gè)字母。例如:示例數(shù)據(jù)庫(kù):Oxford University Press(OUP)輸入
9、compute? 檢出computer,computers,computed(2) 詞根檢索(stemming)即檢索系統(tǒng)會(huì)根據(jù)詞根的分析檢索相關(guān)詞,例如輸入computer,系統(tǒng)自動(dòng)檢索包含詞根“computer”的單詞(computer、computing、 computational、computed等等)的全部記錄。示例數(shù)據(jù)庫(kù):EI 輸入:control 輸出:control,controller,controlling等檢索選項(xiàng)示意圖檢索結(jié)果示意圖4. 字段檢索即將搜索詞限定在某個(gè)字段進(jìn)行搜索,字段檢索結(jié)合邏輯檢索可以提高結(jié)果的精準(zhǔn)度。常見(jiàn)字段English搜索結(jié)果呈現(xiàn)位置摘要Abs
10、tract論文摘要題名Title書(shū)目或論文題目關(guān)鍵詞Keyword摘要或關(guān)鍵詞主題Subject呈現(xiàn)相關(guān)主題的文獻(xiàn)作者Author按作者呈現(xiàn)結(jié)果作者機(jī)構(gòu)Affiliation按作者單位呈現(xiàn)結(jié)果圖書(shū)編號(hào)ISBN搜索某圖書(shū)期刊編號(hào)ISSN搜索某期刊內(nèi)文獻(xiàn)5. 全文檢索全文檢索(full-text search),是指從各數(shù)據(jù)中逐字查詢所鍵入的檢索詞,目的是查看所要的詞語(yǔ)是否出現(xiàn)在文本中,但是全文字段并不查詢書(shū)名或者其他的字段。使用時(shí),檢索詞越明確越好。6. 精確檢索用法:用來(lái)檢索特定的詞組或句子數(shù)據(jù)可采用如下任意方式來(lái)實(shí)現(xiàn)精確檢索:(1) 使用特定符號(hào)“” (如google, EI)(2) 使用程
11、序控制,如CNKI利用精確匹配和模糊匹配實(shí)現(xiàn)。7. 其他檢索技術(shù)(1) 禁用詞用法:排除沒(méi)有檢索意義的詞。這些詞通常是一些虛詞,如冠詞、連詞、助詞等。檢索時(shí)可查看系統(tǒng)的禁用詞表。例如:漢語(yǔ)中“的、地、得、了”等。英語(yǔ)中的a /about /also/ and /any/ as /at/ be /between/ by/both/ for/ some/ so/ not /this/ with等。(2) 嵌套用途:簡(jiǎn)化檢索式,提高檢索效率例:在中文數(shù)據(jù)庫(kù)中查本科生或研究生的就業(yè)問(wèn)題(本科生OR 研究生)AND 就業(yè)例:在英文數(shù)據(jù)庫(kù)中查有關(guān)造紙廢水處理方面的文章(paper making OR pa
12、per pulp)AND wastewater AND (treat OR treatment)(3) 限制詞字段檢索和限制檢索常常結(jié)合使用,字段檢索就是限制檢索的一種,因?yàn)橄拗茩z索往往是對(duì)字段的限制。在搜索引擎中,字段檢索多表現(xiàn)為限制前綴符的形式。如屬于主題字段限制的有:Title,Subject,Keywords等。屬于非主題字段限制的有:Image,Text等。作為一種網(wǎng)絡(luò)檢索工具,搜索引擎提供了許多帶有典型網(wǎng)絡(luò)檢索特征的字段限制類型,如主機(jī)名(host);域名(domain);鏈接(link);URL(site);新聞組(newsgroup)和 E-mail限制等。這些字段限制功能限定了檢索詞在數(shù)據(jù)庫(kù)記錄中出現(xiàn)的區(qū)域。如在北大網(wǎng)站上關(guān)于籃球賽的信息:(4) 大小寫(xiě)敏感詞(casesensitive)它主要是針對(duì)檢索詞中含有人名、地名等專有名詞的。在區(qū)分大小寫(xiě)的情況下,大寫(xiě)檢索詞能被當(dāng)作專有名詞看待(如 Internet專指因特網(wǎng));小寫(xiě)檢索詞則被當(dāng)作普通詞看待(如internet則代表互聯(lián)網(wǎng)絡(luò))。而在不區(qū)分大小寫(xiě)的情況下,則無(wú)法區(qū)分該檢索詞是指專
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 小區(qū)消防監(jiān)控合同范例
- 廣告公司會(huì)員積分合同模板
- 勞務(wù)施工安裝合同范例
- 寫(xiě)給前任催淚的一封信致前任的一封信
- 廣場(chǎng)施工合同范例村
- 成品衣柜出售合同范例
- 戶口遷移合同范例
- 公司對(duì)賬合同模板
- 初中文言文實(shí)詞及虛詞意義知識(shí)點(diǎn)歸納
- 2024年中衛(wèi)客運(yùn)資格證仿真考試題
- 臺(tái)背填土現(xiàn)場(chǎng)質(zhì)量檢驗(yàn)報(bào)告單
- 旅游行政管理第二章旅游行政管理體制課件
- 學(xué)生崗位實(shí)習(xí)家長(zhǎng)(或法定監(jiān)護(hù)人)知情同意書(shū)
- 衛(wèi)生院關(guān)于召開(kāi)基本公共衛(wèi)生服務(wù)項(xiàng)目培訓(xùn)會(huì)的通知
- JJF(電子)0036-2019 示波器電流探頭校準(zhǔn)規(guī)范-(高清現(xiàn)行)
- 飛機(jī)試飛運(yùn)行管理+調(diào)機(jī)飛行運(yùn)行管理規(guī)定
- 蓄水池防水施工方案
- 管理咨詢公司關(guān)鍵績(jī)效考核指標(biāo)
- 隧道的襯砌計(jì)算(85頁(yè)清楚明了)
- 人教版八年級(jí)(初二)數(shù)學(xué)上冊(cè)全冊(cè)課件PPT
- Q∕GDW 10202-2021 國(guó)家電網(wǎng)有限公司應(yīng)急指揮中心建設(shè)規(guī)范
評(píng)論
0/150
提交評(píng)論