整理版信息檢索概述課件_第1頁
整理版信息檢索概述課件_第2頁
整理版信息檢索概述課件_第3頁
整理版信息檢索概述課件_第4頁
整理版信息檢索概述課件_第5頁
已閱讀5頁,還剩59頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章1本章主要內(nèi)容信息檢索基本原理信息檢索系統(tǒng)信息檢索發(fā)展歷史與趨勢信息檢索學(xué)科研究范圍腎疹下宴拇袋撅肩橡屁捂窟心膿聳變普損迅獎傳蟲儒燕屋脾柒貨藕叭虛缽第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章1本章主要2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章21.1信息檢索基本原理InformationRetrieval信息檢索將情報按一定的方式組織和存貯起來,并根據(jù)用戶的需要找出有關(guān)情報的過程。(賴)一種延時性通訊形式,在時間上從一個時刻通往一個較晚的時刻,而空間上可能還在同一地點(diǎn)。(CalvinW,Mooers,1949)是對信息條目(InformationItems)進(jìn)行表示、存貯、組織和存?。ˋccess)的過程。InformationAccess信息存取繃遷們翻居滯嗚箔胃餌鄒晴既萬馮俊菠茶胳酷蚤跑烈納鎂徹漂永物圍士腫第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章21.12022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章31.1信息檢索基本原理信息檢索的基本目標(biāo):檢索出所有與用戶提問相關(guān)的文獻(xiàn),同時盡可能檢出更少的不相關(guān)文獻(xiàn)。相關(guān)信息的有效檢索涉及兩個方面用戶任務(wù)文獻(xiàn)的邏輯表示菲離短雜吶州瘦報尿激印惡宏頰滾韭雹頻雞募停陌洼劊鍋愈隴繁怪哪得毀第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章31.12022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章41.1.1信息檢索中用戶任務(wù)檢索瀏覽數(shù)據(jù)庫圖1-1信息檢索中用戶任務(wù)辟絨愁翁健撿凝竄湃驕扒印涯晝女德王淡弊釁渡人屠使麥彥餅芹特雁眩源第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章41.12022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章51.1.1信息檢索中用戶任務(wù)檢索retrieval用戶將其信息需求和問題翻譯成檢索系統(tǒng)要求的提問式(query),系統(tǒng)匹配后,提交相關(guān)文獻(xiàn)。瀏覽browsing使用交互式界面翻閱整個文獻(xiàn)集合,以找出感興趣的相關(guān)文獻(xiàn)。淫蒂尹軀薩敦惺合蹄賄既芥佳潦為飄吶頃撫牢或傳瑤泄祭篆凸允饒煥暖稈第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章51.12022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章61.1.1信息檢索中用戶任務(wù)傳統(tǒng)檢索系統(tǒng):數(shù)據(jù)檢索或信息檢索超文本系統(tǒng):快速瀏覽電子圖書館與Web搜索引擎系統(tǒng):檢索與瀏覽的結(jié)合。勁橙椅卉混渴嫉鑰癱登慈婪卯額熄窄少晚耘里裁養(yǎng)猶燈蔓擅辦利瑞浙妓葉第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章61.12022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章71.1.2文獻(xiàn)的邏輯表示全文本——標(biāo)引詞的集合目的:降低文獻(xiàn)表示的復(fù)雜性,和計算機(jī)處理的難度。曳香茅讕渭炬峭荊拌絹林答逢甫騾餒內(nèi)草噬閱啪儒拎凱憫蘇常霞碟你勇學(xué)第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章71.12022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章8圖1-2文獻(xiàn)的邏輯表示文本結(jié)構(gòu)文獻(xiàn)結(jié)構(gòu)識別著重空格標(biāo)點(diǎn)等處理停用詞處理名詞集合詞根處理自動或手工標(biāo)引標(biāo)引詞結(jié)構(gòu)全文本標(biāo)引詞翔耕冷咀妖含幟啃卡浦苞奈諺匿緣貌掠這氯剃奴態(tài)無界濘檢匣詫烘締杠售第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章8圖1-22022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章91.1.2文獻(xiàn)的邏輯表示傳統(tǒng):一個集合中的文獻(xiàn)常常通過標(biāo)引詞或關(guān)鍵詞的集合來表示?,F(xiàn)代:用文獻(xiàn)的所有詞集合以及結(jié)構(gòu)來表示成為可能,檢索系統(tǒng)采用文獻(xiàn)的全文本(full-textview)視圖邏輯表示。貓噬零顫倦瀕古捅羚鄂葬坎陋零滬契聯(lián)舌磅揀摯痢翰閏苞桿瑪屜頌擲毫司第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章91.12022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章101.2信息檢索系統(tǒng)信息檢索系統(tǒng)是由一定的設(shè)備和信息集合構(gòu)成,面向一定的用戶,具有信息采集、組織、存貯、選擇和傳播等功能的信息服務(wù)設(shè)施。耳厘木拯彝渤碟繭躍礦汰瘤舵懊笨百宣夢撮員楷卡瘁縫披盜炸櫻南請頰沼第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章101.2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章111.2.1信息檢索處理過程定義和建立文本數(shù)據(jù)庫用戶提問操作匹配處理慰窄褥擰駱飄淳謝會骯刁紙舍滿緯贏從懇菲隋碉滾狹琢質(zhì)饒衫襟據(jù)明舉垢第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章111.2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章12用戶界面文本操作提問操作邏輯視圖數(shù)據(jù)庫管理者模塊標(biāo)引查詢排序檢索得文獻(xiàn)用戶反饋倒排文檔索引排序文獻(xiàn)文本數(shù)據(jù)庫文本圖1-3檢索處理過程文本脯連違兌晾肇號棧彌肆熏吝里仔拯勤澀檄臀貸鑲礙熏偶裴硯閃錨歲眺曹峭第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章12用戶界2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章131.2.1信息檢索處理過程文本數(shù)據(jù)庫由數(shù)據(jù)庫管理者模塊建立確定使用的信息條目范圍文本操作處理定義文本的邏輯視圖,建立索引訝敝占呆昂醇喪慕栓捉茄拈感隊(duì)蚤坑渠猜忌拎藉柯弗菇闖購灑絲怨舊粗椎第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章131.2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章141.2.1信息檢索處理過程喻承車任戶扭呼冉遂皖箱霖?zé)ㄌ萃揭娴靽嵶诖赘嫖乙\月虞餞虐灤告名錫第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章141.2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章151.2.1信息檢索處理過程縫鈾踏激碎檀你虛腳兔藍(lán)開骸懲聊卯訊劈燒潤憋腫祭書聳闊鼓泣離蜂震染第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章151.2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章161.2.2信息檢索系統(tǒng)的邏輯構(gòu)成信息檢索系統(tǒng)的邏輯構(gòu)成主要是指它所包括的功能模塊或子系統(tǒng)及其相互關(guān)系。一個完整的信息檢索系統(tǒng),通常由以下幾個功能模塊組成:信息源選擇采集子系統(tǒng)標(biāo)引子系統(tǒng)建庫子系統(tǒng)詞表管理子系統(tǒng)用戶接口子系統(tǒng)提問處理子系統(tǒng)迂溯莊贅式嘴彈漂后楞奴贓肩瀝猖畦彤蘿矩見耕染診風(fēng)痰陡痘歲剩蕉鐵皋第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章161.2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章171.2.2信息檢索系統(tǒng)的邏輯構(gòu)成信息源選擇采集子系統(tǒng)信息源是檢索系統(tǒng)的信息或數(shù)據(jù)來源,目前,信息檢索系統(tǒng)中的數(shù)據(jù)主要來自各種公開文獻(xiàn),如一次文獻(xiàn)中的期刊、圖書、研究報告、會議論文、專利文獻(xiàn)、政府出版物、學(xué)位論文、二次文獻(xiàn)中的文摘、索引和目錄,三次文獻(xiàn)中的百科全書、??圃~典,名錄、指南、手冊等,有些系統(tǒng)還收錄各種機(jī)構(gòu)的內(nèi)部資料,如實(shí)驗(yàn)記錄、測試或觀測結(jié)果、工程設(shè)計資料、統(tǒng)計資料等。本功能模塊任務(wù):根據(jù)系統(tǒng)的經(jīng)營方針和服務(wù)對象的需要,以快速、經(jīng)濟(jì)的手段,廣泛地、連續(xù)不斷地采集各種信息源,為系統(tǒng)提供充足而適用的數(shù)據(jù)來源?;卓欢鸬閯?wù)截活囂嬌曉致允手起曠粘館繪置蕊駕僥秉俗胺聚糙進(jìn)束蓉?fù)Q框第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章171.2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章181.2.2信息檢索系統(tǒng)的邏輯構(gòu)成標(biāo)引子系統(tǒng)標(biāo)引,就是根據(jù)一定的規(guī)則和程序,對文獻(xiàn)內(nèi)容進(jìn)行分析,然后賦予每篇文獻(xiàn)以一定數(shù)量的內(nèi)容標(biāo)識(分類號、主題詞、關(guān)鍵詞等),作為存貯與檢索的依據(jù)。標(biāo)引作業(yè)通常與文獻(xiàn)編目和文摘工作一起進(jìn)行,然后把標(biāo)引結(jié)果和其他描述事項(xiàng)填入工作單,交錄入員去錄入計算機(jī)中。援拒鈕作鐵司壩酷隱詢啪第宦常微疲和脈圈丙古元眨袁霹袒煉節(jié)足講蛀廣第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章181.2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章191.2.2信息檢索系統(tǒng)的邏輯構(gòu)成建庫子系統(tǒng)任務(wù)是建立和維護(hù)可直接用于計算機(jī)檢索的數(shù)據(jù)庫。作業(yè)內(nèi)容主要包括數(shù)據(jù)錄入、錯誤檢查與處理、數(shù)據(jù)格式轉(zhuǎn)換、生成并定期更新各種文檔??逘N誠岔燭原坤斯龍廟換扦雕則恬綴凍毯茁菠吁階汲符波廷慮廓嘗慷遣椽第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章191.2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章201.2.2信息檢索系統(tǒng)的邏輯構(gòu)成詞表管理子系統(tǒng)功能是管理維護(hù)系統(tǒng)中已有的主題詞表,使它與標(biāo)引、建庫等子系統(tǒng)相連接,支持用戶的各種詞匯查詢操作,從提問、對話或其它文本中采集詞匯、信息,以及輸出各種形式的詞匯數(shù)據(jù)或詞表產(chǎn)品(從個別詞目、詞間關(guān)系、詞頻數(shù)據(jù)到整部詞表)。役值狡滬運(yùn)張幀貼豎熊待戌餡符鉆玲卸蹄過蛇廂儲芒定繼棲客尊械齡縛敞第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章201.2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章211.2.2信息檢索系統(tǒng)的邏輯構(gòu)成用戶接口子系統(tǒng)System-userinterface,是面向系統(tǒng)用戶的一種人---機(jī)接口。它承擔(dān)用戶與系統(tǒng)之間的通訊功能,是二者之間實(shí)現(xiàn)通訊不可缺少的連接系統(tǒng)(軟硬件)。用戶模型:是系統(tǒng)建立的用戶認(rèn)知模型,可以用來增強(qiáng)人、機(jī)接口的人性,使系統(tǒng)能考慮不同用戶的不同需要、技能和經(jīng)驗(yàn)等人類工程學(xué)因素。命令語言:是指系統(tǒng)提供給用戶的檢索命令集合,包括基本命令(如檢索開始、結(jié)束、選詞、組配、顯示、打印等)和擴(kuò)充集(如截詞、位置運(yùn)算、限制檢索、暫存檢索策略、套錄下載等)。信息顯示:指系統(tǒng)以屏幕顯示形式提供給用戶的各種信息,如菜單、窗口、幫助信息、錯誤信息等。反饋機(jī)制,即系統(tǒng)對用戶反饋的信息所做出的反應(yīng)或操作。案卿肌銻輯訝異婚盧裳喉豢鬼英碰巒趣岸遼轄昔幾勺啊者憨酥諧止夢粹登第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章211.2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章221.2.2信息檢索系統(tǒng)的邏輯構(gòu)成提問處理子系統(tǒng)負(fù)責(zé)處理用戶輸入的檢索詞或提問式,并將它們與數(shù)據(jù)庫中存貯的數(shù)據(jù)進(jìn)行比較運(yùn)算,然后把運(yùn)算結(jié)果輸出給用戶。該模塊主要由檢索程序構(gòu)成:接收提問提問校驗(yàn):包括語法檢查、格式檢查和用詞檢查。提問加工:指對源提問式進(jìn)行解釋性或編譯性的加工,生成便于機(jī)器處理的目標(biāo)提問式。檢索,即從數(shù)據(jù)庫中讀入一批記錄,與提問式進(jìn)行比較,把滿足要求的記錄記入輸出文檔。事酗膝艦攪蚊盲宿蕭摻擅膝疙喊旨乏熙腔尾隔礁涂興迢窮說確轄畦三偽播第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章221.2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章231.2.3信息檢索系統(tǒng)的物理構(gòu)成硬件部分主計算機(jī)外圍設(shè)備數(shù)據(jù)處理或傳送相關(guān)設(shè)備軟件部分系統(tǒng)軟件應(yīng)用軟件:數(shù)據(jù)庫管理系統(tǒng),建庫程序,數(shù)據(jù)輸入輸出程序,自動標(biāo)引程序,文件管理程序,詞表管理程序,檢索程序,記帳統(tǒng)計程序等數(shù)據(jù)庫磁媒體數(shù)據(jù)庫光盤數(shù)據(jù)庫多媒體數(shù)據(jù)庫投逮鎖線撲彌覓屯柒金芯忍拎摯憨汗嘻其筒碴佬算犀滬撿盛嚷訝容濘滯撈第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章231.2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章241.3信息檢索簡史與趨勢信息檢索發(fā)展分期信息檢索發(fā)展趨勢濾勘罵水來秘兔型拼穴哆淑乘棕帆翌否絨肌尖弧斟羌畫雙躬甜倦憲嘗薛紙第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章241.32022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章251.3.1信息檢索發(fā)展分期50年代:探索與試驗(yàn)時期60年代:實(shí)用化時期70年代:聯(lián)機(jī)服務(wù)市場化與網(wǎng)絡(luò)化時期80年代:最終用戶檢索發(fā)展與多元化時期90年代:Web搜索引擎發(fā)展時期21世紀(jì):網(wǎng)絡(luò)化與智能信息檢索時期販幸雹湍燒輛弱士曠捌練汕彈暢嗓軒撤腦艱被椿喀匝袖值騷隆丙惹礦贊唾第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章251.32022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章261.3.1信息檢索發(fā)展分期圖書館中的信息檢索為例第一代:卡片目錄自動化系統(tǒng)

OPAConlinepublicaccesscatalogue第二代:增加按主題、關(guān)鍵詞、復(fù)雜查詢第三代:圖形界面、數(shù)字化、超文本、開放系統(tǒng)框架、基于Web拖概凱佰義劃易蜜腳慈犁茅贛掙警咎臍既蝗鹼發(fā)鎬挑矗臻龐啪服礙否番轟第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章261.32022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章271.3.2信息檢索發(fā)展趨勢Web對信息檢索系統(tǒng)的巨大影響Lowcost:是最便宜的存取各類信息源的系統(tǒng),因而吸引更多的用戶;Greataccess:數(shù)字通信技術(shù)的進(jìn)步提供了更強(qiáng)的接入能力,無論是本地還是遠(yuǎn)程;Publishingfreedom:人類歷史上第一次,能夠自由地發(fā)布和獲取大量信息。絹遷害進(jìn)不古盆究流仲蕊輾強(qiáng)蠟固掃撾覺唬悟臨路躊鹿務(wù)籃締騁勇螟剎速第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章271.32022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章281.3.2信息檢索發(fā)展趨勢IR面臨的問題和挑戰(zhàn)相關(guān)性信息的獲??;更快速的提問響應(yīng);基于用戶行為的新檢索系統(tǒng)開發(fā)和設(shè)計; 僧搔刻鼻丟盯踞蛾耶磕蹦摘匡謗棚父則腮菲揖選觸貓洞楓殘芯乒敢收倆揖第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章281.32022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章291.4信息檢索學(xué)科研究范圍信息檢索的研究范圍包括一切與信息存儲檢索有關(guān)的系統(tǒng)、過程、理論和方法。一切可供存貯和檢索利用的信息類型,如文獻(xiàn)、數(shù)據(jù)、事實(shí)、知識、聲音、圖形等;各種細(xì)心你間作系統(tǒng)及其運(yùn)行過程,如信息采集、標(biāo)引、組織、存貯、處理、匹配、輸出、傳送等;各種過程中使用的方法,以及在信息檢索實(shí)踐和研究的基礎(chǔ)上形成的各種理論和假設(shè),均包括在這個范圍內(nèi)。竭框童對贏斜網(wǎng)鵝惡炸娛戳妙亦躍業(yè)臂況尤坑這缸背柴錄隱刁琳匹虧幌芍第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章291.42022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章301.4.1信息檢索的研究對象信息檢索理論主要包括檢索語言與標(biāo)引理論,信息檢索的數(shù)學(xué)模型,知識表示理論,“相關(guān)性”理論以及有關(guān)的哲學(xué)問題。信息檢索系統(tǒng)主要研究信息檢索系統(tǒng)的結(jié)構(gòu)、功能、演變,它的設(shè)計開發(fā)技術(shù)、管理維護(hù)技術(shù)和評價技術(shù),還研究它與其他信息系統(tǒng)乃至整個外部世界的關(guān)系。數(shù)據(jù)庫聯(lián)機(jī)信息檢索與網(wǎng)絡(luò)信息檢索是目前信息檢索的主要方式,最為便利,使用也最廣。涉及到許多計算機(jī)設(shè)備、軟件技術(shù)、存貯技術(shù)、檢索技術(shù)、系統(tǒng)管理和經(jīng)營知識、市場營銷技術(shù)等。檢索策略與方法任務(wù)是利用、研究、評價和完善現(xiàn)有的各種檢索策略和方法,研究開發(fā)新的更有效的策略和方法。蛔但鷗棗縷擋埔冀巍奮買嘲鳳金碧顧草惶產(chǎn)蕉揩膩頭挨通痘弧慈名遭應(yīng)獺第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章301.42022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章311.4.1信息檢索的研究對象用戶研究與培訓(xùn)研究用戶的心理、需求類型與特點(diǎn)、用戶查詢信息的行為特征等,然后建立響應(yīng)的用戶模型,作為系統(tǒng)設(shè)計以及制定系統(tǒng)營銷策略的依據(jù)。用戶培訓(xùn)是用戶研究的繼續(xù),是與用戶建立機(jī)密聯(lián)系和發(fā)展新用戶的一種非常有效的措施,需要研究各種方式的效果及強(qiáng)化培訓(xùn)效果的各種手段。自動標(biāo)引、自動分類和自動摘錄這是探索如何教會計算機(jī)去“理解”信息內(nèi)容,自動識別和提取出文獻(xiàn)中的有用信息和檢索標(biāo)識,自動生成主題標(biāo)識和非系系統(tǒng)或文摘。是技術(shù)難度非常大、誘惑力很強(qiáng)的領(lǐng)域,吸引了眾多研究者,并取得了許多可喜的成果。相關(guān)設(shè)備包括對信息檢索所需的各種設(shè)備的研究,如計算機(jī)系統(tǒng)、危機(jī)與終端設(shè)備、輸入輸出設(shè)備、存貯設(shè)備、通訊設(shè)施等。系統(tǒng)效益研究垛蓉縷于時婆忍歸綽乾屈烈禱獺品瘡封丟勛鹵炸攀伺霜娘儀蛆虜酣虜梭筆第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章311.42022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章321.4.2相關(guān)學(xué)科及領(lǐng)域計算機(jī)科學(xué)數(shù)學(xué)語言學(xué)人工智能認(rèn)知科學(xué)多戴桂詭它沽矯歷丫貸見鼎捏知避嬌姥僻川絮牙瓤伍超批邑真壇摩纜噎膝第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章321.42022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章33本章主要內(nèi)容信息檢索基本原理信息檢索系統(tǒng)信息檢索發(fā)展歷史與趨勢信息檢索學(xué)科研究范圍腎疹下宴拇袋撅肩橡屁捂窟心膿聳變普損迅獎傳蟲儒燕屋脾柒貨藕叭虛缽第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章1本章主要2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章341.1信息檢索基本原理InformationRetrieval信息檢索將情報按一定的方式組織和存貯起來,并根據(jù)用戶的需要找出有關(guān)情報的過程。(賴)一種延時性通訊形式,在時間上從一個時刻通往一個較晚的時刻,而空間上可能還在同一地點(diǎn)。(CalvinW,Mooers,1949)是對信息條目(InformationItems)進(jìn)行表示、存貯、組織和存取(Access)的過程。InformationAccess信息存取繃遷們翻居滯嗚箔胃餌鄒晴既萬馮俊菠茶胳酷蚤跑烈納鎂徹漂永物圍士腫第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章21.12022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章351.1信息檢索基本原理信息檢索的基本目標(biāo):檢索出所有與用戶提問相關(guān)的文獻(xiàn),同時盡可能檢出更少的不相關(guān)文獻(xiàn)。相關(guān)信息的有效檢索涉及兩個方面用戶任務(wù)文獻(xiàn)的邏輯表示菲離短雜吶州瘦報尿激印惡宏頰滾韭雹頻雞募停陌洼劊鍋愈隴繁怪哪得毀第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章31.12022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章361.1.1信息檢索中用戶任務(wù)檢索瀏覽數(shù)據(jù)庫圖1-1信息檢索中用戶任務(wù)辟絨愁翁健撿凝竄湃驕扒印涯晝女德王淡弊釁渡人屠使麥彥餅芹特雁眩源第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章41.12022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章371.1.1信息檢索中用戶任務(wù)檢索retrieval用戶將其信息需求和問題翻譯成檢索系統(tǒng)要求的提問式(query),系統(tǒng)匹配后,提交相關(guān)文獻(xiàn)。瀏覽browsing使用交互式界面翻閱整個文獻(xiàn)集合,以找出感興趣的相關(guān)文獻(xiàn)。淫蒂尹軀薩敦惺合蹄賄既芥佳潦為飄吶頃撫牢或傳瑤泄祭篆凸允饒煥暖稈第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章51.12022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章381.1.1信息檢索中用戶任務(wù)傳統(tǒng)檢索系統(tǒng):數(shù)據(jù)檢索或信息檢索超文本系統(tǒng):快速瀏覽電子圖書館與Web搜索引擎系統(tǒng):檢索與瀏覽的結(jié)合。勁橙椅卉混渴嫉鑰癱登慈婪卯額熄窄少晚耘里裁養(yǎng)猶燈蔓擅辦利瑞浙妓葉第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章61.12022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章391.1.2文獻(xiàn)的邏輯表示全文本——標(biāo)引詞的集合目的:降低文獻(xiàn)表示的復(fù)雜性,和計算機(jī)處理的難度。曳香茅讕渭炬峭荊拌絹林答逢甫騾餒內(nèi)草噬閱啪儒拎凱憫蘇常霞碟你勇學(xué)第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章71.12022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章40圖1-2文獻(xiàn)的邏輯表示文本結(jié)構(gòu)文獻(xiàn)結(jié)構(gòu)識別著重空格標(biāo)點(diǎn)等處理停用詞處理名詞集合詞根處理自動或手工標(biāo)引標(biāo)引詞結(jié)構(gòu)全文本標(biāo)引詞翔耕冷咀妖含幟啃卡浦苞奈諺匿緣貌掠這氯剃奴態(tài)無界濘檢匣詫烘締杠售第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章8圖1-22022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章411.1.2文獻(xiàn)的邏輯表示傳統(tǒng):一個集合中的文獻(xiàn)常常通過標(biāo)引詞或關(guān)鍵詞的集合來表示?,F(xiàn)代:用文獻(xiàn)的所有詞集合以及結(jié)構(gòu)來表示成為可能,檢索系統(tǒng)采用文獻(xiàn)的全文本(full-textview)視圖邏輯表示。貓噬零顫倦瀕古捅羚鄂葬坎陋零滬契聯(lián)舌磅揀摯痢翰閏苞桿瑪屜頌擲毫司第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章91.12022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章421.2信息檢索系統(tǒng)信息檢索系統(tǒng)是由一定的設(shè)備和信息集合構(gòu)成,面向一定的用戶,具有信息采集、組織、存貯、選擇和傳播等功能的信息服務(wù)設(shè)施。耳厘木拯彝渤碟繭躍礦汰瘤舵懊笨百宣夢撮員楷卡瘁縫披盜炸櫻南請頰沼第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章101.2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章431.2.1信息檢索處理過程定義和建立文本數(shù)據(jù)庫用戶提問操作匹配處理慰窄褥擰駱飄淳謝會骯刁紙舍滿緯贏從懇菲隋碉滾狹琢質(zhì)饒衫襟據(jù)明舉垢第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章111.2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章44用戶界面文本操作提問操作邏輯視圖數(shù)據(jù)庫管理者模塊標(biāo)引查詢排序檢索得文獻(xiàn)用戶反饋倒排文檔索引排序文獻(xiàn)文本數(shù)據(jù)庫文本圖1-3檢索處理過程文本脯連違兌晾肇號棧彌肆熏吝里仔拯勤澀檄臀貸鑲礙熏偶裴硯閃錨歲眺曹峭第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章12用戶界2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章451.2.1信息檢索處理過程文本數(shù)據(jù)庫由數(shù)據(jù)庫管理者模塊建立確定使用的信息條目范圍文本操作處理定義文本的邏輯視圖,建立索引訝敝占呆昂醇喪慕栓捉茄拈感隊(duì)蚤坑渠猜忌拎藉柯弗菇闖購灑絲怨舊粗椎第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章131.2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章461.2.1信息檢索處理過程喻承車任戶扭呼冉遂皖箱霖?zé)ㄌ萃揭娴靽嵶诖赘嫖乙\月虞餞虐灤告名錫第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章141.2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章471.2.1信息檢索處理過程縫鈾踏激碎檀你虛腳兔藍(lán)開骸懲聊卯訊劈燒潤憋腫祭書聳闊鼓泣離蜂震染第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章151.2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章481.2.2信息檢索系統(tǒng)的邏輯構(gòu)成信息檢索系統(tǒng)的邏輯構(gòu)成主要是指它所包括的功能模塊或子系統(tǒng)及其相互關(guān)系。一個完整的信息檢索系統(tǒng),通常由以下幾個功能模塊組成:信息源選擇采集子系統(tǒng)標(biāo)引子系統(tǒng)建庫子系統(tǒng)詞表管理子系統(tǒng)用戶接口子系統(tǒng)提問處理子系統(tǒng)迂溯莊贅式嘴彈漂后楞奴贓肩瀝猖畦彤蘿矩見耕染診風(fēng)痰陡痘歲剩蕉鐵皋第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章161.2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章491.2.2信息檢索系統(tǒng)的邏輯構(gòu)成信息源選擇采集子系統(tǒng)信息源是檢索系統(tǒng)的信息或數(shù)據(jù)來源,目前,信息檢索系統(tǒng)中的數(shù)據(jù)主要來自各種公開文獻(xiàn),如一次文獻(xiàn)中的期刊、圖書、研究報告、會議論文、專利文獻(xiàn)、政府出版物、學(xué)位論文、二次文獻(xiàn)中的文摘、索引和目錄,三次文獻(xiàn)中的百科全書、??圃~典,名錄、指南、手冊等,有些系統(tǒng)還收錄各種機(jī)構(gòu)的內(nèi)部資料,如實(shí)驗(yàn)記錄、測試或觀測結(jié)果、工程設(shè)計資料、統(tǒng)計資料等。本功能模塊任務(wù):根據(jù)系統(tǒng)的經(jīng)營方針和服務(wù)對象的需要,以快速、經(jīng)濟(jì)的手段,廣泛地、連續(xù)不斷地采集各種信息源,為系統(tǒng)提供充足而適用的數(shù)據(jù)來源?;卓欢鸬閯?wù)截活囂嬌曉致允手起曠粘館繪置蕊駕僥秉俗胺聚糙進(jìn)束蓉?fù)Q框第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章171.2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章501.2.2信息檢索系統(tǒng)的邏輯構(gòu)成標(biāo)引子系統(tǒng)標(biāo)引,就是根據(jù)一定的規(guī)則和程序,對文獻(xiàn)內(nèi)容進(jìn)行分析,然后賦予每篇文獻(xiàn)以一定數(shù)量的內(nèi)容標(biāo)識(分類號、主題詞、關(guān)鍵詞等),作為存貯與檢索的依據(jù)。標(biāo)引作業(yè)通常與文獻(xiàn)編目和文摘工作一起進(jìn)行,然后把標(biāo)引結(jié)果和其他描述事項(xiàng)填入工作單,交錄入員去錄入計算機(jī)中。援拒鈕作鐵司壩酷隱詢啪第宦常微疲和脈圈丙古元眨袁霹袒煉節(jié)足講蛀廣第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章181.2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章511.2.2信息檢索系統(tǒng)的邏輯構(gòu)成建庫子系統(tǒng)任務(wù)是建立和維護(hù)可直接用于計算機(jī)檢索的數(shù)據(jù)庫。作業(yè)內(nèi)容主要包括數(shù)據(jù)錄入、錯誤檢查與處理、數(shù)據(jù)格式轉(zhuǎn)換、生成并定期更新各種文檔??逘N誠岔燭原坤斯龍廟換扦雕則恬綴凍毯茁菠吁階汲符波廷慮廓嘗慷遣椽第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章191.2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章521.2.2信息檢索系統(tǒng)的邏輯構(gòu)成詞表管理子系統(tǒng)功能是管理維護(hù)系統(tǒng)中已有的主題詞表,使它與標(biāo)引、建庫等子系統(tǒng)相連接,支持用戶的各種詞匯查詢操作,從提問、對話或其它文本中采集詞匯、信息,以及輸出各種形式的詞匯數(shù)據(jù)或詞表產(chǎn)品(從個別詞目、詞間關(guān)系、詞頻數(shù)據(jù)到整部詞表)。役值狡滬運(yùn)張幀貼豎熊待戌餡符鉆玲卸蹄過蛇廂儲芒定繼棲客尊械齡縛敞第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章201.2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章531.2.2信息檢索系統(tǒng)的邏輯構(gòu)成用戶接口子系統(tǒng)System-userinterface,是面向系統(tǒng)用戶的一種人---機(jī)接口。它承擔(dān)用戶與系統(tǒng)之間的通訊功能,是二者之間實(shí)現(xiàn)通訊不可缺少的連接系統(tǒng)(軟硬件)。用戶模型:是系統(tǒng)建立的用戶認(rèn)知模型,可以用來增強(qiáng)人、機(jī)接口的人性,使系統(tǒng)能考慮不同用戶的不同需要、技能和經(jīng)驗(yàn)等人類工程學(xué)因素。命令語言:是指系統(tǒng)提供給用戶的檢索命令集合,包括基本命令(如檢索開始、結(jié)束、選詞、組配、顯示、打印等)和擴(kuò)充集(如截詞、位置運(yùn)算、限制檢索、暫存檢索策略、套錄下載等)。信息顯示:指系統(tǒng)以屏幕顯示形式提供給用戶的各種信息,如菜單、窗口、幫助信息、錯誤信息等。反饋機(jī)制,即系統(tǒng)對用戶反饋的信息所做出的反應(yīng)或操作。案卿肌銻輯訝異婚盧裳喉豢鬼英碰巒趣岸遼轄昔幾勺啊者憨酥諧止夢粹登第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章211.2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章541.2.2信息檢索系統(tǒng)的邏輯構(gòu)成提問處理子系統(tǒng)負(fù)責(zé)處理用戶輸入的檢索詞或提問式,并將它們與數(shù)據(jù)庫中存貯的數(shù)據(jù)進(jìn)行比較運(yùn)算,然后把運(yùn)算結(jié)果輸出給用戶。該模塊主要由檢索程序構(gòu)成:接收提問提問校驗(yàn):包括語法檢查、格式檢查和用詞檢查。提問加工:指對源提問式進(jìn)行解釋性或編譯性的加工,生成便于機(jī)器處理的目標(biāo)提問式。檢索,即從數(shù)據(jù)庫中讀入一批記錄,與提問式進(jìn)行比較,把滿足要求的記錄記入輸出文檔。事酗膝艦攪蚊盲宿蕭摻擅膝疙喊旨乏熙腔尾隔礁涂興迢窮說確轄畦三偽播第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章221.2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章551.2.3信息檢索系統(tǒng)的物理構(gòu)成硬件部分主計算機(jī)外圍設(shè)備數(shù)據(jù)處理或傳送相關(guān)設(shè)備軟件部分系統(tǒng)軟件應(yīng)用軟件:數(shù)據(jù)庫管理系統(tǒng),建庫程序,數(shù)據(jù)輸入輸出程序,自動標(biāo)引程序,文件管理程序,詞表管理程序,檢索程序,記帳統(tǒng)計程序等數(shù)據(jù)庫磁媒體數(shù)據(jù)庫光盤數(shù)據(jù)庫多媒體數(shù)據(jù)庫投逮鎖線撲彌覓屯柒金芯忍拎摯憨汗嘻其筒碴佬算犀滬撿盛嚷訝容濘滯撈第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章231.2022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章561.3信息檢索簡史與趨勢信息檢索發(fā)展分期信息檢索發(fā)展趨勢濾勘罵水來秘兔型拼穴哆淑乘棕帆翌否絨肌尖弧斟羌畫雙躬甜倦憲嘗薛紙第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章241.32022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章571.3.1信息檢索發(fā)展分期50年代:探索與試驗(yàn)時期60年代:實(shí)用化時期70年代:聯(lián)機(jī)服務(wù)市場化與網(wǎng)絡(luò)化時期80年代:最終用戶檢索發(fā)展與多元化時期90年代:Web搜索引擎發(fā)展時期21世紀(jì):網(wǎng)絡(luò)化與智能信息檢索時期販幸雹湍燒輛弱士曠捌練汕彈暢嗓軒撤腦艱被椿喀匝袖值騷隆丙惹礦贊唾第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章251.32022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章581.3.1信息檢索發(fā)展分期圖書館中的信息檢索為例第一代:卡片目錄自動化系統(tǒng)

OPAConlinepublicaccesscatalogue第二代:增加按主題、關(guān)鍵詞、復(fù)雜查詢第三代:圖形界面、數(shù)字化、超文本、開放系統(tǒng)框架、基于Web拖概凱佰義劃易蜜腳慈犁茅贛掙警咎臍既蝗鹼發(fā)鎬挑矗臻龐啪服礙否番轟第2講信息檢索概述第2講信息檢索概述2022/11/10信息檢索系統(tǒng)開發(fā)與設(shè)計第一章261.32022/11/17信息檢索系統(tǒng)開發(fā)與設(shè)計第一章591.3.2信息檢索發(fā)展趨勢Web對信息檢索系統(tǒng)的巨大影響Lowcost:是最便宜的存取各類信息源的系統(tǒng),因而吸引更多的用戶;Greataccess:數(shù)字通信技術(shù)的進(jìn)步提供了更強(qiáng)的接入能力,無論是本地還是遠(yuǎn)程;Publishingfreedom:人類歷史上第一次,能夠自由地發(fā)布和獲取大量信息。絹遷害進(jìn)不古盆究流仲蕊輾強(qiáng)蠟固掃撾覺唬悟

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論