信息檢索系統(tǒng)的評(píng)價(jià)_第1頁(yè)
信息檢索系統(tǒng)的評(píng)價(jià)_第2頁(yè)
信息檢索系統(tǒng)的評(píng)價(jià)_第3頁(yè)
信息檢索系統(tǒng)的評(píng)價(jià)_第4頁(yè)
信息檢索系統(tǒng)的評(píng)價(jià)_第5頁(yè)
已閱讀5頁(yè),還剩41頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第十一章信息檢索系統(tǒng)評(píng)價(jià)111評(píng)價(jià)研究概述1試解釋信息檢索系統(tǒng)的內(nèi)涵。2什么是”評(píng)價(jià)?一、意義評(píng)價(jià)(Evaluation):發(fā)現(xiàn)和收集關(guān)于某種活動(dòng)的數(shù)據(jù), 從中判斷該項(xiàng)活動(dòng)的質(zhì)量及達(dá)到預(yù)期目標(biāo)程度的行為。 簡(jiǎn)單地說(shuō),評(píng)價(jià)就是對(duì)系統(tǒng)的價(jià)值和效率進(jìn)行測(cè)評(píng)。信息檢索系統(tǒng)評(píng)價(jià):根據(jù)給定的指標(biāo)體系,采用一定的方 法和程序,對(duì)信息檢索系統(tǒng)的功能、特性和運(yùn)營(yíng)狀況進(jìn)行評(píng)測(cè),或?qū)τ嘘P(guān)假設(shè).預(yù)期效益、性能值進(jìn)行驗(yàn)證,以確定系統(tǒng)達(dá)到了何種水平.投入成本是否值得.是否可以改 進(jìn)和如何改進(jìn),乃至系統(tǒng)是否應(yīng)生存下去。一、意義信息檢索系統(tǒng)的評(píng)價(jià)研究,一直是信息檢索領(lǐng)域的一項(xiàng) 重要研究?jī)?nèi)容。多年來(lái)人們進(jìn)行了大量的評(píng)價(jià)試驗(yàn)和多

2、角度 的探索。原因在于,檢索系統(tǒng)評(píng)價(jià)工作在為研究者驗(yàn)證檢索系統(tǒng) 效益.比較各種檢索技術(shù)的優(yōu)劣.改進(jìn)現(xiàn)有檢索系統(tǒng).開(kāi)發(fā) 新的應(yīng)用領(lǐng)域等方面,都具有不可替代的作用。一、意義主要意義: 了解已有檢索系統(tǒng)的功能,找出缺陷并改進(jìn);比較各種檢索系統(tǒng)的優(yōu)劣;提高提高效率和效益;有助于新的檢索系統(tǒng)的設(shè)計(jì);豐富信息檢索的理論。第十一章信息檢索系統(tǒng)評(píng)價(jià)11.1評(píng)價(jià)研究概述二、評(píng)價(jià)范圍與類型信息檢索系統(tǒng)是一個(gè)有眾多功能模塊組成的集合體。 評(píng)價(jià)可以從不同角度、基于不同目的和方法來(lái)進(jìn)行。評(píng)價(jià)范圍:各種類型的檢索系統(tǒng)及組成要素。評(píng)價(jià)類型:宏觀評(píng)價(jià):著眼于檢索系統(tǒng)的宏觀方面,如情報(bào)源類型、系統(tǒng) 結(jié)構(gòu)、收錄范圍、利用率等。個(gè)

3、別評(píng)價(jià):僅對(duì)系統(tǒng)的某一性能、功能進(jìn)行評(píng)價(jià)。性能評(píng)價(jià)(performance evaluation):面向用戶的評(píng)價(jià),測(cè)定檢 索系統(tǒng)的廣量或服務(wù)效果。也稱為檢索效果評(píng)價(jià)(effectiveness evaluatio n)。第十一章信息檢索系統(tǒng)評(píng)價(jià)11.1評(píng)價(jià)研究概述二、評(píng)價(jià)范圍與類型 評(píng)價(jià)類型:效益評(píng)價(jià)(benefits evaluation):測(cè)定系統(tǒng)或用戶獲得的的經(jīng)濟(jì)效益和社會(huì)效益。(有直接的.潛在的;難以直接計(jì)量)費(fèi)用/效果評(píng)價(jià)(cost effectiveness evaluation):考察系統(tǒng)達(dá)到的性能與費(fèi)用消耗之間的關(guān)系。(用戶.系統(tǒng)兩方面)費(fèi)用/效益評(píng)價(jià)(cost benefi

4、ts evaluation):考察系統(tǒng)的服務(wù) 效益與費(fèi)用消耗間的關(guān)系。(計(jì)量難度較大)(詳見(jiàn)P2 07的解釋)第十一章信息檢索系統(tǒng)評(píng)價(jià)11-2評(píng)價(jià)指標(biāo)一、評(píng)價(jià)指標(biāo)體系要評(píng)價(jià)一個(gè)檢索系統(tǒng),必須有一套科學(xué)的評(píng)價(jià)標(biāo)準(zhǔn)。 建立檢索系統(tǒng)評(píng)價(jià)指標(biāo)體系應(yīng)遵循的原則:各指標(biāo)應(yīng)定義單一、明確,具有可操作性。評(píng)價(jià)指標(biāo)最好能夠量化或計(jì)量。IEI指標(biāo)要完善、細(xì)致、全面。F面給出傳統(tǒng)檢索系統(tǒng)評(píng)價(jià)指標(biāo)體系模型:(供參考)信息檢索系統(tǒng)評(píng)價(jià)第十一章11-2評(píng)價(jià)指標(biāo)實(shí)驗(yàn)費(fèi)用學(xué)習(xí)費(fèi)用 存貯空間開(kāi)錨 可存取性 新穎性響應(yīng)時(shí)間H 查準(zhǔn)率 . 查全率 H 靈活性 檢索結(jié)果形式 使用方便性 ??啃允珍浄秶?運(yùn)行費(fèi)用研制費(fèi)用逐一評(píng)價(jià)這些指

5、標(biāo),可以判定檢索系統(tǒng)的優(yōu)劣。其中,比較重要的 是檢索性能指標(biāo)。土評(píng)價(jià)指標(biāo)問(wèn)題:-什么是查全率、查準(zhǔn)率?第十一章信息檢索系統(tǒng)評(píng)價(jià)11-2評(píng)價(jià)指標(biāo)二、主要性能指標(biāo)及分析1.查全率和查準(zhǔn)率查全率(Recall ratio, R):衡量一次檢索中與提問(wèn)相關(guān)的 文獻(xiàn)有多少篇被檢出。(衡量檢出相關(guān)文獻(xiàn)的能力)檢出的相關(guān)文獻(xiàn)量-數(shù)據(jù)庫(kù)中的相關(guān)文獻(xiàn)瞳第十一章信息檢索系統(tǒng)評(píng)價(jià)112評(píng)價(jià)指標(biāo)蘭主要性能指標(biāo)及分析1.查全率和查準(zhǔn)率查準(zhǔn)率(Precision ratio, P):衡量被檢出的文獻(xiàn)中有多少 篇與提問(wèn)相關(guān)。(衡量檢索的精確度)檢出的木目關(guān)文獻(xiàn)量檢出文獻(xiàn)總量第十一章信息檢索系統(tǒng)評(píng)價(jià)11-2評(píng)價(jià)指標(biāo)二、主要性

6、能指標(biāo)及分析例:設(shè)某檢索系統(tǒng)的數(shù)據(jù)庫(kù)中共有相關(guān)文獻(xiàn)20篇。針對(duì)某一個(gè)提問(wèn),檢出文獻(xiàn)總數(shù)為30篇,其中相關(guān)文獻(xiàn)數(shù)為15篇。求查全率R、查準(zhǔn)率P。151Sr% 礦50%第十一章信息檢索系統(tǒng)評(píng)價(jià)11-2評(píng)價(jià)指標(biāo)二、主要性能指標(biāo)及分析設(shè)某文獻(xiàn)庫(kù)所存儲(chǔ)的文獻(xiàn)總為便于分析,我們給出數(shù)學(xué)語(yǔ)言描述:量為L(zhǎng)。對(duì)某一給定提問(wèn),a表示被檢出的與提問(wèn)相關(guān)的文獻(xiàn)數(shù);b表示被檢出的與提問(wèn)無(wú)關(guān)的文獻(xiàn)數(shù);(前例a=15)(誤檢,前例b=15)c一表示與提問(wèn)相關(guān),但未被檢出的文獻(xiàn)數(shù)(漏檢,前例c=5)第十一章信息檢索系統(tǒng)評(píng)價(jià)11-2評(píng)價(jià)指標(biāo)第十一章信息檢索系統(tǒng)評(píng)價(jià)11-2評(píng)價(jià)指標(biāo)查全率/?=a + c誤檢率E =-a+b顯然,

7、Q = 1 漏檢率Q =a + cE = 1 p第十一章信息檢索系統(tǒng)評(píng)價(jià)11-2評(píng)價(jià)指標(biāo)蘭主要性能指標(biāo)及分析1.查全率和查準(zhǔn)率下面討論與查全率、査準(zhǔn)率有關(guān)的幾個(gè)問(wèn)題。(1) 查全率和查準(zhǔn)率的相互關(guān)系 一個(gè)理想的檢索系統(tǒng),應(yīng)是R= 1 P = 1 o 但實(shí)際上是不可能的。般說(shuō)來(lái),二者之間存在著反變關(guān)系,即:若要提高查全率,查準(zhǔn)率往往就會(huì)下降; 若要提高查準(zhǔn)率,查全率又就會(huì)下降。(二者相互制約)第十一章信息檢索系統(tǒng)評(píng)價(jià)11-2評(píng)價(jià)指標(biāo):主要性能指標(biāo)及分析(1)查全率和查準(zhǔn)率的相互關(guān)系 R與P的關(guān)系可由下圖描述:(稱為R-P圖)蘭主要性能指標(biāo)及分析二、主要性能指標(biāo)及分析1.查全率和查準(zhǔn)率(2 )影響

8、查全率、查準(zhǔn)率的相關(guān)因素 文獻(xiàn)庫(kù)編制質(zhì)量文獻(xiàn)收集是否齊全,索引體系是否完善,檢索途徑的多少, 都會(huì)影響到査全率。 對(duì)情報(bào)需求的理解要達(dá)到較高的查全率R和查準(zhǔn)率P,應(yīng)較好地理解情報(bào)需 求,制定好檢索策略。第十一章信息檢索系統(tǒng)評(píng)價(jià)112評(píng)價(jià)指標(biāo)主要性能指標(biāo)及分析(2) 影響查全率、查準(zhǔn)率的相關(guān)因素 檢索語(yǔ)言的一致性檢索的實(shí)質(zhì)就是提問(wèn)標(biāo)識(shí)與文獻(xiàn)標(biāo)識(shí)的異同比較。為此,需要不同人員表達(dá)文獻(xiàn)主題的語(yǔ)言一致,更需要標(biāo)識(shí)提問(wèn)與 標(biāo)識(shí)文獻(xiàn)的語(yǔ)言一致。即,標(biāo)引語(yǔ)言和檢索語(yǔ)言的一致性,對(duì)查全和 查準(zhǔn)起著支配祚用。 標(biāo)引的網(wǎng)羅性對(duì)文獻(xiàn)主題分析得越透徹,抽出的檢索詞越多,檢索時(shí)可檢岀的相 關(guān)文獻(xiàn)就越多,即查全率越高。但

9、檢出的文獻(xiàn)并非全部適用,因而查 準(zhǔn)率降低。反之,如果標(biāo)引時(shí)只標(biāo)出中心主題,檢出的文獻(xiàn)必然比較適用,即 查準(zhǔn)率較高。但漏檢會(huì)增多,從而降低查全率。11.2評(píng)價(jià)指標(biāo)1、主要性能指標(biāo)及分析(2 )影響查全率、查準(zhǔn)率的相關(guān)因素 檢索詞的專指性檢索詞選得詞意越狹窄、越具體、越專深,檢出的文獻(xiàn)就會(huì)越對(duì)口,查準(zhǔn)率就越高。但命中文獻(xiàn)就越少,查全率就會(huì)降低。相反,如果檢索詞定得較籠統(tǒng)、較寬泛,檢出的文獻(xiàn)就會(huì)增多,査 全率會(huì)提高。但不相關(guān)的文獻(xiàn)也會(huì)增多,查準(zhǔn)率會(huì)降低。 檢索策略和提問(wèn)構(gòu)造對(duì)檢索詞的選取,需恰當(dāng)?shù)卮_定網(wǎng)羅度和專指度。當(dāng)釆用布爾組配時(shí),若使用AND較多,即限制嚴(yán),則R下降,而P 上升;反乙 若使用OR

10、較多,則R上升,而P下降。第十一章信息檢索系統(tǒng)評(píng)價(jià)11-2評(píng)價(jià)指標(biāo)二、主要性能指標(biāo)及分析(2 )影響查全率、查準(zhǔn)率的相關(guān)因素檢索軟件的功能檢索軟件功能是否完善,結(jié)構(gòu)是否合理,影響到是否會(huì)漏檢 和誤施。檢索者的熟練程度檢索人員的專業(yè)知識(shí)水平、使用系統(tǒng)的熟練程度,對(duì)R和P影 響很大。往往是系統(tǒng)一方的檢索者自擬定檢索式時(shí)査準(zhǔn)率高, 而檢索用戶編制檢索式時(shí),因不熟悉系統(tǒng)和不善于使用系統(tǒng), 就容易造成誤檢、漏檢。第十一章信息檢索系統(tǒng)評(píng)價(jià)112評(píng)價(jià)指標(biāo)1主要性能指標(biāo)及分析1. 查全率和查準(zhǔn)率(3) 對(duì)查全率和查準(zhǔn)率的要求作為一個(gè)檢索系統(tǒng),應(yīng)同時(shí)具備較強(qiáng)的查全能力和査準(zhǔn)能力。但并不是每個(gè)用戶在任何時(shí)候都需要

11、高查全率和高查準(zhǔn)率,不 同用戶有不同要求。通常,根據(jù)不同的情報(bào)需求,可分為四種要求:a. 要求查全率R= 1如申請(qǐng)專利、發(fā)明或評(píng)定某項(xiàng)成果,需要對(duì)世界范圍的有關(guān) 情報(bào)作全面了解,才能作出客觀的評(píng)價(jià)。此時(shí)往往要求R=1 的檢索。第十一章信息檢索系統(tǒng)評(píng)價(jià)11.2評(píng)價(jià)指標(biāo)主要性能指標(biāo)及分析(3)對(duì)查全率和查準(zhǔn)率的要求b. 要求較高查全率例如編寫(xiě)教材、綜述某學(xué)科或技術(shù)領(lǐng)域的發(fā)展,往往需要較 全面地獲得有關(guān)文獻(xiàn)或情報(bào)。此時(shí)對(duì)查全率有較高要求,但不 一定要求R = 1。c. 要求較高查準(zhǔn)率例如要了解某種具體產(chǎn)品的有關(guān)信息,解決某一具體問(wèn)題或 查新等,往往只需了解某一方面或某一時(shí)期的有關(guān)情報(bào)。此時(shí) 要求查準(zhǔn)

12、率較高。1第十一章信息檢索系統(tǒng)評(píng)價(jià)11-2評(píng)價(jià)指標(biāo)二、主要性能指標(biāo)及分析(3)對(duì)查全率和查準(zhǔn)率的要求d. 對(duì)查全率.查準(zhǔn)率無(wú)具體要求有些情報(bào)需求,用戶本身不能作出確切表達(dá)。因此,用戶對(duì) 查全率和査準(zhǔn)率也無(wú)法提出具體要求。從上面的討論可以看出,在分析和評(píng)價(jià)某一檢索的檢索質(zhì)量 時(shí),不能千篇一律地追求查全率和查準(zhǔn)率,而應(yīng)具體問(wèn)題具體 分析。衛(wèi)、主要性能指標(biāo)及分析2. 響應(yīng)時(shí)間(response time)對(duì)任何計(jì)算機(jī)應(yīng)用系統(tǒng),響應(yīng)時(shí)間都是一個(gè)重要指標(biāo)。信息檢索的響應(yīng)時(shí)間可分為兩種情形:(1) 委托檢索,表示從用戶送交提問(wèn)到收到檢索結(jié)果所花的時(shí)間;(2) 非委托檢索,表示用戶實(shí)際的檢索時(shí)間。計(jì)算響應(yīng)時(shí)

13、間一般都是針對(duì)某一個(gè)提問(wèn)而言,不同的提問(wèn)對(duì)應(yīng)的響應(yīng) 時(shí)間不同。(因提問(wèn)式長(zhǎng)短.復(fù)雜程度而不同)有時(shí)給出平均響應(yīng)時(shí)間廠。瞰示對(duì)第冷提問(wèn)的響應(yīng)時(shí)間,妙提問(wèn)個(gè)數(shù)第十一章信息檢索系統(tǒng)評(píng)價(jià)11-2評(píng)價(jià)指標(biāo)問(wèn)題:檢索響應(yīng)時(shí)間與哪些因素有關(guān)?第十一章信息檢索系統(tǒng)評(píng)價(jià)11-2評(píng)價(jià)指標(biāo)二、主要性能指標(biāo)及分析2.響應(yīng)時(shí)間通過(guò)對(duì)檢索響應(yīng)時(shí)間的分析,我們可歸納出影響該指標(biāo)的 因素:文獻(xiàn)庫(kù)規(guī)模規(guī)模越大,檢索時(shí)間越長(zhǎng),響應(yīng)時(shí)間值也就越大。機(jī)器速度主機(jī)運(yùn)行速度越快,響應(yīng)時(shí)間越短。檢索軟件檢索軟件是關(guān)鍵,其性能越好,檢索時(shí)間就越短。第十一章信息檢索系統(tǒng)評(píng)價(jià)11-2評(píng)價(jià)指標(biāo)二、主要性能指標(biāo)及分析2.響應(yīng)時(shí)間存儲(chǔ)設(shè)備類型和數(shù)據(jù)的

14、存貯結(jié)構(gòu)存儲(chǔ)設(shè)備的訪問(wèn)速度越快,數(shù)據(jù)的存貯結(jié)構(gòu)(外存貯 )越合理,檢索越容易,響應(yīng)時(shí)間也就越短。提問(wèn)組配形式檢索式的構(gòu)造需要有一定的專業(yè)技能和檢索經(jīng)驗(yàn),是一個(gè)不斷修改和完善的過(guò)程。信息中心與檢索者的距離 通信傳輸時(shí)間與距離有關(guān)。第十一章信息檢索系統(tǒng)評(píng)價(jià)11-2評(píng)價(jià)指標(biāo)二、主要性能指標(biāo)及分析3. 存貯空間開(kāi)銷包括系統(tǒng)所占用的內(nèi)存空間和外存空間。對(duì)內(nèi)存空間,當(dāng)檢索系統(tǒng)釆用大、中型計(jì)算機(jī)時(shí),一般不必考 慮;而當(dāng)系統(tǒng)釆用小型、微型機(jī)時(shí),因內(nèi)存空間有限,就需合 理分配。對(duì)外存空間,不同的文檔結(jié)構(gòu)所需存儲(chǔ)空間差別很大。例如, 順排文檔檢索和倒排文檔檢索所需空間不同;而對(duì)倒排檢索,系統(tǒng)僅提供布爾檢索功能與提供正文檢索功能相比,所需的空間也大不一樣。第十一章信息檢索系統(tǒng)評(píng)價(jià)11

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論