幾種常用的Internet個性化信息檢索技術(shù)的探討(全文)_第1頁
幾種常用的Internet個性化信息檢索技術(shù)的探討(全文)_第2頁
幾種常用的Internet個性化信息檢索技術(shù)的探討(全文)_第3頁
幾種常用的Internet個性化信息檢索技術(shù)的探討(全文)_第4頁
幾種常用的Internet個性化信息檢索技術(shù)的探討(全文)_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

精品文檔-下載后可編輯幾種常用的Internet個性化信息檢索技術(shù)的探討(全文)網(wǎng)上信息極度膨脹導(dǎo)致查找信息猶如大海撈針,雖然Google等優(yōu)秀搜索引擎提供了大量的信息資源,但仍需根據(jù)檢索到的地址信息,按照頁面屏幕的提示向下追蹤。特別是對于那些對專業(yè)信息有迫切需求的專業(yè)人士來說,難以迅速、準(zhǔn)確地獲得有價(jià)值的網(wǎng)上信息資源因此用戶迫切希望找到一種能夠在信息海洋中自動獲取實(shí)用、準(zhǔn)確、精煉的信息的工具。

一、智能Agent檢索技術(shù)

智能又稱智能體,它是在用戶沒有明確具體要求的情況下,根據(jù)用戶需要,代替用戶進(jìn)行各種復(fù)雜的工作,如信息查詢、篩選及管理,并能推測用戶的意圖,自主制定、調(diào)整和執(zhí)行工作計(jì)劃。它使用自動獲得的領(lǐng)域模型(如web知識、信息處理、與用戶興趣相關(guān)的信息資源、領(lǐng)域組織結(jié)構(gòu))、用戶模型(如用戶背景、興趣、行為、風(fēng)格)知識進(jìn)行信息搜集、索引、過濾(包括興趣過濾和不良信息過濾),并自動地將用戶感興趣的、對用戶有用的信息提交給用戶。智能具有了不斷學(xué)習(xí)、適應(yīng)信息和用戶興趣動態(tài)變化的能力,從而提供個性化的服務(wù)。

1、智能Agent意義

從用戶的角度來看,采用智能技術(shù)的應(yīng)用服務(wù)系統(tǒng)在不間斷地為他們工作,用戶只在必要時才需要參與。

從應(yīng)用的角度來看,智能就是能自動執(zhí)行用戶委托的任務(wù)的計(jì)算實(shí)體,它有著極其廣泛的應(yīng)用。

從技術(shù)的角度來看,智能是以各種技術(shù)為基礎(chǔ),集合了許多實(shí)用的應(yīng)用特性,從而能自動執(zhí)行用戶委托的任務(wù)。

2、智能有兩個主要技術(shù)特征:智能性(Intelligence)和能力(Agency).

智能性指應(yīng)用系統(tǒng)使用推理、學(xué)習(xí)和其他技術(shù)來分析解釋它已接觸過的或剛提交給它的各種信息和知識的能力。能力指一個感知其環(huán)境并相應(yīng)動作的能力。

3.智能包括四方面的關(guān)鍵技術(shù):機(jī)器技術(shù)(Machinery)、內(nèi)容技術(shù)(Content)、訪問技術(shù)(Access)、安全技術(shù)(Security)。

機(jī)器技術(shù):機(jī)器是指各種在人工智能領(lǐng)域中開發(fā)的、支持各種程度智能的引擎。這些引擎包括有:各種形式的推理引擎、學(xué)習(xí)引擎、用戶創(chuàng)建修改規(guī)則和知識的工具、驗(yàn)證規(guī)則集的工具和用于開發(fā)之間、和用戶之間進(jìn)行協(xié)商和協(xié)作所需策略的工具。機(jī)器技術(shù)中的核心是推理機(jī)和學(xué)習(xí)機(jī),它們提供了智能所需的推理能力和學(xué)習(xí)能力。

內(nèi)容技術(shù):指機(jī)器用于推理和學(xué)習(xí)的數(shù)據(jù),但它不一定就是知識,它主要包括屬于結(jié)構(gòu)化知識的規(guī)則、語法,大量非結(jié)構(gòu)化的通用知識和結(jié)構(gòu)化的數(shù)據(jù)。內(nèi)容作為系統(tǒng)能夠內(nèi)核訪問的系統(tǒng)數(shù)據(jù)也存在于核心中,它提供系統(tǒng)工作所需要的各種知識和數(shù)據(jù),同時機(jī)器也可以直接對其進(jìn)行更新。

訪問技術(shù):訪問是指與周圍環(huán)境進(jìn)行交互。與周圍環(huán)境的交互可以分為應(yīng)用之間的交互與和用戶的交互。應(yīng)用之間的交互又可分為對本地環(huán)境與遠(yuǎn)程環(huán)境的訪問。

安全機(jī)制是為了實(shí)現(xiàn)于外界的安全訪問而設(shè)置。外界是的交互對象,應(yīng)包括所需要的原始信息源、用戶、所屬的應(yīng)用系統(tǒng)、其他系統(tǒng)等。

二、智能Agent主要功能

用于信息服務(wù)的智能Agent主要完成以下功能:導(dǎo)航,即告訴用戶所需要的資源在哪里;解惑,即根據(jù)網(wǎng)上資源回答用戶關(guān)于特定主題的問題;過濾,即按照用戶指定的條件,從流向用戶的大量信息中篩選符合條件的信息,并以不同級別(全文、詳細(xì)摘要、簡單摘要、標(biāo)題)呈現(xiàn)給用戶;整理,即為用戶把已經(jīng)下載的資源進(jìn)行分門別類的組織;發(fā)現(xiàn),即從大量的公共原始數(shù)據(jù)中篩選和提煉有價(jià)值的信息,向有關(guān)用戶。這些都是使信息服務(wù)走向個性化主動服務(wù)不可缺少的功能。目前在此方面己經(jīng)有了一些能夠使用的系統(tǒng),但智能化的程度還遠(yuǎn)遠(yuǎn)不夠,且主動有余的過濾不足己經(jīng)造成了一些負(fù)面的影響,有待盡快發(fā)展更先進(jìn)的人工智能技術(shù)予以解決。

三、網(wǎng)絡(luò)信息挖掘(WebMining)技術(shù)

網(wǎng)絡(luò)信息挖掘源于數(shù)據(jù)挖掘。數(shù)據(jù)挖掘就是指從大量數(shù)據(jù)(如數(shù)據(jù)庫)中提取抽象的、潛在的有用信息的過程,它是數(shù)據(jù)庫中知識發(fā)現(xiàn)KDD的核心,為大量數(shù)據(jù)的利用提供了有效的工具。數(shù)據(jù)挖掘的成功使研究人員將數(shù)據(jù)挖掘技術(shù)用于因特網(wǎng),但是由于上的數(shù)據(jù)不同于傳統(tǒng)數(shù)據(jù),故產(chǎn)生了一個新的研究方向―網(wǎng)絡(luò)信息挖掘。

網(wǎng)絡(luò)信息挖掘,又稱為基于Web的數(shù)據(jù)挖掘,是從大量數(shù)據(jù)中抽取處先前未知的、完整的、可信的、新穎的、有效的信息的高級處理過程。它是在已知數(shù)據(jù)樣本的基礎(chǔ)上,通過歸納學(xué)習(xí)、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)分析等方法得到數(shù)據(jù)對象間的內(nèi)在特性,據(jù)此采用信息過濾技術(shù)在網(wǎng)絡(luò)中提取用戶感興趣的信息或者更高層次的知識和規(guī)律來做關(guān)鍵的決策。網(wǎng)絡(luò)信息挖掘其實(shí)就是對文檔的內(nèi)容、要利用資源的使用以及資源之間的關(guān)系進(jìn)行分析。

網(wǎng)絡(luò)信息挖掘分為Web日志挖掘、Web內(nèi)容挖掘、Web結(jié)構(gòu)挖掘。具體而言,Web日志挖掘是通過分析Web服務(wù)器的日志文件,對用戶訪問Web是服務(wù)器方留下的訪問記錄進(jìn)行挖掘,從中可以得出用戶的訪問模式和訪問興趣,丈站點(diǎn)管理員提供各種利于Web站點(diǎn)改進(jìn)或可以帶來經(jīng)濟(jì)效益的信息。在個性讓服務(wù)模型中,可以利用日志挖掘來“監(jiān)視”用戶的訪問習(xí)慣,進(jìn)行個性化分析處理。Web內(nèi)容挖掘包括Web文本挖掘和多媒體信息挖掘:Web文本(包括text、html等)挖掘的目的是對頁面信息進(jìn)行聚類、分類和關(guān)聯(lián)分析,以及利用Web文檔進(jìn)行趨勢預(yù)測、分析等;多媒體信息挖掘是對多媒體文檔(包括圖像、聲音、圖片等媒體類型)的挖掘。Web結(jié)構(gòu)挖掘是對Web頁面超鏈接關(guān)系、文檔內(nèi)部結(jié)構(gòu)、文檔url種的目錄路徑結(jié)構(gòu)的挖掘。

四、信息推送技術(shù)

1、推送方式

頻道式推送:頻道式網(wǎng)絡(luò)播送技術(shù)是目前網(wǎng)上普遍采用的一種推送方式,它將某些網(wǎng)頁定義為瀏覽器中的頻道,用戶可以選擇收看感興趣的、通過網(wǎng)絡(luò)播送的信息。

郵件式推送:用電子郵件方式主動將有關(guān)信息給列表中的用戶。

網(wǎng)頁式推送:在特定網(wǎng)頁上將信息提供給感興趣的用戶。

專用式推送:通過機(jī)密的點(diǎn)對點(diǎn)通信方式,將指定的信息發(fā)送給專門的用戶。

信息推送模式及時性好,應(yīng)用面廣,對用戶沒有技術(shù)上的要求,但信息針對性差,難以滿足用戶的個性化需求。

在推送技術(shù)問世之前,人們往往利用瀏覽器在因特網(wǎng)上搜尋,一方面,面對浩如煙海的信息,很多用戶花費(fèi)相當(dāng)多時間和費(fèi)用也難以“拉取”到自己所需要的信息;另一方面,信息者希望將信息及時、主動地發(fā)送到感興趣的用戶計(jì)算機(jī)中,而不是等著用戶來拉取。

推送技術(shù)使服務(wù)器能夠自動告訴用戶系統(tǒng)中哪些信息是最新更新,并自動搜集用戶可能發(fā)生興趣的信息。通常,在網(wǎng)絡(luò)服務(wù)器上有專門的推送軟件產(chǎn)品可用來制作欲推送出去的信息內(nèi)容,并播送出去。在客戶端則利用安裝在個人電腦中的軟件,來接收從網(wǎng)絡(luò)上傳來的信息,并顯示出來。當(dāng)有新的信息需要提交時,“推送”軟件會以發(fā)送Email、播放一個聲音、在屏幕上顯示一條消息等方式通知用戶。使用Push技術(shù),可以提高用戶獲取信息的及時性和有效性。

2.目前有兩種基本的推送技術(shù):自動推送技術(shù)和事件驅(qū)動技術(shù)。

自動推送即用戶要求發(fā)送方按照預(yù)先約定的時間和定制提交新的信息。具體的實(shí)現(xiàn)步驟是:首先用戶提出他們對某個特定的Web站點(diǎn)、某個專題感興趣,或要求自動更新軟件、數(shù)據(jù);其次,信息發(fā)送方根據(jù)用戶的請求,用推送軟件的應(yīng)用程序到特定或需要的Web站點(diǎn)尋找新的內(nèi)容;如果自最近一次傳送后,又輸入了新的內(nèi)容,該內(nèi)容將被傳送到位于推送應(yīng)用程序“接收器”中的“頻道”內(nèi);最后用戶可以根據(jù)他們的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論