3.2.2搜索引擎的發(fā)展與分類_第1頁(yè)
3.2.2搜索引擎的發(fā)展與分類_第2頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、垂直搜索引擎 垂直搜索引擎是針對(duì)某一個(gè)行業(yè)的專業(yè)搜索引擎, 是搜索引擎的 細(xì)分和延伸,是對(duì)網(wǎng)頁(yè)庫(kù)中的某類專門的信息進(jìn)行一次整合, 定向分 字段抽取出需要的數(shù)據(jù)進(jìn)行處理后再以某種形式返回給用戶。 垂直搜 索是相對(duì)通用搜索引擎的信息量大、 查詢不準(zhǔn)確、深度不夠等提出來 的新的搜索引擎服務(wù)模式,通過針對(duì)某一特定領(lǐng)域、某一特定人群或 某一特定需求提供的有一定價(jià)值的信息和相關(guān)服務(wù)。 其特點(diǎn)就是“專、 精、 深”,且具有行業(yè)色彩,相比較通用搜索引擎的海量信息無序化, 垂直搜索引擎則顯得更加專注、具體和深入。 概述 垂直搜索引擎是應(yīng)用于某一個(gè)行業(yè)、 專業(yè)的搜索引擎,是搜索引 擎的延伸和應(yīng)用細(xì)分化。 垂直搜索

2、引擎為用戶提供的并不是上百甚至 上千萬相關(guān)網(wǎng)頁(yè),而是范圍極為縮小、極具針對(duì)性的具體信息。因此, 特定行業(yè)的用戶更加青睞垂直搜索引擎。 前景 搜索引擎的出現(xiàn),整合了眾多網(wǎng)站信息,恰恰起到了信息導(dǎo)航的 作用。通用搜索引擎就如同互聯(lián)網(wǎng)第一次出現(xiàn)的門戶網(wǎng)站一樣, 大量 的信息整合導(dǎo)航,極快的查詢,將所有網(wǎng)站上的信息整理在一個(gè)平臺(tái) 上供網(wǎng)民使用,于是信息的價(jià)值第一次普遍的被眾多商家認(rèn)可, 迅速 成為互聯(lián)網(wǎng)中最有價(jià)值的領(lǐng)域。互聯(lián)網(wǎng)的低谷由此演變?yōu)榈诙胃叻濉?大家熟知的搜索引擎 GoogleGoogle、百度、雅虎等是通用搜索引擎現(xiàn)如今 的杰出代表,他們?yōu)榛ヂ?lián)網(wǎng)的發(fā)展做出了重要的貢獻(xiàn)。然而,搜索引 擎行業(yè)

3、也不是一家公司就可以獨(dú)撐天下的,從百度的上市、 yahooyahoo 中 國(guó)的并購(gòu)一系列動(dòng)作表明, 如今的搜索引擎大戰(zhàn)如同門戶網(wǎng)站初期的 競(jìng)爭(zhēng)一樣激烈。相信,通用搜索引擎在經(jīng)歷過一段時(shí)間的角逐后,也 將會(huì)繼續(xù)維持幾大服務(wù)商各自分控一部分市場(chǎng)的局面。 垂直搜索引擎概念的提出,就是針對(duì)性的為某一特定領(lǐng)域、 某一 特定人群或某一特定需求提供的有一定價(jià)值的信息和相關(guān)服務(wù)。 可以 簡(jiǎn)單的說成是搜索引擎領(lǐng)域的行業(yè)化分工。 眾多專業(yè)性網(wǎng)站、行業(yè)網(wǎng) 站獨(dú)立服務(wù)于互聯(lián)網(wǎng)的成功,恰恰證明了互聯(lián)網(wǎng)的格局應(yīng)該是多方面 的。通用搜索引擎的性質(zhì),決定了其不能滿足特殊領(lǐng)域、特殊人群的 精準(zhǔn)化信息需求服務(wù)。市場(chǎng)需求多元化決定

4、了搜索引擎的服務(wù)模式必 將出現(xiàn)細(xì)分,針對(duì)不同行業(yè)提供更加精確的行業(yè)服務(wù)模式。 可以說通 用搜索引擎的發(fā)展為垂直搜索引擎的出現(xiàn)提供了良好的市場(chǎng)空間, 勢(shì) 必將出現(xiàn)垂直搜索引擎在互聯(lián)網(wǎng)中占據(jù)部分市場(chǎng)的趨勢(shì), 也是搜索引 擎行業(yè)細(xì)分化的必然趨勢(shì)。 異同點(diǎn) 垂直搜索不只是類 googlegoogle 的行業(yè)通用搜索。以房產(chǎn)行業(yè)為例, 如果我們按照 googlegoogle 抓取網(wǎng)頁(yè)的方式,來建造一個(gè)房產(chǎn)行業(yè) google google 的做法,是行不通的。技術(shù)壁壘不用解釋,就算我們借助 nutch,lucene nutch,lucene 等搜索技術(shù)來做,我們也無法提供差異化的服務(wù) ,而沒有差異化的產(chǎn)

5、品在互聯(lián)網(wǎng)贏家通吃的規(guī)則下是無法生存的,就是不要簡(jiǎn)單地模仿, 而要想辦法形成互補(bǔ)。 垂直搜索和 google,baidugoogle,baidu 等通用搜索從定位,內(nèi)容,用戶,市 場(chǎng)策略等都是不同的。所以垂直搜索不只是簡(jiǎn)單的行業(yè) googlegoogle。用 戶使用google,baidugoogle,baidu等通用搜索引擎的方式是通過關(guān)鍵字的方式實(shí) 現(xiàn)的,是語義上的搜索,返回的結(jié)果傾向于知識(shí)成果,比如文章,論 文,新聞等;垂直搜索也是提供關(guān)鍵字來進(jìn)行搜索的, 但被放到了一 個(gè)行業(yè)知識(shí)的上下文中,返回的結(jié)果更傾向于信息,消息,條目等。 對(duì)買房的人講,他希望找的房子供求信息和文章,新聞等不同。

6、這個(gè) 特性是他們各自的的技術(shù)特點(diǎn)決定的。打個(gè)比方,如果 googlegoogle 搜索 引擎是一個(gè)正金字塔型,那么垂直搜索引擎就是個(gè)倒金字塔型, 兩者 是互補(bǔ)的。 特點(diǎn) 垂直搜索的特點(diǎn): 1 1、 搜索是一個(gè)產(chǎn)業(yè)商業(yè)聯(lián)盟的平臺(tái),一個(gè)集成產(chǎn)業(yè)鏈的上下游 公司的搜索門戶。 2 2、 垂直搜索的表現(xiàn)方式和 google,baidugoogle,baidu 的表現(xiàn)方式不同,結(jié)構(gòu) 化的搜索和非結(jié)構(gòu)化搜索并用。 3 3、 從廣告模式上提供了除 google adsensegoogle adsense 和百度競(jìng)價(jià)排名廣 告之外的另一種可能 來源內(nèi)容 1 1、 門戶網(wǎng)站自身的資源。 2 2、 以開放接口方式讓

7、行業(yè)用戶提供的資源。 3 3、 普通用戶發(fā)布的資源。 4 4、抓取行業(yè)用戶的資源。 數(shù)據(jù) 1 1、 垂直搜索引擎抓取的數(shù)據(jù)來源于垂直搜索引擎關(guān)注的行業(yè)站 點(diǎn)。 2 2、 垂直搜索引擎抓取的數(shù)據(jù)傾向于結(jié)構(gòu)化數(shù)據(jù)和元數(shù)據(jù)。 3 3、 垂直搜索引擎的搜索行為是基于結(jié)構(gòu)化數(shù)據(jù)和元數(shù)據(jù)的結(jié)構(gòu) 化搜索。 門檻 進(jìn)入垂直搜索的門檻在哪里? 在互聯(lián)網(wǎng)上說門檻,就是比資源。垂直搜索也是這樣,能否提供 全面權(quán)威的行業(yè)信息,能否擁有行業(yè)資源是垂直搜索引擎發(fā)展的門檻。 換句話說,垂直門戶是垂直搜索血統(tǒng)最近的父親。 作為房產(chǎn)行業(yè)的房 產(chǎn)網(wǎng)就是一個(gè)垂直門戶,在房產(chǎn)領(lǐng)域沒有誰比我們更清楚什么是垂直 搜索了。 垂直搜索的難點(diǎn)

8、不是技術(shù),而是用戶參與門戶網(wǎng)站行為的創(chuàng)新和 垂直門戶網(wǎng)站對(duì)產(chǎn)業(yè)上下游信息資源的整合。 準(zhǔn)則 1 1、選擇一個(gè)好的垂直搜索方向。俗話說男怕選錯(cuò)行,這一點(diǎn)對(duì) 于搜索引擎來說也是一樣的,除了選擇的這個(gè)行業(yè)有垂直搜索的大量 需求外,這個(gè)行業(yè)的數(shù)據(jù)屬性最好不要和通用搜索的的抓取方向重疊。 熱門的垂直搜索行業(yè)有:購(gòu)物,旅游,汽車,工作,房產(chǎn),交友等行 業(yè)。搜索引擎對(duì)動(dòng)態(tài) urlurl 數(shù)據(jù)不敏感也是眾所周知的, 這些可以作為 垂直搜索引擎的切入點(diǎn)。 2 2、 評(píng)價(jià)所選垂直搜索行業(yè)的網(wǎng)站、垂直搜索內(nèi)容、行業(yè)構(gòu)成等 情況:我們都知道垂直搜索引擎并不提供內(nèi)容來源, 它的數(shù)據(jù)依賴爬 蟲搜集,并做了深度加工而來的。

9、因此考慮垂直搜索引擎的所處的大 環(huán)境和定位至關(guān)重要。 3 3、 深入分析垂直搜索引擎的索引數(shù)據(jù)特點(diǎn):垂直搜索引擎的索 引數(shù)據(jù)過于結(jié)構(gòu)化,那么進(jìn)入的門檻比較低,行業(yè)競(jìng)爭(zhēng)會(huì)形成一窩蜂 的局面;如果搜索數(shù)據(jù)特點(diǎn)是非結(jié)構(gòu)化的,抓取,分析這樣的數(shù)據(jù)很 困難,進(jìn)入壁壘太高,很可能出師未捷身先死。 4 4、 垂直搜索引擎的索引數(shù)據(jù)傾向于結(jié)構(gòu)化數(shù)據(jù)和元數(shù)據(jù),這個(gè) 特點(diǎn)是區(qū)別于通用搜索引擎的,這是垂直搜索引擎的立足點(diǎn)。而垂直 搜索引擎是根植于某一個(gè)行業(yè),因此行業(yè)知識(shí),行業(yè)專家這些也是通 用搜索引擎不具備的。也就是說進(jìn)入垂直搜索是有門檻的。 5 5、 垂直搜索引擎的搜索結(jié)果要覆蓋整個(gè)行業(yè),搜索相關(guān)性要高 于通用搜

10、索引擎,貼近用戶搜索意圖,搜索結(jié)果要及時(shí)。 6 6、 垂直搜索引擎的搜索數(shù)據(jù)由于帶有結(jié)構(gòu)化的天性,相對(duì)于通 用搜索引擎的全文索引而言,更顯的少而精。因此,設(shè)計(jì)的時(shí)候要提 供收集用戶數(shù)據(jù)的接口,同時(shí)提供 tag,tag,積分等機(jī)制,使搜索結(jié)果更 加“垂直”。 7 7、 垂直搜索引擎的目標(biāo)是幫助用戶解決問題,而不只是像通用 搜索引擎一樣發(fā)現(xiàn)信息:這一點(diǎn)是垂直搜索引擎的終極目標(biāo)。 在做垂 直搜索引擎的時(shí)候你需要考慮:什么問題是這個(gè)行業(yè)內(nèi)的特殊性問題, 什么問題是一般性問題。kesokeso 多次提到 googlegoogle 的目標(biāo)是讓用戶盡快 離開googlegoogle,而垂直搜索引擎應(yīng)該粘住用

11、戶。一般來說,使用垂直 搜索引擎的用戶都是和用戶的利益需求密切相關(guān)的。 所謂利益需求是 我自己獨(dú)創(chuàng)的,大意是和用戶工作密切相關(guān),生活中必不可少的需求, 而求有持續(xù)性。比如:學(xué)生找論文,業(yè)主找裝修信息等等這樣的需求。 因此粘住用戶,讓用戶有反饋的途徑是一個(gè)關(guān)鍵部分。 &垂直搜索引擎的社區(qū)化特征:這一條和第 7 7 條是相關(guān)的。俗 話說物以類聚,人以群分,垂直搜索引擎定位于一個(gè)行業(yè),服務(wù)于一 群特定需求的人群,這個(gè)特點(diǎn)決定了垂直搜索的社區(qū)化行為。人們利 用垂直搜索引擎解決問題,分享回饋。做網(wǎng)站都講求社區(qū)化,所以垂 直搜索引擎本質(zhì)上還是:對(duì)垂直門戶信息提供方式的一次簡(jiǎn)化性的整 合。 特點(diǎn) 1

12、.1. 中文直達(dá)。直達(dá)各大知名網(wǎng)站、論壇、聯(lián)盟站點(diǎn),數(shù)據(jù)實(shí)時(shí)更 新,中文直達(dá)服務(wù)讓用戶搜索一步到位。 2.2. 關(guān)鍵詞直達(dá)網(wǎng)站。商家可以提交自己的關(guān)鍵詞,讓客戶輸入關(guān) 鍵詞直達(dá)您的網(wǎng)站,增加無限商機(jī)。 33站內(nèi)直達(dá)。直達(dá)網(wǎng)站內(nèi)各頻道、欄目,站內(nèi)直達(dá)滿足用戶在網(wǎng) 站的全方位服務(wù)。 1.1. 功能強(qiáng)大。提供強(qiáng)大的搜索功能,多款引擎隨時(shí)切換,讓用戶 操作變得更加輕松便捷。 2.2. 搜索發(fā)現(xiàn)。用戶進(jìn)入搜索首頁(yè),瀏覽器會(huì)提示用戶發(fā)現(xiàn)了新的 搜索引擎,并可將其設(shè)為默認(rèn) 3.3. 內(nèi)容全面。聚合常用搜索及垂直搜索,聚合各大熱門搜索引擎 多項(xiàng)搜索多重性能。 4.4. 完美兼容。界面設(shè)計(jì)符合標(biāo)準(zhǔn),在不同內(nèi)核的

13、瀏覽器上均可正 常使用。 5.5. 安全第一。收錄大量網(wǎng)上銀行、證券、股票、咨詢、新聞等網(wǎng) 址,不再擔(dān)心進(jìn)入釣魚網(wǎng)站. .所有直達(dá)關(guān)鍵詞網(wǎng)站,均嚴(yán)格經(jīng)過叮鈴 鈴各項(xiàng)指標(biāo)的檢驗(yàn),有力的排斥了虛假?gòu)V告、假冒產(chǎn)品、不良信息的 商家網(wǎng)站。 共享 結(jié)合網(wǎng)站,按您的需要生成不同樣式、不同功能的搜索框代碼 , 輕松將搜索服務(wù)與網(wǎng)站結(jié)合。 精準(zhǔn) 垂直搜索引擎一般都提供了比較精準(zhǔn)或者細(xì)化的搜索服務(wù), 因此 使用垂直搜索引擎有時(shí)候能取得更精準(zhǔn)的搜索結(jié)果。 附:垂直搜索引 擎索引,發(fā)布國(guó)內(nèi)外高質(zhì)量的垂直搜索引擎。 抓取 也就是蜘蛛程序,負(fù)責(zé)從信息源抓取數(shù)據(jù),蜘蛛程序通常是基于 預(yù)先構(gòu)造的模板工作的,無模板的蜘蛛程序

14、只能處理結(jié)構(gòu)相對(duì)簡(jiǎn)單的 信息,抓取系統(tǒng)涉及的關(guān)鍵技術(shù)點(diǎn)有爬行路徑分析、增量抓取與全抓 取、信息構(gòu)造完整性、信息唯一性識(shí)別、多網(wǎng)頁(yè)信息整合、自動(dòng)標(biāo)引 (此功能也可以單獨(dú)提出)等; 索引 把抓來的信息建立類似書目的數(shù)據(jù)文件,以便于實(shí)現(xiàn)高速檢索。 索引系統(tǒng)涉及的關(guān)鍵技術(shù)點(diǎn)有分詞技術(shù)、 預(yù)評(píng)分和后評(píng)分、增量索引 與全索引、排序技術(shù)、熱點(diǎn)詞高速緩存、標(biāo)準(zhǔn)檢索語句解析等; 搜索 就是提供搜索功能的網(wǎng)站,網(wǎng)站的具體表現(xiàn)形式大不相同,但是 都提供全文搜索功能,除了搜索功能外,還提供與業(yè)務(wù)相關(guān)的其他功 能,譬如按地域?qū)Ш綑z索、會(huì)員注冊(cè)、訂閱等。很多人把 GOOGLEGOOGLE 百度稱之為站外搜索,而把其他基于

15、數(shù)據(jù)庫(kù)的搜索稱之為站內(nèi)搜索, 其實(shí)所有的搜索引擎提供的都是站內(nèi)搜索, 數(shù)據(jù)都是預(yù)先存儲(chǔ)在本地 的。 案例 垂直搜索 這類搜索引擎很多,這里以物流全搜索為例。 簡(jiǎn)介:擬建全球最大的中文物流信息搜索查詢平臺(tái), 為全球物流 行業(yè)提供物流信息發(fā)布、搜索查詢服務(wù)!物流全搜索是在物流業(yè)調(diào) 整和振興規(guī)劃大趨勢(shì)下,物流行業(yè)蓬勃發(fā)展的環(huán)境中成長(zhǎng)起來的物 流行業(yè)垂直搜索引擎。搜索平臺(tái)以專業(yè)、全面、簡(jiǎn)易、自助為建站標(biāo) 準(zhǔn),以“垂直搜索+ +行業(yè)門戶”相結(jié)合的建站理念,堅(jiān)持以成效第一、 服務(wù)第一的客戶服務(wù)理念,為所有需要物流信息和提供物流的客戶服 務(wù)。 物流全搜索始終致力于全球最大的中文物流信息搜索查詢平臺(tái) 建設(shè),樹

16、立全球中文物流搜索第一品牌,網(wǎng)站建立以來取得良好的社 會(huì)效益,為廣大物流企業(yè)、客戶提供了極大的方便。提供全新的搜索 體驗(yàn),只需輸入簡(jiǎn)單關(guān)鍵詞或簡(jiǎn)單的選擇就可在指定的分類中搜索到 你需要的信息, 使用極其方便,滿足行業(yè)所有信息查詢需求。 簡(jiǎn)評(píng):以行業(yè)為目標(biāo),專注于物流,專業(yè)性強(qiáng);以簡(jiǎn)易物流搜索 為核心,秉承當(dāng)前百度等通用搜索引擎的大氣和完整實(shí)用的平臺(tái)構(gòu)架, 科技含量高;人性化搜索體驗(yàn),友好性強(qiáng)。 購(gòu)物垂直 購(gòu)物搜索引擎可以理解為搜索引擎的一種細(xì)分,即在網(wǎng)上購(gòu)物領(lǐng) 域的專業(yè)搜索引擎。 常規(guī)意義上基于網(wǎng)頁(yè)搜索的搜索引擎在搜索結(jié)果中的內(nèi)容是根 據(jù)相關(guān)性排列的來源于其他網(wǎng)站的內(nèi)容索引,與此類似,購(gòu)物搜索

17、引 擎的檢索結(jié)果也來自于被收錄的網(wǎng)上購(gòu)物網(wǎng)站, 這樣當(dāng)用戶檢索某個(gè) 商品時(shí),所有銷售該商品的網(wǎng)站上的產(chǎn)品記錄都會(huì)被檢索出來, 用戶 可以根據(jù)產(chǎn)品價(jià)格、 對(duì)網(wǎng)站的信任和偏好等因素進(jìn)入所選擇的網(wǎng)上購(gòu) 物網(wǎng)站購(gòu)買產(chǎn)品。 購(gòu)物搜索引擎與一般的網(wǎng)頁(yè)搜索引擎相比的主要區(qū)別在于, 除了 搜索產(chǎn)品、 了解商品說明等基本信息之外, 通常還可以進(jìn)行商品價(jià)格 比較、并且可以對(duì)產(chǎn)品和在線商店進(jìn)行評(píng)級(jí), 這些評(píng)比結(jié)果指標(biāo)對(duì)于 用戶購(gòu)買決策有一定的影響,尤其對(duì)于知名度不是很高的網(wǎng)上零售商, 通過購(gòu)物搜索引擎,不僅增加了被用戶發(fā)現(xiàn)的機(jī)會(huì),如果在評(píng)比上有 較好的排名,也有助于增加顧客的信任。以 BizRateBizRate 為例,用戶不僅 可以用多種方式進(jìn)行檢索,如產(chǎn)品名稱、品牌名、網(wǎng)站名稱等,用戶 還可以對(duì)產(chǎn)品進(jìn)行評(píng)比,可以發(fā)表自己的意見,這些信息也可以被別 的用戶參考。因此當(dāng)用戶使用購(gòu)物搜索引擎檢索商品時(shí),可以獲得比 較豐富的信息,對(duì)制定商品購(gòu)買決策有較大的參考價(jià)值。 這也從另一 個(gè)角度說明,網(wǎng)上商店利用購(gòu)物引擎進(jìn)行推廣可以增加被用戶發(fā)現(xiàn)的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論