3.2.2搜索引擎的發(fā)展與分類_第1頁
3.2.2搜索引擎的發(fā)展與分類_第2頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、垂直搜索引擎 垂直搜索引擎是針對某一個行業(yè)的專業(yè)搜索引擎, 是搜索引擎的 細(xì)分和延伸,是對網(wǎng)頁庫中的某類專門的信息進(jìn)行一次整合, 定向分 字段抽取出需要的數(shù)據(jù)進(jìn)行處理后再以某種形式返回給用戶。 垂直搜 索是相對通用搜索引擎的信息量大、 查詢不準(zhǔn)確、深度不夠等提出來 的新的搜索引擎服務(wù)模式,通過針對某一特定領(lǐng)域、某一特定人群或 某一特定需求提供的有一定價(jià)值的信息和相關(guān)服務(wù)。 其特點(diǎn)就是“專、 精、 深”,且具有行業(yè)色彩,相比較通用搜索引擎的海量信息無序化, 垂直搜索引擎則顯得更加專注、具體和深入。 概述 垂直搜索引擎是應(yīng)用于某一個行業(yè)、 專業(yè)的搜索引擎,是搜索引 擎的延伸和應(yīng)用細(xì)分化。 垂直搜索

2、引擎為用戶提供的并不是上百甚至 上千萬相關(guān)網(wǎng)頁,而是范圍極為縮小、極具針對性的具體信息。因此, 特定行業(yè)的用戶更加青睞垂直搜索引擎。 前景 搜索引擎的出現(xiàn),整合了眾多網(wǎng)站信息,恰恰起到了信息導(dǎo)航的 作用。通用搜索引擎就如同互聯(lián)網(wǎng)第一次出現(xiàn)的門戶網(wǎng)站一樣, 大量 的信息整合導(dǎo)航,極快的查詢,將所有網(wǎng)站上的信息整理在一個平臺 上供網(wǎng)民使用,于是信息的價(jià)值第一次普遍的被眾多商家認(rèn)可, 迅速 成為互聯(lián)網(wǎng)中最有價(jià)值的領(lǐng)域?;ヂ?lián)網(wǎng)的低谷由此演變?yōu)榈诙胃叻濉?大家熟知的搜索引擎 GoogleGoogle、百度、雅虎等是通用搜索引擎現(xiàn)如今 的杰出代表,他們?yōu)榛ヂ?lián)網(wǎng)的發(fā)展做出了重要的貢獻(xiàn)。然而,搜索引 擎行業(yè)

3、也不是一家公司就可以獨(dú)撐天下的,從百度的上市、 yahooyahoo 中 國的并購一系列動作表明, 如今的搜索引擎大戰(zhàn)如同門戶網(wǎng)站初期的 競爭一樣激烈。相信,通用搜索引擎在經(jīng)歷過一段時(shí)間的角逐后,也 將會繼續(xù)維持幾大服務(wù)商各自分控一部分市場的局面。 垂直搜索引擎概念的提出,就是針對性的為某一特定領(lǐng)域、 某一 特定人群或某一特定需求提供的有一定價(jià)值的信息和相關(guān)服務(wù)。 可以 簡單的說成是搜索引擎領(lǐng)域的行業(yè)化分工。 眾多專業(yè)性網(wǎng)站、行業(yè)網(wǎng) 站獨(dú)立服務(wù)于互聯(lián)網(wǎng)的成功,恰恰證明了互聯(lián)網(wǎng)的格局應(yīng)該是多方面 的。通用搜索引擎的性質(zhì),決定了其不能滿足特殊領(lǐng)域、特殊人群的 精準(zhǔn)化信息需求服務(wù)。市場需求多元化決定

4、了搜索引擎的服務(wù)模式必 將出現(xiàn)細(xì)分,針對不同行業(yè)提供更加精確的行業(yè)服務(wù)模式。 可以說通 用搜索引擎的發(fā)展為垂直搜索引擎的出現(xiàn)提供了良好的市場空間, 勢 必將出現(xiàn)垂直搜索引擎在互聯(lián)網(wǎng)中占據(jù)部分市場的趨勢, 也是搜索引 擎行業(yè)細(xì)分化的必然趨勢。 異同點(diǎn) 垂直搜索不只是類 googlegoogle 的行業(yè)通用搜索。以房產(chǎn)行業(yè)為例, 如果我們按照 googlegoogle 抓取網(wǎng)頁的方式,來建造一個房產(chǎn)行業(yè) google google 的做法,是行不通的。技術(shù)壁壘不用解釋,就算我們借助 nutch,lucene nutch,lucene 等搜索技術(shù)來做,我們也無法提供差異化的服務(wù) ,而沒有差異化的產(chǎn)

5、品在互聯(lián)網(wǎng)贏家通吃的規(guī)則下是無法生存的,就是不要簡單地模仿, 而要想辦法形成互補(bǔ)。 垂直搜索和 google,baidugoogle,baidu 等通用搜索從定位,內(nèi)容,用戶,市 場策略等都是不同的。所以垂直搜索不只是簡單的行業(yè) googlegoogle。用 戶使用google,baidugoogle,baidu等通用搜索引擎的方式是通過關(guān)鍵字的方式實(shí) 現(xiàn)的,是語義上的搜索,返回的結(jié)果傾向于知識成果,比如文章,論 文,新聞等;垂直搜索也是提供關(guān)鍵字來進(jìn)行搜索的, 但被放到了一 個行業(yè)知識的上下文中,返回的結(jié)果更傾向于信息,消息,條目等。 對買房的人講,他希望找的房子供求信息和文章,新聞等不同。

6、這個 特性是他們各自的的技術(shù)特點(diǎn)決定的。打個比方,如果 googlegoogle 搜索 引擎是一個正金字塔型,那么垂直搜索引擎就是個倒金字塔型, 兩者 是互補(bǔ)的。 特點(diǎn) 垂直搜索的特點(diǎn): 1 1、 搜索是一個產(chǎn)業(yè)商業(yè)聯(lián)盟的平臺,一個集成產(chǎn)業(yè)鏈的上下游 公司的搜索門戶。 2 2、 垂直搜索的表現(xiàn)方式和 google,baidugoogle,baidu 的表現(xiàn)方式不同,結(jié)構(gòu) 化的搜索和非結(jié)構(gòu)化搜索并用。 3 3、 從廣告模式上提供了除 google adsensegoogle adsense 和百度競價(jià)排名廣 告之外的另一種可能 來源內(nèi)容 1 1、 門戶網(wǎng)站自身的資源。 2 2、 以開放接口方式讓

7、行業(yè)用戶提供的資源。 3 3、 普通用戶發(fā)布的資源。 4 4、抓取行業(yè)用戶的資源。 數(shù)據(jù) 1 1、 垂直搜索引擎抓取的數(shù)據(jù)來源于垂直搜索引擎關(guān)注的行業(yè)站 點(diǎn)。 2 2、 垂直搜索引擎抓取的數(shù)據(jù)傾向于結(jié)構(gòu)化數(shù)據(jù)和元數(shù)據(jù)。 3 3、 垂直搜索引擎的搜索行為是基于結(jié)構(gòu)化數(shù)據(jù)和元數(shù)據(jù)的結(jié)構(gòu) 化搜索。 門檻 進(jìn)入垂直搜索的門檻在哪里? 在互聯(lián)網(wǎng)上說門檻,就是比資源。垂直搜索也是這樣,能否提供 全面權(quán)威的行業(yè)信息,能否擁有行業(yè)資源是垂直搜索引擎發(fā)展的門檻。 換句話說,垂直門戶是垂直搜索血統(tǒng)最近的父親。 作為房產(chǎn)行業(yè)的房 產(chǎn)網(wǎng)就是一個垂直門戶,在房產(chǎn)領(lǐng)域沒有誰比我們更清楚什么是垂直 搜索了。 垂直搜索的難點(diǎn)

8、不是技術(shù),而是用戶參與門戶網(wǎng)站行為的創(chuàng)新和 垂直門戶網(wǎng)站對產(chǎn)業(yè)上下游信息資源的整合。 準(zhǔn)則 1 1、選擇一個好的垂直搜索方向。俗話說男怕選錯行,這一點(diǎn)對 于搜索引擎來說也是一樣的,除了選擇的這個行業(yè)有垂直搜索的大量 需求外,這個行業(yè)的數(shù)據(jù)屬性最好不要和通用搜索的的抓取方向重疊。 熱門的垂直搜索行業(yè)有:購物,旅游,汽車,工作,房產(chǎn),交友等行 業(yè)。搜索引擎對動態(tài) urlurl 數(shù)據(jù)不敏感也是眾所周知的, 這些可以作為 垂直搜索引擎的切入點(diǎn)。 2 2、 評價(jià)所選垂直搜索行業(yè)的網(wǎng)站、垂直搜索內(nèi)容、行業(yè)構(gòu)成等 情況:我們都知道垂直搜索引擎并不提供內(nèi)容來源, 它的數(shù)據(jù)依賴爬 蟲搜集,并做了深度加工而來的。

9、因此考慮垂直搜索引擎的所處的大 環(huán)境和定位至關(guān)重要。 3 3、 深入分析垂直搜索引擎的索引數(shù)據(jù)特點(diǎn):垂直搜索引擎的索 引數(shù)據(jù)過于結(jié)構(gòu)化,那么進(jìn)入的門檻比較低,行業(yè)競爭會形成一窩蜂 的局面;如果搜索數(shù)據(jù)特點(diǎn)是非結(jié)構(gòu)化的,抓取,分析這樣的數(shù)據(jù)很 困難,進(jìn)入壁壘太高,很可能出師未捷身先死。 4 4、 垂直搜索引擎的索引數(shù)據(jù)傾向于結(jié)構(gòu)化數(shù)據(jù)和元數(shù)據(jù),這個 特點(diǎn)是區(qū)別于通用搜索引擎的,這是垂直搜索引擎的立足點(diǎn)。而垂直 搜索引擎是根植于某一個行業(yè),因此行業(yè)知識,行業(yè)專家這些也是通 用搜索引擎不具備的。也就是說進(jìn)入垂直搜索是有門檻的。 5 5、 垂直搜索引擎的搜索結(jié)果要覆蓋整個行業(yè),搜索相關(guān)性要高 于通用搜

10、索引擎,貼近用戶搜索意圖,搜索結(jié)果要及時(shí)。 6 6、 垂直搜索引擎的搜索數(shù)據(jù)由于帶有結(jié)構(gòu)化的天性,相對于通 用搜索引擎的全文索引而言,更顯的少而精。因此,設(shè)計(jì)的時(shí)候要提 供收集用戶數(shù)據(jù)的接口,同時(shí)提供 tag,tag,積分等機(jī)制,使搜索結(jié)果更 加“垂直”。 7 7、 垂直搜索引擎的目標(biāo)是幫助用戶解決問題,而不只是像通用 搜索引擎一樣發(fā)現(xiàn)信息:這一點(diǎn)是垂直搜索引擎的終極目標(biāo)。 在做垂 直搜索引擎的時(shí)候你需要考慮:什么問題是這個行業(yè)內(nèi)的特殊性問題, 什么問題是一般性問題。kesokeso 多次提到 googlegoogle 的目標(biāo)是讓用戶盡快 離開googlegoogle,而垂直搜索引擎應(yīng)該粘住用

11、戶。一般來說,使用垂直 搜索引擎的用戶都是和用戶的利益需求密切相關(guān)的。 所謂利益需求是 我自己獨(dú)創(chuàng)的,大意是和用戶工作密切相關(guān),生活中必不可少的需求, 而求有持續(xù)性。比如:學(xué)生找論文,業(yè)主找裝修信息等等這樣的需求。 因此粘住用戶,讓用戶有反饋的途徑是一個關(guān)鍵部分。 &垂直搜索引擎的社區(qū)化特征:這一條和第 7 7 條是相關(guān)的。俗 話說物以類聚,人以群分,垂直搜索引擎定位于一個行業(yè),服務(wù)于一 群特定需求的人群,這個特點(diǎn)決定了垂直搜索的社區(qū)化行為。人們利 用垂直搜索引擎解決問題,分享回饋。做網(wǎng)站都講求社區(qū)化,所以垂 直搜索引擎本質(zhì)上還是:對垂直門戶信息提供方式的一次簡化性的整 合。 特點(diǎn) 1

12、.1. 中文直達(dá)。直達(dá)各大知名網(wǎng)站、論壇、聯(lián)盟站點(diǎn),數(shù)據(jù)實(shí)時(shí)更 新,中文直達(dá)服務(wù)讓用戶搜索一步到位。 2.2. 關(guān)鍵詞直達(dá)網(wǎng)站。商家可以提交自己的關(guān)鍵詞,讓客戶輸入關(guān) 鍵詞直達(dá)您的網(wǎng)站,增加無限商機(jī)。 33站內(nèi)直達(dá)。直達(dá)網(wǎng)站內(nèi)各頻道、欄目,站內(nèi)直達(dá)滿足用戶在網(wǎng) 站的全方位服務(wù)。 1.1. 功能強(qiáng)大。提供強(qiáng)大的搜索功能,多款引擎隨時(shí)切換,讓用戶 操作變得更加輕松便捷。 2.2. 搜索發(fā)現(xiàn)。用戶進(jìn)入搜索首頁,瀏覽器會提示用戶發(fā)現(xiàn)了新的 搜索引擎,并可將其設(shè)為默認(rèn) 3.3. 內(nèi)容全面。聚合常用搜索及垂直搜索,聚合各大熱門搜索引擎 多項(xiàng)搜索多重性能。 4.4. 完美兼容。界面設(shè)計(jì)符合標(biāo)準(zhǔn),在不同內(nèi)核的

13、瀏覽器上均可正 常使用。 5.5. 安全第一。收錄大量網(wǎng)上銀行、證券、股票、咨詢、新聞等網(wǎng) 址,不再擔(dān)心進(jìn)入釣魚網(wǎng)站. .所有直達(dá)關(guān)鍵詞網(wǎng)站,均嚴(yán)格經(jīng)過叮鈴 鈴各項(xiàng)指標(biāo)的檢驗(yàn),有力的排斥了虛假廣告、假冒產(chǎn)品、不良信息的 商家網(wǎng)站。 共享 結(jié)合網(wǎng)站,按您的需要生成不同樣式、不同功能的搜索框代碼 , 輕松將搜索服務(wù)與網(wǎng)站結(jié)合。 精準(zhǔn) 垂直搜索引擎一般都提供了比較精準(zhǔn)或者細(xì)化的搜索服務(wù), 因此 使用垂直搜索引擎有時(shí)候能取得更精準(zhǔn)的搜索結(jié)果。 附:垂直搜索引 擎索引,發(fā)布國內(nèi)外高質(zhì)量的垂直搜索引擎。 抓取 也就是蜘蛛程序,負(fù)責(zé)從信息源抓取數(shù)據(jù),蜘蛛程序通常是基于 預(yù)先構(gòu)造的模板工作的,無模板的蜘蛛程序

14、只能處理結(jié)構(gòu)相對簡單的 信息,抓取系統(tǒng)涉及的關(guān)鍵技術(shù)點(diǎn)有爬行路徑分析、增量抓取與全抓 取、信息構(gòu)造完整性、信息唯一性識別、多網(wǎng)頁信息整合、自動標(biāo)引 (此功能也可以單獨(dú)提出)等; 索引 把抓來的信息建立類似書目的數(shù)據(jù)文件,以便于實(shí)現(xiàn)高速檢索。 索引系統(tǒng)涉及的關(guān)鍵技術(shù)點(diǎn)有分詞技術(shù)、 預(yù)評分和后評分、增量索引 與全索引、排序技術(shù)、熱點(diǎn)詞高速緩存、標(biāo)準(zhǔn)檢索語句解析等; 搜索 就是提供搜索功能的網(wǎng)站,網(wǎng)站的具體表現(xiàn)形式大不相同,但是 都提供全文搜索功能,除了搜索功能外,還提供與業(yè)務(wù)相關(guān)的其他功 能,譬如按地域?qū)Ш綑z索、會員注冊、訂閱等。很多人把 GOOGLEGOOGLE 百度稱之為站外搜索,而把其他基于

15、數(shù)據(jù)庫的搜索稱之為站內(nèi)搜索, 其實(shí)所有的搜索引擎提供的都是站內(nèi)搜索, 數(shù)據(jù)都是預(yù)先存儲在本地 的。 案例 垂直搜索 這類搜索引擎很多,這里以物流全搜索為例。 簡介:擬建全球最大的中文物流信息搜索查詢平臺, 為全球物流 行業(yè)提供物流信息發(fā)布、搜索查詢服務(wù)!物流全搜索是在物流業(yè)調(diào) 整和振興規(guī)劃大趨勢下,物流行業(yè)蓬勃發(fā)展的環(huán)境中成長起來的物 流行業(yè)垂直搜索引擎。搜索平臺以專業(yè)、全面、簡易、自助為建站標(biāo) 準(zhǔn),以“垂直搜索+ +行業(yè)門戶”相結(jié)合的建站理念,堅(jiān)持以成效第一、 服務(wù)第一的客戶服務(wù)理念,為所有需要物流信息和提供物流的客戶服 務(wù)。 物流全搜索始終致力于全球最大的中文物流信息搜索查詢平臺 建設(shè),樹

16、立全球中文物流搜索第一品牌,網(wǎng)站建立以來取得良好的社 會效益,為廣大物流企業(yè)、客戶提供了極大的方便。提供全新的搜索 體驗(yàn),只需輸入簡單關(guān)鍵詞或簡單的選擇就可在指定的分類中搜索到 你需要的信息, 使用極其方便,滿足行業(yè)所有信息查詢需求。 簡評:以行業(yè)為目標(biāo),專注于物流,專業(yè)性強(qiáng);以簡易物流搜索 為核心,秉承當(dāng)前百度等通用搜索引擎的大氣和完整實(shí)用的平臺構(gòu)架, 科技含量高;人性化搜索體驗(yàn),友好性強(qiáng)。 購物垂直 購物搜索引擎可以理解為搜索引擎的一種細(xì)分,即在網(wǎng)上購物領(lǐng) 域的專業(yè)搜索引擎。 常規(guī)意義上基于網(wǎng)頁搜索的搜索引擎在搜索結(jié)果中的內(nèi)容是根 據(jù)相關(guān)性排列的來源于其他網(wǎng)站的內(nèi)容索引,與此類似,購物搜索

17、引 擎的檢索結(jié)果也來自于被收錄的網(wǎng)上購物網(wǎng)站, 這樣當(dāng)用戶檢索某個 商品時(shí),所有銷售該商品的網(wǎng)站上的產(chǎn)品記錄都會被檢索出來, 用戶 可以根據(jù)產(chǎn)品價(jià)格、 對網(wǎng)站的信任和偏好等因素進(jìn)入所選擇的網(wǎng)上購 物網(wǎng)站購買產(chǎn)品。 購物搜索引擎與一般的網(wǎng)頁搜索引擎相比的主要區(qū)別在于, 除了 搜索產(chǎn)品、 了解商品說明等基本信息之外, 通常還可以進(jìn)行商品價(jià)格 比較、并且可以對產(chǎn)品和在線商店進(jìn)行評級, 這些評比結(jié)果指標(biāo)對于 用戶購買決策有一定的影響,尤其對于知名度不是很高的網(wǎng)上零售商, 通過購物搜索引擎,不僅增加了被用戶發(fā)現(xiàn)的機(jī)會,如果在評比上有 較好的排名,也有助于增加顧客的信任。以 BizRateBizRate 為例,用戶不僅 可以用多種方式進(jìn)行檢索,如產(chǎn)品名稱、品牌名、網(wǎng)站名稱等,用戶 還可以對產(chǎn)品進(jìn)行評比,可以發(fā)表自己的意見,這些信息也可以被別 的用戶參考。因此當(dāng)用戶使用購物搜索引擎檢索商品時(shí),可以獲得比 較豐富的信息,對制定商品購買決策有較大的參考價(jià)值。 這也從另一 個角度說明,網(wǎng)上商店利用購物引擎進(jìn)行推廣可以增加被用戶發(fā)現(xiàn)的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論