超音速搜索引擎產(chǎn)品手冊(cè)_第1頁(yè)
超音速搜索引擎產(chǎn)品手冊(cè)_第2頁(yè)
超音速搜索引擎產(chǎn)品手冊(cè)_第3頁(yè)
超音速搜索引擎產(chǎn)品手冊(cè)_第4頁(yè)
超音速搜索引擎產(chǎn)品手冊(cè)_第5頁(yè)
已閱讀5頁(yè),還剩12頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、超音速搜索索引擎產(chǎn)品手冊(cè)2009/08/30站內(nèi)檢索的的重要性性站內(nèi)搜索是是提供網(wǎng)網(wǎng)站內(nèi)部部?jī)?nèi)容的的檢索和和搜索功功能。隨隨著網(wǎng)站站內(nèi)容的的增長(zhǎng),站站內(nèi)結(jié)構(gòu)構(gòu)也越來來越復(fù)雜雜,用戶戶很難準(zhǔn)準(zhǔn)確瀏覽覽全部?jī)?nèi)內(nèi)容,查查找所需需信息也也越來越越難。站站內(nèi)檢索索的需求求也逐漸漸顯露出出來。站內(nèi)搜索的的特點(diǎn)站內(nèi)搜索有有幾方面面的特點(diǎn)點(diǎn):增強(qiáng)用戶體體驗(yàn)信息量總在在不斷增增長(zhǎng),而而訪問者者的耐心心卻逐漸漸下降。據(jù)據(jù)統(tǒng)計(jì),每每需要多多點(diǎn)擊一一次鼠標(biāo)標(biāo),就有有三分之之一的用用戶選擇擇放棄。 如果提供站站內(nèi)搜索索,用戶戶僅僅根根據(jù)查詢?cè)冊(cè)~就可可以盡快快找到所所需內(nèi)容容。 通過站內(nèi)搜搜索提供供用戶最最想要的的結(jié)果,

2、成成為提升升用戶體體驗(yàn)的重重要工具具之一。了解訪問者者的意圖圖通過站內(nèi)搜搜索技術(shù)術(shù),除了了能夠滿滿足盡快快提供用用戶所需需內(nèi)容,還還能通過過查詢?nèi)杖罩痉治鑫龀鲇脩魬舻囊鈭D圖和需求求。 客戶的需求求永遠(yuǎn)都都是最重重要的,分分析用戶戶的需求求對(duì)于每每個(gè)網(wǎng)站站改善自自身都是是非常重重要的。 通過分析用用戶需求求,改善善網(wǎng)站結(jié)結(jié)構(gòu),能能夠有效效的提升升網(wǎng)站價(jià)價(jià)值。適應(yīng)網(wǎng)民習(xí)習(xí)慣根據(jù)調(diào)查表表明,668.33的上上網(wǎng)者經(jīng)經(jīng)常使用用搜索引引擎。大大部分人人已經(jīng)習(xí)習(xí)慣通過過檢索來來找到他他們想要要的東西西,而不不是按照照某個(gè)欄欄目一級(jí)級(jí)一級(jí)往往下找。 在網(wǎng)站內(nèi)訪訪問者要要是沒看看見那熟熟悉的按按鈕會(huì)多多少有些

3、些不習(xí)慣慣。在心心理學(xué)角角度講,人人們?nèi)绻麑?duì)某個(gè)個(gè)事物不不習(xí)慣很很容易產(chǎn)產(chǎn)生厭煩煩情緒。方便用戶查查找網(wǎng)站站信息我們經(jīng)常會(huì)會(huì)發(fā)生這這樣的事事情:只只記得某某個(gè)網(wǎng)站站上說了了關(guān)于某某一事件件的新聞聞,但不不知道具具體的鏈鏈接在哪哪里。 另外,要是是隱藏在在目錄很很深的hhtmll文檔可可能自從從網(wǎng)站建建立到整整個(gè)網(wǎng)站站關(guān)閉也也沒有一一個(gè)人看看過。 同時(shí),按照照一個(gè)主主題把所所有相關(guān)關(guān)文檔提提供給訪訪問者,可可以讓訪訪問者更更全面的的了解他他所想要要的東西西,這增增加了網(wǎng)網(wǎng)站信息息間的組組織性和和邏輯性性,方便便了訪問問者的使使用,提提升用戶戶體驗(yàn)度度。提升網(wǎng)站身身份有沒有站內(nèi)內(nèi)檢索其其實(shí)已經(jīng)經(jīng)

4、不只是是用戶體體驗(yàn)度的的問題了了,還是是一個(gè)網(wǎng)網(wǎng)站專業(yè)業(yè)身份的的象征。 瀏覽國(guó)內(nèi)外外知名公公司的網(wǎng)網(wǎng)站,會(huì)會(huì)發(fā)現(xiàn)幾幾乎所有有網(wǎng)站都都在首頁(yè)頁(yè)最明顯顯的區(qū)域域放置了了一個(gè)搜搜索框,這這傳達(dá)的的信息是是:專業(yè)業(yè)的網(wǎng)站站都有站站內(nèi)檢索索。 網(wǎng)民的心態(tài)態(tài)是:我我用不用用,你管管不著,你你要是沒沒有就說說明你不不夠?qū)I(yè)業(yè)。為了了樹立專專業(yè)的形形象,也也需要使使用站內(nèi)內(nèi)檢索。提供編輯使使用網(wǎng)站上一定定規(guī)模后后,內(nèi)部部編輯管管理龐雜雜的數(shù)據(jù)據(jù),迫切切需要站站內(nèi)搜索索來幫出出他們從從容應(yīng)對(duì)對(duì),更好好的編輯輯網(wǎng)站信信息內(nèi)容容,避免免重復(fù)等等。一組數(shù)據(jù)當(dāng)用戶訪問問一個(gè)新新的網(wǎng)站站時(shí),如如果在一一開始不不能很快快地

5、尋找找到他所所想要的的信息,那那么500%的用用戶將會(huì)會(huì)很快離離開網(wǎng)站站。 其中60%將不再再光顧這這個(gè)網(wǎng)站站。 這意味著網(wǎng)網(wǎng)站將因因?yàn)檎緝?nèi)內(nèi)檢索的的缺陷而而徹底流流失300%的潛潛在客戶戶。新聞搜索引引擎與主主流搜索索引擎的的區(qū)別以關(guān)鍵字“上上海世博博會(huì)”為為例GOOGLLE提供供的是世世博會(huì)官官方網(wǎng)站站等最相相關(guān)的資資料信息息,而不不是最新新的新聞聞內(nèi)容。新聞搜索引引擎,提提供給用用戶的是是最新與與“上海海世博會(huì)會(huì)”有關(guān)關(guān)的新聞聞,并且且按照出出處和時(shí)時(shí)間排序序,讓用用戶最直直觀最快快速的了了解事件件情況。搜索結(jié)果,精精確與精精準(zhǔn)以關(guān)鍵字“上上海世博博會(huì)”為為例Googlle精準(zhǔn)出現(xiàn)“上海

6、海世博會(huì)會(huì)官方網(wǎng)網(wǎng)站”,但但隨著時(shí)時(shí)間推移移并不會(huì)會(huì)改變,需需要體現(xiàn)現(xiàn)的是最最精準(zhǔn)的的結(jié)果內(nèi)內(nèi)容。新聞搜索精確確以最新為原原則,始始終出現(xiàn)現(xiàn)最新的的新聞內(nèi)內(nèi)容,每每次搜索索都找到到更新的的新聞內(nèi)內(nèi)容。結(jié)果數(shù)量,巨巨大與無無窮大以關(guān)鍵字“上上”為例例Googlle海量獲得大約11,2990,0000,0000條查詢?cè)兘Y(jié)果,但但實(shí)際上上能查閱閱的只有有不到110000條(Goooglle為所所有查詢?cè)兊慕Y(jié)果果數(shù)都不不會(huì)超過過10000個(gè)),因因?yàn)镚OOOGLLE不區(qū)區(qū)分內(nèi)容容的時(shí)間間,所以以一般用用戶看不不完(也也不需要要)10000條條以上的的內(nèi)容。新聞搜索無窮窮可以獲得全全部結(jié)果果,能查查閱的

7、可可以達(dá)到到無窮多多,因?yàn)闉樾侣剝?nèi)內(nèi)容可以以有時(shí)間間標(biāo)簽,可可能需要要查閱不不同年份份的新聞聞,比如如30年前前的新聞聞內(nèi)容。預(yù)搜索庫(kù),漫漫長(zhǎng)與實(shí)實(shí)時(shí)Googlle漫長(zhǎng)由于包含海海量互聯(lián)聯(lián)網(wǎng)數(shù)據(jù)據(jù),所以以需要大大約1個(gè)月才才能整體體更新一一次數(shù)據(jù)據(jù),每次更更新需要要大量服服務(wù)器同同時(shí)處理理6到8天。新聞搜索實(shí)時(shí)時(shí)在沒有預(yù)處處理的情情況下,第第一次查查詢大約約需要花花費(fèi)1秒左右右時(shí)間,此后查查詢相同同關(guān)鍵字字,只需需要0.01秒秒,在服務(wù)務(wù)器空閑閑時(shí)候進(jìn)進(jìn)行對(duì)高高頻關(guān)鍵鍵字的預(yù)預(yù)處理。報(bào)業(yè)內(nèi)容資資源搜索索面臨的的問題由于報(bào)業(yè)數(shù)數(shù)據(jù)量龐龐大,同同時(shí)多業(yè)業(yè)務(wù)部門門使用各各不相同同的業(yè)務(wù)務(wù)系統(tǒng),形形成

8、了多多數(shù)據(jù)庫(kù)庫(kù),多種種業(yè)務(wù)數(shù)數(shù)據(jù)系統(tǒng)統(tǒng),多種種格式內(nèi)內(nèi)容的格格局,由由此產(chǎn)生生了種種種問題,例例如: 多個(gè)各類數(shù)數(shù)據(jù)庫(kù)并并存,無無法實(shí)現(xiàn)現(xiàn)資源內(nèi)內(nèi)部共享享 按照目前報(bào)報(bào)業(yè)集團(tuán)團(tuán)的情況況,一般般報(bào)社集集團(tuán)均存存在多個(gè)個(gè)數(shù)據(jù)庫(kù)庫(kù)。報(bào)社社編輯如如果查閱閱資料,則則需在多多個(gè)數(shù)據(jù)據(jù)庫(kù)中多多次搜索索,直接接導(dǎo)致時(shí)時(shí)間和人人力的浪浪費(fèi)。 檢索系統(tǒng)無無法整合合,重復(fù)復(fù)投資 一般報(bào)社集集團(tuán)都擁?yè)碛卸嗵滋紫到y(tǒng),且且系統(tǒng)的的資源分分布于不不同的數(shù)數(shù)據(jù)庫(kù)中中,對(duì)每每種數(shù)據(jù)據(jù)庫(kù),如如SQLLserrverr、Oraaclee、TRSS等均有有檢索要要求,造造成檢索索系統(tǒng)無無法整合合,重復(fù)復(fù)投資。報(bào)社網(wǎng)站資資源優(yōu)質(zhì)質(zhì),

9、網(wǎng)上上用戶無無法獲取取 報(bào)社網(wǎng)站上上沉淀了了大量極極其豐富富的優(yōu)質(zhì)質(zhì)信息資資源,包包括了用用戶論壇壇,博客客,數(shù)字字報(bào)紙,網(wǎng)網(wǎng)站新聞聞等等,用用戶無法法統(tǒng)一搜搜出需要要了解的的信息。 新增系統(tǒng),檢檢索無法法整合,擴(kuò)擴(kuò)張性差差 報(bào)業(yè)集團(tuán)與與時(shí)俱進(jìn)進(jìn),不斷斷新增系系統(tǒng)。新新增系統(tǒng)統(tǒng)勢(shì)必導(dǎo)導(dǎo)致新數(shù)數(shù)據(jù)庫(kù)的的增加,于于是又為為報(bào)業(yè)集集團(tuán)內(nèi)部部的數(shù)據(jù)據(jù)整合增增加了難難度。 新一代搜索索需要解解決的問問題整合多個(gè)數(shù)數(shù)據(jù)庫(kù)搜搜索一般報(bào)社都都擁有多多個(gè)系統(tǒng)統(tǒng),例如如采編、新新媒體、網(wǎng)網(wǎng)站等,每每個(gè)系統(tǒng)統(tǒng)都擁有有其獨(dú)立立數(shù)據(jù)庫(kù)庫(kù)。如何何一次性性將這些些數(shù)據(jù)搜搜索出來來,減少少人員的的重復(fù)操操作? 新一代搜索索引

10、擎支支持跨數(shù)數(shù)據(jù)庫(kù)搜搜索,可可一次性性將所需需的各庫(kù)庫(kù)的內(nèi)容容均搜索索齊全。充充分有效效的利用用報(bào)社資資源。搜索引擎對(duì)對(duì)互聯(lián)網(wǎng)網(wǎng)的幫助助報(bào)社網(wǎng)站擁?yè)碛泻A苛啃侣剝?nèi)內(nèi)容,卻卻沒有優(yōu)優(yōu)秀的搜搜索引擎擎,用戶戶無法獲獲取需要要信息。 通過新一代代搜索引引擎,可可以挖掘掘報(bào)社網(wǎng)網(wǎng)站深層層的信息息,隨時(shí)時(shí)向用戶戶提供GGOOGGLE和和百度也也搜索不不到的內(nèi)內(nèi)容。內(nèi)容搜索精精確報(bào)社擁有極極其豐富富的優(yōu)質(zhì)質(zhì)信息資資源,如如何準(zhǔn)確確的找到到需要的的內(nèi)容? 通過新一代代搜索引引擎的多多種檢索索技術(shù),能能夠快速速準(zhǔn)確的的找到需需要的內(nèi)內(nèi)容。呈現(xiàn)方式符符合需求求搜索到的內(nèi)內(nèi)容,如如何將其其以最符符合報(bào)社社人員的的

11、需求呈呈現(xiàn)出來來,滿足足報(bào)社人人員的需需要? 新一代搜索索引擎的的界面設(shè)設(shè)計(jì)完全全按照?qǐng)?bào)報(bào)社的需需求。搜索引擎簡(jiǎn)簡(jiǎn)介超音速搜素素是專為為報(bào)業(yè)新新媒體定定制的整整合搜索索引擎: 可以做到整整合報(bào)業(yè)業(yè)所有數(shù)數(shù)據(jù)庫(kù)供供報(bào)社編編輯記者者使用; 同時(shí)整合網(wǎng)網(wǎng)站的各各種應(yīng)用用數(shù)據(jù),包包括論壇壇,博客客等等提提供服務(wù)務(wù)給互聯(lián)聯(lián)網(wǎng)用戶戶; 并且提供聯(lián)聯(lián)想功能能、智能能糾錯(cuò)、搜搜索結(jié)果果分類呈呈現(xiàn)、時(shí)時(shí)光隧道道、聯(lián)合合搜索、相相關(guān)搜索索等各種種搜索功功能。 超音速搜索索引擎的的特色海量數(shù)據(jù)支支持支持?jǐn)?shù)據(jù)量量達(dá)到11億條,相當(dāng)于于十份報(bào)報(bào)紙五十十年的數(shù)數(shù)據(jù)量(按照每版版10篇新新聞,每天300版來計(jì)算算,每份報(bào)報(bào)

12、紙每年年大約 10303655 = 10995000)強(qiáng)勁處理性性能一臺(tái)專有檢檢索設(shè)備備可滿足足大部分分需求,支持100萬在線線用戶,10000個(gè)并并發(fā)搜索索請(qǐng)求,服務(wù)器器可簡(jiǎn)單單疊加,擴(kuò)擴(kuò)展更多多用戶和和并發(fā)數(shù)數(shù)。個(gè)性化功能能拼音搜索:輸入“shanghai”,可以搜索“上?!?。聯(lián)想功能:輸入“上上?!?,可可以聯(lián)想想“上海海世博會(huì)會(huì)”、“上上海國(guó)際際電影節(jié)節(jié)”等等等智能糾錯(cuò):輸入“姚姚敏”或或者“yyaommingg”,會(huì)會(huì)提示你你是否想想要搜索索“姚明明”? 分詞功能:若搜索索一句較較長(zhǎng)的話話分,無無搜索結(jié)結(jié)果,系系統(tǒng)將自自動(dòng)成若若干個(gè)詞詞組來搜搜索。 相關(guān)搜索:將關(guān)鍵鍵字內(nèi)容容有關(guān)聯(lián)聯(lián)的

13、一些些搜索關(guān)關(guān)鍵字羅羅列出來來,給予予用戶搜搜索參考考。例如如,搜索索關(guān)鍵字字“上海?!?,獲獲得如下下相關(guān)搜搜索。 無縫式嵌入入 簡(jiǎn)便,與原原數(shù)據(jù)庫(kù)庫(kù)無關(guān)不管你原來來數(shù)據(jù)使使用的是是什么類類型的數(shù)數(shù)據(jù)庫(kù),都都可以方方便的安安裝超音音速搜索索引擎,并并且不需需要改變變?cè)瓉淼牡臄?shù)據(jù)庫(kù)庫(kù)和程序序。只需需要把原原內(nèi)容導(dǎo)導(dǎo)出為普普通的文文本文件件,超音音速搜索索會(huì)自動(dòng)動(dòng)接入。 安全,與原原服務(wù)器器無關(guān)不管你原來來網(wǎng)站服服務(wù)器使使用什么么操作系系統(tǒng),超超音速搜搜索引擎擎只需要要1臺(tái)我們們專有的的獨(dú)立檢檢索設(shè)備備,完全全不影響響原來的的網(wǎng)站架架構(gòu)系統(tǒng)統(tǒng)。通過過標(biāo)準(zhǔn)的的XMLL規(guī)范,可可以兼容容任何系系統(tǒng)。搜

14、索結(jié)果分分類呈現(xiàn)現(xiàn)不同結(jié)果根根據(jù)其歸歸屬分別別呈現(xiàn)。 新聞:方便便用戶閱閱讀 數(shù)字報(bào)報(bào):提供供版面供供選 博客:提供供用戶評(píng)評(píng)論 論壇:促進(jìn)用用戶討論論時(shí)光隧道可以快速了了解并檢檢索不同同年代的的新聞內(nèi)內(nèi)容。整合多個(gè)數(shù)數(shù)據(jù)庫(kù)搜搜索報(bào)社的資源源分部在在不同的的數(shù)據(jù)庫(kù)庫(kù)中,超超音速搜搜索能夠夠一次性性在各數(shù)數(shù)據(jù)庫(kù)中中將需要要的資料料準(zhǔn)確快快速的搜搜索到,并并且根據(jù)據(jù)資料出出處歸類類顯示,更更利于報(bào)報(bào)社內(nèi)部部資料查查閱。 公司主要成成就2008年年,煙臺(tái)臺(tái)日?qǐng)?bào)報(bào)報(bào)業(yè)全媒媒體數(shù)字字復(fù)合出出版系統(tǒng)統(tǒng)工程2008年年,上海海阿耳法法信息技技術(shù)有限限公司開開發(fā)的“煙煙臺(tái)日?qǐng)?bào)報(bào)報(bào)業(yè)全全媒體數(shù)數(shù)字復(fù)合合出版系系統(tǒng)工程程”, 順利通通過新聞聞出版總總署和數(shù)數(shù)字出版版司的驗(yàn)驗(yàn)收。 做到了了新聞素素材的整整合(待待編稿庫(kù)庫(kù)) 獲獎(jiǎng)情況此系統(tǒng)已經(jīng)經(jīng)獲得220099年“中中國(guó)新聞聞技術(shù)工工作者聯(lián)聯(lián)合會(huì)【第

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論