搜索引擎關鍵字類別研究_第1頁
搜索引擎關鍵字類別研究_第2頁
搜索引擎關鍵字類別研究_第3頁
免費預覽已結束,剩余1頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

搜索引擎關鍵字類別研究

根據(jù)中國互聯(lián)網(wǎng)信息中心的第14次中國互聯(lián)網(wǎng)發(fā)展狀況的調查報告,截止到2004年6月30日,中國的上網(wǎng)用戶已達到8700萬,在用戶使用的各種網(wǎng)絡服務中,搜索引擎列第二位,其被使用的頻率僅次于電子郵件[1]。這一數(shù)據(jù)顯示搜索服務市場有巨大的潛在商業(yè)利益。從使用者的角度來說,用戶不管是在雅虎、新浪、搜狐的分類目錄里查找信息,還是在google、百度、中國搜索等專業(yè)的搜索引擎網(wǎng)站上搜索信息,都離不開關鍵詞語,即通常所說的搜索引擎中的關鍵字。搜索引擎公司通過分析用戶使用的字、詞組、短語、句子的內容、種類、頻率,可以直接分析用戶網(wǎng)上的搜索行為,揭示用戶對網(wǎng)上信息的興趣所在。并把這些有用的信息提供給廣告主,廣告主依據(jù)自身的需要,可以向搜索引擎公司購買某個或某幾個關鍵字,以期用戶在用這些關鍵字搜索時,能在搜索結果頁面展示自己企業(yè)的廣告信息。這種作為搜索引擎的關鍵字廣告越來越被商家所接受,從這個角度來分,關鍵字可以分為可商用的關鍵字和非商用的關鍵字,比如"英語培訓"這個關鍵字就具有一定的商業(yè)價值,對那些英語培訓機構有很大的吸引力,事實上,當用戶用這個詞在google上搜索時,同一搜索結果頁面的右側區(qū)域從上到下列有八家公司;百度也用有商業(yè)價值的關鍵字進行搜索結果的"竟價排名"。相反,一些關鍵字則因為太普通或沒有任何直接或間接的商業(yè)聯(lián)想,就不具有商業(yè)價值,比如走路、吃飯、穿衣、坐車等等。搜索引擎關鍵字除了按語種和有無商業(yè)價值進行劃分外,從網(wǎng)絡用戶具體搜索時的行為看,關鍵字還可按不同的劃分標準區(qū)別。在實際應用中,搜索引擎中的關鍵字可以按語言要素的大小、關鍵字的使用頻率、關鍵字的內容、搜索的文件類型四個標準來劃分。一、按語言要素的大小,搜索關鍵字包括的種類有:1、單字,是一種自然語言的基本構成單位,比如英文中的game、book、idea、welcome等,中文中的鞋、書、想、棒等。單字是關鍵字的基本構成單位,也是最小的搜索關鍵字。2、詞,在搜索引擎里指一種自然語言中由兩個或兩個以上單字構成的關鍵字,如:searchengine、keyword、marketingresearch、服裝、學生、拖拉機、英語學習等。3、短語:由一種自然語言中的兩種或兩種以上的語言成分構成的關鍵字,但還沒構成一句完整的話。比如:最好的大學、英語的學習方法、互聯(lián)網(wǎng)絡具有、學生喜歡。用短語進行搜索,用戶往往能找到更加準確的相關信息。4、句子:由一種自然語言中完整的一句話進行搜索時構成的關鍵字。比如:什么是搜索引擎、互聯(lián)網(wǎng)通訊的原理是什么、怎樣提高word的使用技巧,等等。當然,這種用自然語言進行的智能搜索,目前的效果還強差人意。美國的askjeeves搜索引擎支持提問方式的句子搜索,但搜索結果的相關性不能令人滿意。需要注意的是,有些單字,在語法上往往起代詞、介詞、助詞、虛詞的作用,在一些搜索引擎里往往做忽略處理,比如在google里用中文的"地、得、的、了、之、嗎"等進行搜索時,會被提示沒有列入搜索范圍,同樣英文中?quot;i、www、com、the、of、in、is、are、was、that"等也被作為忽略關鍵字。如果用短語或句子進行搜索時,所在的短語或句子包括這些字符,則可以通過特殊的搜索語法進行強制搜索,比如,在google里,可以對這個短語或句子添加引號。二、按關鍵字的使用頻率,關鍵字可以分為:1、常用關鍵字:是一種自然語言中最常用的而且是人們日常生活進行溝通經(jīng)常使用的部分,常用關鍵字可以是單字、詞、短語、句子。用戶搜索通常都用常用關鍵字進行搜索。2、高頻關鍵字:是指用戶進行搜索時經(jīng)常頻繁使用的字詞,而且依社會群體、階層的不同而有所差異。比如對大學生群體,在搜索引擎里出現(xiàn)的高頻關鍵字可能會是:考研、出國、留學、托福、就業(yè)等,而對一個已有身孕的婦女,高頻關鍵字更可能出現(xiàn)的是:胎教、寶寶、孕期保健之類的詞匯。3、熱門關鍵字:是指在一定時期被網(wǎng)絡用戶普遍搜索的字詞,該熱門關鍵字反映當前社會關注的熱點問題,比如:倒薩、非典、SARS、神五、奧運等。百度的搜索風云榜,就有熱門搜索top50;或反映一個群體關注的熱點,同樣是百度的搜索風云榜,就有十大影視作品風云榜、十大美女風云榜、十大IT品牌風云榜、十大數(shù)碼產(chǎn)品風云榜等二十幾個,這種熱門關鍵字的排行根據(jù)不同主題依次列出。三、按關鍵字的屬性特征來劃分,關鍵字可以分為:1、專有名詞:指人名、地名、品牌名稱、或其它事物的專有名詞,如NBA、GMAT、北京、張柏芝、西湖、中國移動、清華大學等等,百度的搜索風云排行榜所依據(jù)的關鍵字多數(shù)就是專有名詞這一類型,如軟件名、游戲名、風景名勝名、大學名、富豪名、汽車名、IT品牌名、數(shù)碼產(chǎn)品名等等。2、普通名詞:包括在前面所說的除專有名詞之外的單字、詞之中。3、錯別字:是指網(wǎng)絡用戶在使用關鍵字進行搜索時,輸入拼寫錯誤的關鍵字。用英文進行搜索時,一些搜索引擎對錯誤有糾偏功能,比如在google中想搜索的關鍵字是freehand,結果卻輸入成feerhand,并按這個輸入進行了搜索,英文中當然沒有feer這個字,在返回的結果頁面,搜索引擎會問用戶是否找的是freehand?;蛘咴诎俣壤锼?一心一意",結果輸成"一新一意",百度搜索引擎一方面會把含有"一新一意"這一關鍵字的頁面返回來,同時,也會問用戶要找的是否是"一心一意"。四、按搜索的不同文件類型,關鍵字還可以劃分成:1、搜索超文本標置語言(html)網(wǎng)頁的關鍵字:搜索時,可使用單字、詞、短語、句子進行搜索,但用短語或句子往往更能得到精確的結果。因為用戶搜索網(wǎng)站,強調的是搜索結果的相關度,即搜索的質量,而不是數(shù)量。目前的互聯(lián)網(wǎng)站點已多不勝數(shù),截止到2003年底,光中國就有近60萬個萬維站點。用一兩個單字、詞往往不能查到很精確的網(wǎng)站。2、搜索文本文檔的關鍵字:搜索時,可使用單字、詞、短語、句子進行搜索,從搜索的效果來看,以單字和詞為主的搜索效果較好,并且可以配合使用專有名詞。這樣,會使搜索的范圍擴大,能返回更多的搜索結果。目前網(wǎng)絡上存在的文檔類型主要有doc、pdf、txt、ppt、zip等。與搜索html頁面不同,搜索這類文件,需要一定的搜索語法,比如在google里就可以用filetype這個語法加關鍵詞進行搜索。如要搜doc格式的包括"電子商務"關鍵字的文件,可在google搜索輸入框里輸入:filetype:doc電子商務。北京大學的天網(wǎng)搜索引擎有專門的文件搜索分類。3、搜索多媒體文件的關鍵字:包括圖片、聲音、動畫、視頻文件等。搜索時,可使用單字、詞,以名詞為主,可以是專有名詞,也可以是一般名詞。多媒體信息是互聯(lián)網(wǎng)上的重要資源,而且隨著計算機、網(wǎng)絡和通訊軟硬件性能的提高,這部分資源呈現(xiàn)出加速增長的趨勢。不少搜索引擎對這部分資源進行單獨分類,google有"圖象"的分類,百度有"MP3"、"圖片"的分類,中國搜索有"圖片"、"MP3"和"flash"的分類。還有專門的這類搜索引擎,比如:英文網(wǎng)站中搜索視頻的altavista;中文網(wǎng)站中搜索動畫和聲音的sogua等。除了以上四種分類,在實際搜索中還可以按不同專題進行劃分:比如購物、游戲、軟件、人、大

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論