手冊優(yōu)視搜索引擎優(yōu)化_第1頁
手冊優(yōu)視搜索引擎優(yōu)化_第2頁
手冊優(yōu)視搜索引擎優(yōu)化_第3頁
手冊優(yōu)視搜索引擎優(yōu)化_第4頁
手冊優(yōu)視搜索引擎優(yōu)化_第5頁
已閱讀5頁,還剩52頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、ucweb SEO 規(guī)范UC 優(yōu)視搜索引擎優(yōu)化規(guī)范IBD-SEOTEAM第 1 頁 共57 頁ucweb SEO 規(guī)范目錄 . 什么 SEO4二. SEO 細則42.1 1 服務器空間42.1.1 . 1 什么是服務器空間?42 . 1 . 2 服務器空間的哪些因素影響的排名?52 . 2導航結構62 . 2 . 設計結構要注意哪些因素?62 . 32 . 3 . 1和文件名7和文件名的介紹:72 . 3 . 2 什么樣的有利于排名?72 . 3 . 3 目錄路徑和文件名的因素:72 . 4 網頁標題 TITLE 和 META . 92.4.1 . 1 網頁 t i t le 和 meta2.

2、4.2 . 2 網頁標題 t i t le 和meta介紹9如何設計有利于排名?92 . 5 優(yōu)秀的網頁內容112 . 62 . 6 . 1密度和位置12 密度的重要性12 2 . 6 . 2 什么是2 . 6 . 32 . 6 . 4密度?12 密度在那個區(qū)間比較合理呢?13 如何在網頁中那些位置突出?13 2 . 7 反向. 15 2.7.1 . 1 什么是反向2.7.2 . 2 如何查看反向? . 15 ? . 15 2 . 7 . 3 反向的哪些因素影響的排名?15 2 . 8 Page Rank 值16 2 . 9 Robots. txt 和 Robots meta. 19 2.9.

3、1 . 1 什么是 robots. txt?19 2.9.2 . 2 robots. txt 的語法20 2.9.3 . 3 robots. txt 基本的用法20 2.9.4 . 4 robots. txt 舉例22 2.9.5 . 5 常見 robots. txt 錯誤22 2 . 9 . 6 Robots META. 24 三. SEO 注意事項26 3.1 1 框架網頁26 3.2 2 Flash 網頁32 3.3 3 不可見的導航34 3 . 4 代碼3 . 5. 38 頁41 3.6 6 在 URL 中使用 SESSIONID44 3.7 7 檢查基于 COOKIE 的導航46 3

4、.8 8 其它注意事項48 第 2 頁 共57 頁ucweb SEO 規(guī)范四. 關鍵字選擇50 4 . 14.2 2 選擇4.3 3 選擇4.4 4 頁游的重要性50 的原則52 有哪些系統(tǒng)的方法52 的選擇策略56 4 . 5 內容與創(chuàng)作56 第 3 頁 共57 頁ucweb SEO 規(guī)范一.什么 SEOSEO 是 Search Engine Optimization 的縮寫, 翻譯成中文就是“ 搜索引擎優(yōu)化 ”, 一般可簡稱為搜索優(yōu)化。 SEO 的主要工作是通過了解各類搜索引擎如何抓取互聯(lián)網頁面、 如何進行索引以及如何確定其對某一特定的搜索結果排名等技術, 來對網頁進行相關的優(yōu)化, 使其提

5、高搜索引擎排名, 從而提高量, 最終提升的銷售能力或宣傳能力的技術。二. SEO 細則2.1 服務器空間2.1.1 什么是服務器空間?服務器空間就是存放文件的地方,一般而言,大型 都用的是獨立的服務器, 或者是服務器集群。 小型大部分都是租用虛擬空間, 也就第 4 頁 共57 頁ucweb SEO 規(guī)范是一臺服務器上的一部份空間。2.1.2 服務器空間的哪些因素影響的排名?(l)服務器所在區(qū)域影響你的的排名:對于 Goog 1 e 和 yahoo 等知名搜索引擎而言,不同的區(qū)域,搜索結果的就不同。 例如, 一些英文, 你在中國用 Goog 1 e 搜索, 發(fā)現(xiàn)你的排名非??壳? 但是如果你在國

6、外用, 你可能翻十頁都找不到你的.看的, 而是讓我們的潛我們做搜索引擎排名的排名效果不是讓我們在客戶看的. 所以服務器的區(qū)域選擇非常關鍵。目前我們主要國內主流搜索引擎進行優(yōu)化 ,如 Baidu 、360 搜索 、S oso、Sogou。服務器放置國內甚至是主要目標用戶群所在地,從用戶體驗的角度來看會提高轉化率。(2)檢查服務器的 IP 是否被搜索引擎處罰過:當租用一個新的 web 空間放 的的時候, 請一定要檢查這臺服務 器的 IP 是否被搜索引擎處罰過. 不然就算你的做的再好, 都有可能被牽連受害。 如何檢查呢?首先 ,你 要查一下這臺服務器上放了多少呢? 如何查呢? 這里我們給大家推薦一些

7、工具, 可以很輕松的查出來有多少共同指向一個 IP:以上這些工具都可以看到有多少指向了這個 IP, 然后找其中一個,比如:然后你在 baidu 中輸入:site: 然后看一看 Baidu 收錄了這個多少頁面。 如果發(fā)現(xiàn) baidu 還沒有收錄它, 就多查幾個, 如果大部分都是沒有被 baidu 收錄的話, 那么很有可能這臺服務器是被 baidu 處罰過的 。為 了保險起見 ,最 好別用 。如 果這臺服務器上的大部分都被 Baidu收錄了許多頁面的話, 說明這臺服務器沒有被 Baidu 處罰, 可以使用。第 5 頁 共57 頁ucweb SEO 規(guī)范 般而言, 被搜索引擎處罰的比較多, 被搜索引

8、擎處罰的服務器 IP 相對比較少?。?)、服務器的穩(wěn)定性影響的排名:想 獲 得 較 好 的 排 名 , 服 務 器 一 定 要 穩(wěn) 定 . 如 果 服 務 器 不 穩(wěn) 定 , 很 有 可 能Baidu 更新你的時候, 你的暫時因為服務器不穩(wěn)定而打不開, 那么你 的排名就了. 這條因素特別重要.舉個例子, 在年前輸 入“ 廣州” 一詞, 一直都穩(wěn)排第一. 但是春節(jié)期間,公司技術回家過年了 。這 時候剛好服務器出問題了, 導致長時間不能 , 期間正好趕上了 Baidu 更新, 該的排名迅速下降到了第五位.如果想獲得較好的排名,服務器要要做到以下幾方面: 1 、要租用潛在客戶最多的地區(qū)的相應 IDC

9、 服務商的服務器或者空間2 、服務器的 IP 一定要沒有被處罰過3 、服務器運營要穩(wěn)定、 速度要快!2.2導航結構導航結構主要就是一個 的欄目菜單,是網頁中很重要的一部分內容, 主要對網頁的導航、 布局起到很重要的作用。 它一方面在幫助用戶更方便的瀏覽, 同時它也是用戶和搜索引擎 個專業(yè)度的重要因 。2.2.設計結構要注意哪些因素?(l)、導航要清晰明了一般 的導航主要是 的一級目錄,通過它們用戶和搜索引擎蜘蛛程序都可以層層深入到所有重要內容。(2)、導航用要文本做第 6 頁 共57 頁ucweb SEO 規(guī)范許多, 為了漂亮和美觀, 都采用 flash 按鈕或者圖片來做, 這是非常不合理的,

10、 因為這些按鈕中的, 很難被搜索引擎蜘蛛程序發(fā)現(xiàn),所以導航一定要用文本做。2.3和文件名2.3.1和文件名的介紹:選擇,路徑設計, 文件名設計 ,對的排名影響有一定的影響,特別是中文搜索引擎如 Baidu 的選擇和, 尤為重要。 選擇一個好的 , 把的路徑、 文件設計的合理一些, 對在各個搜索引擎中的排名有一定的幫助。2.3.2 什么樣的有利于排名?n:, 比如要排“ 網頁” 這個關就是以作為前綴的鍵詞的時候, 你選擇 wangyeyouxi. com 這樣的, 將非常有利于搜索引擎排名。n包含的:有限,好的 大部分已經都被搶注了,如果所屬行業(yè)出現(xiàn)這類情況, 我們就建議采用包含的。 如要排“游

11、戲” 這個, 可以選擇 49 shouyou. com 這樣的。2.3.3 目錄路徑和文件名的因素:目錄路徑和文件名的路徑的設計因素主要要考慮以下幾個因素:n文件路徑和文件名最好要包含比不包含的具備優(yōu)勢根據關鍵字無所不在的原則,可以在目錄名稱和文件名稱中使用到關鍵第 7 頁 共57 頁ucweb SEO 規(guī)范詞。但如果是組,則需要用分隔符。我們常用連字符“ -” 和下劃線“ _” 進行分隔, 中還經常出現(xiàn)空格碼“ % 20 ” 。因 此 ,如 果以“ 中國旅游”作文件名, 就可能出現(xiàn)以下三種分隔形式:Chinatour. htmChina_tour. htmChina- tour. htmCh

12、ina% 20 tour. htm這幾種寫法哪種正確, 哪種不正確呢?目前、等搜索引擎并不認同“ _” 為分隔符。 對來說,China- tour 和 China% 20 tour, 都等于 China tour,但 China_tour 就被讀成了 Chinatour, 連在一起之后,就失去了意義.China- tour. htm 是正確的寫法, 這一點要千萬的注意。 因此, 目錄和文件名稱如果有組, 要用連字符“ -” 而不是下劃線“ _” 進行分隔n比欄目頁具備優(yōu)勢:A 比有排名優(yōu)勢n欄目頁比內頁具備優(yōu)勢:比這樣的路徑有排名優(yōu)勢.n靜態(tài)路徑比動態(tài)路徑具備優(yōu)勢:比這樣的路徑具備優(yōu)勢。動態(tài)路

13、徑: 目前很多都有數(shù)據庫驅動生成的 URL,即動態(tài) URL,往 往表現(xiàn)為在 URL 中出現(xiàn)“ ?” 、“ =” 、“ %” 、以及“ &” “ $” 等字符。動態(tài)URL 極不利于搜索引擎抓取網頁, 嚴重影響排名, 通常是通過技術解決方案將動態(tài) URL 轉化成靜態(tài)的 URL 形式, 如:第 8 頁 共57 頁ucweb SEO 規(guī)范這樣的路徑, 可以通過技術成這樣的路徑:關于動態(tài)路徑的優(yōu)化策略, 將會在后面專門來講。2.4 網頁標題 TITLE 和 META2.4.1 網頁 title 和 meta介紹標題了 TITLE 和 META主要都放在網頁源代碼中<head>與<

14、;/ head>中間. 這些內容主要是為了方面搜索引擎蜘蛛對網頁內容的識別. 其中, title在網頁瀏覽的時候會顯示在瀏覽器上放 meta在網頁瀏覽的時候是看不到的。 只有察看網頁源代碼的時候才能看到。 這里舉一個例子:<TITLE>傲劍_傲劍 OL 官網_攻略_傲劍 OL_九游</TITLE><META name=keywords content= 傲劍 OL, 傲劍官網, 傲劍攻略, 傲劍禮包,安卓版,ios 版, 傲劍>< META name=description content= 傲劍 OL 是一款火爆的 ARPG武俠無端網游 。傲

15、劍官網提供最新傲劍 ios 版和安卓版、最 好玩的傲劍攻略, 歡迎到九游傲劍與玩家交流。 ><META http- equiv=Content- Type content=" text/ html; charset=gb 2312 " >< META http- equiv=Content- Language" content=" zh- cn"> 2.4.2 網頁標題 title 和 meta如何設計有利于排名?( 1 )、 網頁標題該如何設計?前面例子中的網頁標題 title 如下: <TITLE>

16、傲劍_傲劍 OL 官網_攻略_傲劍 OL _九游</ TITLE>這部分表示網頁標題, 網頁標題對網頁在各大搜索引擎中的排名有著很大的第 9 頁 共57 頁ucweb SEO 規(guī)范影響, 而且對該網頁在其他搜索引擎中的排名也同樣有著很大的影響 . 所以,標題的設計是非常關鍵的.設計網頁標題有以下幾點原則:每個網頁的標題都要不同, 并且要與自身網頁的內容像符合;網頁標題設計簡潔明了, 每個頁面的標題最好只終點突出 1 - 3 個, 不要 太多;標題設計不要太長, 最好不要超過 30 個漢字。( 2 ) META 該如何設計: 前面例子中的網頁 META 如下: <META na

17、me=keywords content= 傲劍 OL, 傲劍官網, 傲劍攻略, 傲劍禮包,安卓版,ios 版, 傲劍>< META name=description content= 傲劍 OL 是一款火爆的 ARPG武俠無端網游 。傲 劍官網提供最新傲劍 ios 版和安卓版、最 好玩的傲劍攻略, 歡迎到九游傲劍與玩家交流。 ><META http- equiv=Content- Type content=" text/ html; charset=gb 2312 " >< META http- equiv=Content- Langua

18、ge" content=" zh- cn"> 以上部分內容是網頁 meta ,另外還有許多種網頁,不過以上這些是最重要的。< META name=description content= 傲劍 OL 是一款火爆的 ARPG武俠無端網游 。傲 劍官網提供最新傲劍 ios 版和安卓版、最 好玩的傲劍攻略, 歡迎到九游傲劍與玩家交流。 >其中這部分是網頁描述 ,它主要是給搜索引擎看的,這個 設計追求簡單明了, 與該網頁內容相符合。 為了提高排名, 可以適當在里面提高的密度。<META name=keywords content= 傲劍 OL, 傲

19、劍官網, 傲劍攻略, 傲劍禮包,第 10 頁 共57 頁ucweb SEO 規(guī)范安卓版,ios 版, 傲劍>這句是,目前對 Goo 1 e、Baidu 已經沒有什么作用了,不過對其他搜索引擎的排名還有一定的作用, 這個的設計原則和是簡潔明了,如果是多個, 可以用逗號格開, 無關的最好寫, 容易被一些搜索引擎當作來處理。<META http- equiv=Content- Type content=" text/ html; charset=gb 2312 " >< META http- equiv=Content- Language" co

20、ntent=" zh- cn"> 這兩句是網頁編碼和語言注釋 ,主要是給瀏覽器看的。不同語言的編碼都不同, 最好用潛在客戶使用的超作系統(tǒng)的編碼, 要不然潛在客戶看到 的網頁將是亂碼。 如果是英文, 潛在客戶是西歐的, 可以用以下代碼: <metahttp- equiv=” Content- Type”content=” text/ html; charset=iso - 8859 - 1 ” >或者用通用的編碼:<meta http- equiv=” Content- Type”content=” text/ html; charset=utf 8

21、” >大部分中文簡體的制作軟件模式的編碼都是 gb 2312 .2.5 優(yōu)秀的網頁內容網絡,內容為王,優(yōu)秀的內容永遠是吸引搜索引擎的最重要的因素。什么樣的網頁內容才算優(yōu)秀的網頁內容呢?主要有以下特點: 的內容, 容易被眾多,的過程中一般都會給這個頁面加有, 所以這個頁面可以獲得較好的評分, 排名自然會好;內容豐富: 豐富的內容會讓搜索引擎收錄許多內容,各個頁面之間的互相 有利于其提高各個頁面的在 搜索引擎中的評 第 11 頁 共57 頁ucweb SEO 規(guī)范分; 用文本來表現(xiàn)內容 :內 容要用合理的文本描述出來 ,不 要用圖片和 flash描述網頁內容。2.6密度和位置2.6.1密度的

22、重要性關鍵字密度是許多搜索引擎,包括占 baidu、yahoo 和 msn 搜索 算法之一。 每個搜索引擎都有一套關于關鍵字密度的不同的數(shù)學公式, 關鍵字密度可使你獲得較高的排名位置,千萬記住,并不是密度越大越好,不同的搜索引擎之間也存在不同的容許級別。 般密度標準: 2% 密度 8% 檢測工具:2.6.2 什么是密度?關鍵字密度就是你所強調的關鍵字或 在網頁中出現(xiàn)的次數(shù)與網頁中其它文本內容的比例。舉例說明:<html><head><title>Keyword 1 , keyword 2 . keyword 3 </ title><meta

23、 name=” keywork” contend=” Keyword 1 , keyword 2 . keyword 3 ” ><meta name=” description” contend=” Keyword 1 and keyword 2 ”</ head>第 12 頁 共57 頁ucweb SEO 規(guī)范<body>Keyword 1 and keyword 2 , keyword 3 and so on!</ body></ html>在這個頁面中, 除去 html 代碼, 文本內容為:“ Keyword 1 , keywo

24、rd 2 , keyword 3 ”“ Keyword 1 , keyword 2 , keyword 3 ”“ Keyword 1 and keyword 2 ”“ Keyword 1 and keyword 2 , keyword 3 and so on” 共是 16 個單詞, Keyword 1 出現(xiàn)的次數(shù)是 4 次 ,那么 Keyword1 在該 網頁中的關鍵密度為: 4/16=25% 2.6.3密度在那個區(qū)間比較合理呢? 般認為,密度在 2 % 8 % 左右為適宜, 不要刻意追求關鍵字的堆積, 否則觸發(fā)關鍵字堆砌過濾器( keyword stuffing filter ), 會被處罰

25、的后果。2.6.4如何在網頁中那些位置突出?出現(xiàn)的位置也是非常重要的因素,哪些位置出現(xiàn) 有利于排名呢?l )、 網頁標題 title 中這是最重要的因 一、如果你要用某個網頁排某一個 ,一定要在網頁標題 title 中出現(xiàn)這個。2) 、 meta 第 13 頁 共57 頁ucweb SEO 規(guī)范meta合理的突出, 不過要注意不要過密。3 )、 網頁內容的大標題中網頁內容的大標題一般都和網頁的 tit 1 e 標題差不多, 這里面也要合理的突出關鍵 。4 )、 網頁文本 網頁文本內容出現(xiàn)的時候,要合理的突出,一般都用加重<B>來突 出。 5 )、 圖片注釋網頁中出現(xiàn)的圖片, 都可以

26、加上文本注釋, 具體語法如下: 般網頁中 張圖片在 html 的代碼<IMG height= 70 width 187 src="images/web136_1ogo.gif"> 可以將圖片加上注釋, 如下:<IMG height= 70 width= 187 src=" images/ web 136 _ 1 ogo. gif" a 1 t= “ 關鍵詞”> Alt 注釋一定簡潔明了, 千萬不要寫的太過冗長, 這樣會被一些搜索引擎 當作來對待的.6 )、 超注釋tit 1 e=" 注釋文本"不加注釋的代碼:&

27、lt;a href "" >文本</ a>加注釋后的代碼:<a href "" tit 1 e=" 包含有的描述”> 文本</a> 第 14 頁 共57 頁ucweb SEO 規(guī)范2.7 反向2.7.1 什么是反向?反向是指 A 網頁上有一個指向 B 頁 ,那 么 A 頁就是 B 頁的反向。查看一個的反向可以用站長工具查看, 也可以直接用搜索引擎語法進行查看。 2.7.2 如何查看反向?: 查看 的反向, 只需要在 Goog 1 e 種輸入以下語句搜索就可以看到結果:Link:Baidu: 查看方法do

28、main:但 baidu 的 domain 語法查看結果目前還確 ,國 內查看反鏈的工具可以查看出一部分反鏈。 如2.7.3 反向的哪些因素影響的排名?反向 的數(shù)量 個網頁反向的數(shù)量越多, 說明這個網頁的內容被的越多, 被關注的越多。 所以反向的數(shù)量越多越高.反向 的質量 如果一個網頁被一個權威指向了一個, 那么這個權威的一個的第 15 頁 共57 頁ucweb SEO 規(guī)范就是一個高質量的。 這條因素非常的人性化, 和現(xiàn)實生活中的一些是對應的。 比如:比如你有一個。 對于這個而言, 如果有一個權威說它好。 可能勝過 10 個普通人說它好。你的網頁就如, 權威猶如權威。反向 的文本 反向的文本

29、中,一定要包含,比如這個你想提高在搜 索“ 搜索引擎排名” 結果中的排名, 那么你在做反向的時候最好用“ 搜索引擎排名“ 這個詞作為超文本, 即:<a href= "" > 搜索引擎排名</a> 2.8PageRank 值pagerank 簡稱 pr 值 , 是基于【從許多優(yōu)質的網頁 過來的網頁, 必定還是優(yōu)質網頁】 的回歸關系, 來判定所有網頁的重要性。pagerank, 有效地利用了 Web 所擁有的龐大構造的特性。 從網頁 A 向網 頁 B 的被看作是對頁面 A 對頁面 B 的支持投票,根據這個投票數(shù)來頁面的重要性。不單單只看投票數(shù)( 即數(shù)),

30、對投票的頁面也進行分析 ?!?重要性】高的頁面所投的票的評價會更高,因為接受這個投票頁面會被理解為【 重要的物品 】。根據這樣的分析, 得到了高評價的重要頁面會被給予較高的 page rank ( 網頁 等級), 在檢索結果內的名次也會提高。 page rank 是中表示網頁重要性的綜合性指標, 而且受到各種檢索( 引擎) 的影響。 倒不如說, pagerank 就是基于對" 使用復雜的算法而得到的構造" 的分析 ,從 而得出的各網頁本身的特性。當然, 重要性高的頁面如果和檢索詞句沒有關聯(lián)同樣也沒有任何意義。 為此使用了精練后的文本匹配技術 ,使 得能夠檢索出重要而且正確的

31、頁面。第 16 頁 共57 頁ucweb SEO 規(guī)范通過下面的圖我們來具體地看一下剛才所闡述的算法。 具體的算法是, 將某個頁面的 Page Rank 除以存在于這個頁面的 正向 , 由此得到的值分別和正向所指向的頁面的Page Rank 相加, 即得到了被的頁面的Page Rank。圖讓我們詳細地看一下。 提高Page Rank 的要點, 大致有3 個.反向 數(shù) ( 單純的意義上的受歡迎度指標)反向 是否來自推薦度高的頁面( 有根據的受歡迎指標)反向 源頁面的數(shù)( 被選中的幾率指標)首先最基本的是, 被許多頁面會使得推薦度提高。 也就是說( 被許多頁 面的) 受歡迎的頁面, 必定是優(yōu)質的頁

32、面。 所以以 反向數(shù)作為受歡迎度的一個指標是很自然的想法。 這是因為, “” 是一種被看作的推薦第 17 頁 共57 頁ucweb SEO 規(guī)范行為。 但是, 值得驕傲的是 Page Rank 的思考方法并沒有停留在這個地方。也就是說, 不僅僅是通過 反向數(shù)的多少, 還給推薦度較高頁面的反向鏈接以較高的評價。 同時, 對來自總數(shù)少頁面的給予較高的評價, 而來自總數(shù)多的頁面的給予較低的評價。 換句話說( 匯集著許多推薦的) 好的頁面所推薦的頁面, 必定也是同樣好的頁面和 與感覺在被胡亂的相比,被少數(shù)挑選出的 肯定是優(yōu)質的 這兩種 同時進行著。 一方面, 來自他人高水平網頁的正規(guī)將會被明確重視,

33、另一方面,來自張貼有完全沒有關聯(lián)性的類似于書簽的網頁的會 幾乎沒有什么價值( 雖然比起不被來說好一些) 被輕視。因此, 如果從類似于 yahoo! 那樣的 Page Rank 非常高的站點被的話, 僅此網頁的 Page Rank 也會一下子上升;相反地,無論有多少反向數(shù),如果全都是從那些沒有多大意義的頁面過來的話 ,PageRank 也輕易上升。不僅是 yahoo!, 在某個領域中可以被稱為是威的( 或者說固定的) 頁面來 的反向是非常有益的。 但是, 只是一個勁地在 些同伴之間制作的,比如像 單純的內部照顧 這樣的做法很難看出有什么價值。也就是說,從注目于全世界所有網頁的視點來( 你的網頁)

34、 是否真正具有價值。綜合性地分析這些指標, 最終形成了將評價較高的頁面顯示在檢索結果的相對靠前處的搜索結構。以往的做法只是單純地使用反向數(shù)來評價頁面的重要性 ,但 Page Rank 所采用方式的優(yōu)點是能夠不受機械生成的的影響。 也就是說, 為了提高Page Rank 需要有優(yōu)質頁面的反向。 譬如如果委托 yahoo 登陸的網站,就會使得 Page Rank 驟然上升。但是為此必須致力于制作( 網頁的) 充實的 內容。這樣一來,就使得基本上沒有提高 Page Rank 的近路( 或后門)。不只限于 Page Rank ( Clever 和 HITS 等也同樣), 在利用構造的排序系統(tǒng)中, 以前

35、單純的 SPAM 手法將不再通用。 這是最大的一個優(yōu)點, 也是 Goog 1 e 方便于 使用的最大理由。( 雖然是最大的理由, 但并不是唯一的理由。)在這里請注意, Page Rank 自身是由 Goog1e 定量, 而與用戶檢索內容的表達式完全無關。就像后邊即將闡述的一樣,檢索語句呈現(xiàn)在 Page Rank第 18 頁 共57 頁ucweb SEO 規(guī)范的計算式上。 不管得到多少的檢索語句, Page Rank 也是一定的、 文件固有的評分量。Page Rank 的定性說明大致就是這樣一些。 但是, 為了實際計算排列次序、 比較等級, 需要更定量性的討論。 以下一章將做詳細的說明。搜索引擎

36、都有的“ 搜索 人” ( robots ), 并通過這些 RB0TS 在網絡 上沿著網頁上的( 一般是 http 和 src)不斷抓取資料建立的數(shù)據庫。 對于管理者和內容提供者來說,有時候會有一些站點內容,不希望被 RB0TS 抓取而公開 。為 了解決這個問題, RB 0 TS 開發(fā)界提供了兩個辦法: 個是 robots. txt, 另一個是 Robots META。2.9Robots.txt 和 Robots meta2.9.1 什么是 robots.txt?robots. txt 是一個純文本文件, 通過在這個文件中該中不想被robots 的部分, 這樣, 該的部分或全部內容就可以不被搜索

37、引擎收錄了, 或者指定搜索引擎只收錄指定的內容。當一個搜索 人一個站點時,它會首先檢查該站點根目錄下是否存在 robots. txt, 如果找到, 搜索人就會按照該文件中的內容來確定訪問的范圍, 如果該文件不存在, 那么搜索人就沿著抓取。robots. txt 必須放置在一個站點的根目錄下 ,而 且文件名必須全部小寫。第 19 頁 共57 頁URL 相應的 robot. txt 的 URL W 3 . org/W 3 . org/ robot. txtucweb SEO 規(guī)范2.9.2robots.txt 的語法" robots. txt" 文件包含一條或的, 這些通過空行

38、( 以CR, CR/ NL, or NL 作為結束符 ), 每一條的格式如下所示:“ <field>: <optionalspace><value><optionalspace>”在該文件中可以使用# 進行注解, 具體使用方法和 UNIX 中的慣例一樣。該 文 件 中 的通 常 以 一 行 或 者 多 行 user agent 開 始 , 后 面 加 上 若 干disallow 行, 詳細情況如下:User- agent:該項的值用于描述搜索引擎 robot 的名字, 在" robots. txt" 文件中, 如果有多條 Us

39、er- agent說明有多個 robot 會受到該協(xié)議的限制 ,對 該文件來說, 至少要有一條 User- agent。 如果該項的值設為*, 則該協(xié)議對任何人均有效, 在" robots. txt" 文件中, "User- agent: *" 這樣的只能有一條。Disallow:該項的值用于描述不希望被到的一個 URL, 這個 URL 可以是一條完整的路徑 ,也 可以是部分的 ,任 何以 Disa 11 ow 開頭的均被 robot到。 例如"Disa 11 ow :/ He 1 p. html" 對/ he 1 p. htm 1

40、和/ he 1 p/ index. htm 1 都不搜索引擎, 而" Disa 11 ow: / he 1 p/" 則robot/ he 1 p. htm 1 , 而不能/he1p/index.htm1 。任何一條 Disa 11 ow為空,說明該的所有部分都被,在" robots. txt" 文件中, 至少要有一條 Disa 11 ow。 如果"/ robots. txt" 是 個空文件, 則對于所有的搜索引擎 robot, 該都是開放的。2.9.3robots.txt 基本的用法下面是一些 robots. txt 基本的用法第 2

41、0 頁 共57 頁ucweb SEO 規(guī)范所有搜索引擎的:User agent: *Disallow: 所有的 robot User agent: *Disallow:或者也可以建一個空文件” robots. txt” file所有搜索引擎的幾個部 分( 下例中的 cgi- bin 、t mp 、p rivate目錄)User- agent: *Disallow: / cgi- bin/ Disallow:/ tmp/Disallow:/ private/某個搜索引擎的( 下例中的 Bad Bot)User- agent: Bad BotDisallow:/只某個搜索引擎的( 下例中的 Web

42、 Crawler)User- agent: Web CrawlerDisallow:User- agent:* Disallow:/第 21 頁 共57 頁ucweb SEO 規(guī)范常見搜索引擎人Robots 名字 2.9.4robots.txt 舉例下面是一些著名站點的robots. txt:2.9.5 常見 robots.txt 錯誤顛倒了順序:錯誤寫成第 22 頁 共57 頁名稱 搜索引擎BaiduspiderScooterIa_archiverbotFAST- Web CrawlerSlurpMSNBOTSearch. msn. comucweb SEO 規(guī)范User- agent:*

43、Disallow:Bot正確的應該是:User- agent:BotDisallow: *把多個命令放在一行中:例如, 錯誤地寫成Disa 11 ow: / css/ / cgi- bin/ images/正確的應該是Disallow:/ css/Disallow:/ cgi- bin/ Disallow:/ images/行前有大量空格例如寫成Disallow:/cgi- bin/ 盡管在標準沒有談到這個, 但是這種方式很容易出問題。404 重定向到另外一- 個頁面:當 Robot 很多沒有設置 robots. txt 文件的站點時 ,會 被自動404 重定向到另外一個 Htm1 頁面。 這

44、時 Robot 常常會以處理 robots.txt 文件的方式處理這個 Htm1 頁面文件。雖然一般這樣沒有什么問題,但是最好能放一個空白的 robots. txt 文件在站點根目錄下。采用大寫。 例如USER- AGENT: EXCITE第 23 頁 共57 頁ucweb SEO 規(guī)范DISALLOW:雖然標準是沒有大小寫的, 但是目錄和文件名應該小寫:User- agent:botDisallow:語法中只有 Disallow, 沒有 Allow!錯誤的寫法是:User- agent: BaiduspiderDisallow:/ john/Allow:/ jane/忘記了斜杠/錯誤的寫做:

45、User- agent: BaiduspiderDisallow: css正確的應該是User- agent: BaiduspiderDisallow:/ css/Baidu 方面有介紹 robots. txt 文件的準確性的說明:2.9.6Robots METARobots. txt 文件主要是限制整個站點或者目錄的搜索引擎情況, 而Robots META則主要是 個個具體的頁面。 和其他的 META (如 使用的語言、頁面的描述、 等)一樣, Robots META也是放在頁 第 24 頁 共57 頁ucweb SEO 規(guī)范面的<head></ head>中,專門用

46、來告訴搜索引擎 RB 0 TS 如何抓取該頁的內容。Robots META中沒有大小寫之分, name=” Robots” 表示所有的搜索引擎, 可以某個具體搜索引擎寫為 name=” Baidu Spider” 。 content 部分有四個指令選項: index、noindex、fo 11 ow、nofo 11 ow, 指令間以” ,” 分隔。 INDEX 指令告訴搜索人抓取該頁面;FOLLOW 指令表示搜索人可以沿著該頁面上的繼續(xù)抓取下去;Robots Mete的缺省值是 INDEX 和 FOLLOW,只有 inktomi 除外,對于它, 缺省值是 INDEX, NOFOLLOW這樣,

47、一共有四種組合:<METENAME=” ROBOTS”CONTENT=” INDEX, FOLLOW” ><METENAME=” ROBOTS”CONTENT=” NOINDEX, FOLLOW” ><METENAME=” ROBOTS”CONTENT=” INDEX, NOFOLLOW” ><METENAME=” ROBOTS”CONTENT=” NOINDEX, NOFOLLOW” >其中 <METENAME=” ROBOTS”CONTENT=” INDEX, FOLLOW” > 可以寫成 <METENAME=” ROBOT

48、S”CONTENT=” ALL” ><METENAME=” ROBOTS”CONTENT=” INDEX, NOFOLLOW” > 可以寫成<METENAME=” ROBOTS”CONTENT=” NONE” >需要注意的是: 上述的 robots.txt 和 Robots META限制搜索引擎機器人( ROBOTS)抓取站點內容的辦法只是一種規(guī)則,需要搜索引擎人的配合才行, 并不是每個 ROBOTS 都遵守的。目前看來,絕大多數(shù)的搜索引擎人都遵守 robots. txt 的規(guī)則,而對第 25 頁共57 頁ucweb SEO 規(guī)范于 Robots META, 目前

49、支持的并不多, 但是正在逐漸增加, 如著名搜索引擎 就完全支持, 而且還增加了一個指令“ achive” ,可以 限制 是否保留網頁快照。 例如:<METANAME=”bot” CONTENT=index, fo 11 ow, noarchive" >表示抓取該站點中頁面并沿著頁面中抓取, 但是不在上保 留該頁面的網頁快照。三.SEO 注意事項3.1 框架網頁1 、 什么是框架網頁? 框架曾經一度很受歡迎,現(xiàn)在是大不如前了。一個基于框架的 , 從覽器窗口看是被分為兩個或者的框架,每個框架是一個web 頁面。如圖:使用框架會導致許多麻煩。有許多瀏覽器并不能很好的處理框架,

50、事實上, 許多能兼容框架的瀏覽器并不能真正兼容, 往往在載入框架的時候力不從心了。 另外, 許多設計者使用框架并沒有進行充分的測試。 他們設計第 26 頁 共57 頁ucweb SEO 規(guī)范是在高分辨率下進行的, 沒有, 這樣的結果是導致低分辨率的用戶是無法使用的。2 、 站在搜索引擎的角度看,框架會引起下面的問題: 一些搜索引擎在理解框架定義的時候會犯迷糊和難以分辨框架定義的頁面和當前實際頁。即使搜索引擎索引了頁面,它也不是按照框架的定義那樣,在框架中定義的頁面屬于框架, 而是將框架中定義的頁面是的頁面加以索引。在下面的情況下你可能會遇到麻煩,你發(fā)現(xiàn)不能指向具有細節(jié)內容的頁面: 1 、有活動

51、的時候,別的只能進入到你的前臺頁面,而不能進入你具有細節(jié)內容的頁面。2 、如果你了點擊的,那實在是不幸,你的客戶不能直接進入你有詳細介紹的頁面。3 、 如果你的加入了購物類的地址目錄列表, 在這種情況下,會遇到同樣的問題。4 、 按照 web 標準, 一個網頁唯一對應一個 URL 地址, 而框架應用中,往往是一個 URL 地址對應多個框架。 這種情況下, 搜索引擎就無所適從了。5 、 Goog 1 e 等搜索引擎在處理框架時,是把請求返回的頁面從框架中剝離出來。3 框架 下面是框架定義舉例:<html><head>第 27 頁 共57 頁ucweb SEO 規(guī)范<

52、/ head><frameset rows=” 110 ,* ><frame src=” nacbar. htm” ></ frame src=” main. htm” ></ frameset></ html>這段代碼描述了怎樣創(chuàng)建框架。它告訴瀏覽器創(chuàng)建兩行,即兩個框架,其中位于頂端的框架行高為 110 象素; 另外, 處于下方的框架行高為瀏覽器所能定義的余下的象素, 用 *" 表示。 并且定義將" navbar. htm" 放在位于上面的框架中; main. htm 在位于下方的框架中。許多大型

53、的搜索引擎能夠通過這個框架找到通往 navbar. htm 和main. htm 文件的路徑, 比如 Goog 1 e。 但是, 一些比較老一點的系統(tǒng)就不能正常顯示了。但是,即使頁面被 的索引,被用來指向內部框架的頁面是被作為獨立的頁面顯示的, 這并不是設計者所希望顯示的那樣, 但是, 我們可以作些 如下的改進:在框架定義的時候提供必要的信息供搜索引擎索引。確保所有的搜索引擎能夠找到路徑通向主站點。確保頁面以正確的框架設置顯示。為搜索引擎提供必要的索引信息 我們首先要做到的事情是,在定義框架的頁面代碼中加入供搜索引擎索引的信息。首先, 加一個 tit1e 和 meta , 像這樣:<Html>第 28

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論