全文預覽已結束
下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
最近百度似乎在做一些更新調整,很多站長抱怨百度收錄困難!甚至在尋找了大量鏈接后百度都不收錄你的站,是不是百度真的不愿意收錄新站呢?可能確實做了一些調整,但是應該是站長方法不對。下面我給大家講講搜索引擎收錄過程,并且用一個案例來說明怎么讓百度更快的收錄你的網站。搜索引擎收錄過程:1、抓取網頁每個獨立的搜索引擎都有自己的網頁抓取程序(spider)。Spider順著網頁中的超鏈接,連續(xù)地抓取網頁。由于互聯(lián)網中超鏈接的應用很普遍,理論上,從一定范圍的網頁出發(fā),就能搜集到絕大多數(shù)的網頁。 2、處理網頁 搜索引擎抓到網頁后,還要做大量的預處理工作,才能提供檢索服務。其中,最重要的就是提取關鍵詞,建立索引文件。其他還包括去除重復網頁、分析超鏈接、計算網頁的重要度。 3、提供檢索服務 用戶輸入關鍵詞進行檢索,搜索引擎從索引數(shù)據(jù)庫中找到匹配該關鍵詞的網頁;為了用戶便于判斷,除了網頁標題和URL外,還會提供一段來自網頁的摘要以及其他信息。 這是摘自的一段總結:首先蜘蛛讀取抓取站點的URL列表,取出一個站點URL,將其放入未訪問的URL列表(UVURL列表)中,如果UVURL不為空剛從中取出一個URL判斷是否已經訪問過,若沒有訪問過則讀取此網頁,并進行超鏈分析及內容分析,并將些頁存入文檔數(shù)據(jù)庫,并將些URL放入已訪問URL列表(VURL列表),直到UVRL為空為止,此時再抓取其他站點,依次循環(huán)直到所有的站點URL列表都抓取完為止。如何更快被百度收錄:先給大家看個成功案例(圖一),當天建立的網頁當天被收錄。另外還有幾個案例,我不一一截圖了,最快有個域名我當天晚上7點多才注冊的,更晚些時候就被收錄了,我給大家一個方法,大家可以按照此方法做:1. 建立一個單頁面,從百度百科找一段關于網站關鍵詞的介紹,再去其他地方找另外一種介紹。如網站做SEO,就找SEO在百科的解釋,再去維基百科找找seo的介紹,二者結合拼湊成一個單頁面;2. 單頁面命名為index.htm或者default.htm,成為網站的首頁。再去百度的登錄入口去登錄一次你的網站:/search/url_submit.html3. 無需任何外部鏈接,最多兩天后你將在搜索引擎看到你的網站在當天就被收錄了!比如 你27日登錄的,雖然百度可能27日就收錄了你的站,但是你可能需要再過一兩天才能看到被收錄。/ 4. 以上方法我已經測試了數(shù)十個域名,屢試不爽!收錄后再改版你的網站吧最后給大家一些收錄的建議:核糖體/ 1. 收錄前就把首頁title的關鍵詞定義好,避免更改關鍵詞太快,引起搜索引擎反感2. 主動去登錄你的網站,而不需要急著去找任何外部鏈接(新站的目標是被收錄)3. 安裝好搜索引擎工具條/ 4. 單頁面文件不要太長太大,100K以內最好5. 隨時關注收錄情況,去搜索新站的網址或者site一下問題:我如何在 Sitemaps 中表示網址? 對于所有 XML 文件,任何數(shù)據(jù)數(shù)值(包括網址)都應使用以下字符實體轉義碼:& 符號 (&)、單引號 ()、雙引號 ()、小于 ()。還應確保所有網址遵循 RFC-3986 URI 標準、RFC-3987 IRI 標準以及 XML 標準。如果您要使用腳本來生成網址,通??梢允褂镁W址轉義的方式將其轉義為該腳本的一部分。并且您仍然需要對它們進行實體轉義。例如,以下 Python 腳本實體轉義 /view?widget=3&count2 以下是引用片段:$python Python2.2.2(#1,Feb242003,19:13:11) importxml.sax.saxutils xml.sax.saxutils.escape(/view?widget=3&count2) 以上示例所得網址為:/view?widget=3&count>2 問題:使用哪種字符編碼方法生成 Sitemaps 文件有關系嗎? 是的。您的 Sitemaps 文件應該使用 UTF-8 編碼。 問題:如何指定時間? 對此協(xié)議中的 lastmod 時間戳以及所有其他日期和時間,請使用 W3C Datetime 編碼。例如,2004-09-22T14:12:14+00:00。 此編碼允許您省去 ISO8601 格式的時間部分,例如:2004-09-22 也是有效的。然而,如果您的網站頻繁更改,則鼓勵您使用時間部分,以便抓取工具可獲取關于您網站的更全面的信息。 問題:如何計算 lastmod 日期? 對于靜態(tài)文件,這是實際的文件更新日期??梢允褂?UNIX 日期命令獲取此日期:以下是引用片段:$date-iso-8601=seconds-u-r/home/foo/www/bar.html 2004-10-26T08:56:39+00:00對于許多動態(tài)網址,您可以根據(jù)基本數(shù)據(jù)的更改時間或使用一些基于定期更新(如果可行的話)的近似值輕松地計算 lastmod 日期。使用一個近似日期或時間戳就可以幫助抓取工具避免抓取還未更改的網址。這將降低 Web 服務器的帶寬和 CPU 要求。 問題:我將 Sitemaps 放在哪里?強烈建議將 Sitemaps 放置在 HTML 服務器的根目錄中,即,將其放置在 /sitemap.xml.gz。 在某些情況下,您或許會希望在網站上針對不同的路徑創(chuàng)建對應的 Sitemaps 例如,如果在您的組織中,安全許可對應不同目錄劃分上傳權限。 我們認為如果您有上傳 /path/sitemap.xml.gz 的許可,那么您也可以通過 /path/ 報告元數(shù)據(jù)。 問題:我的 Sitemaps 可以有多大? Sitemaps 在壓縮時不應超過 10MB(10,485,760 字節(jié)),且最多可以包含 50,000 個網址。也就是說,如果您的網站包含的網址超過 50,000 個或 Sitemaps 大于 10MB,您需要創(chuàng)建多個 Sitemaps 文件,并使用 Sitemaps 索引文件。即使您的網站較小,但計劃的網址數(shù)量超出 50,000 個或文件大小超過 10MB,也應使用 Sitemaps 索引文件。 問題:我的網站擁有數(shù)千萬個網址;我可以采用某種方式只提交最近更改過的網址嗎? 您可以在少數(shù)頻繁更改的 Sitemaps 中列出已更新的網址,然后使用 Sitemaps 索引文件中的 lastmod 標記驗證這些 Sitemaps 文件。隨后,搜索引擎即可逐步抓取(只抓?。┻@些已更改的 Sitemaps。 問題:創(chuàng)建 Sitemaps 后會發(fā)生什么? 在創(chuàng)建 Sitemaps 后,您需要通知搜索引擎 Sitemaps 的位置。得到通知的搜索引擎就可以檢索您的 Sitemaps 并使網址可以由抓取工具抓取。 問題:需要完整地指定 Sitemaps 中的網址嗎? 是的。您需要在網址中提供協(xié)議(例如,http)。如果 Web 服務器有要求,您還需要提供尾隨斜線。例如,/ 是有效的 Sitemaps 網址,而 則不是。 問題:我的網站有“http”和“https”兩個網址版本。需要把它們都列出來嗎? 否。請在您的 Sitemaps 中只列出一種版本的網址。包含多個版本的網址可能導致抓取工具無法完整抓取您的網站。問題:我網站上的網址中包含會話 ID 號。需要將其刪除嗎? 是的。網址中包含會話 ID 號可能導致網站抓取不完整以及重復抓取。 問題:Sitemaps 中網址的位置是否會影響它的使用? 否。網址在 Sitemaps 中的位置不會影響搜索引擎對它的使用或識別方式。問題:我們網站上的一些網頁使用框架。我們應該提供框架組網址或框架內容的網址嗎? 請將兩種網址都包括進來。問題:可以壓縮 Sitemaps 嗎?或者需要以 gzip 壓縮嗎? 請使用 gzip 壓縮您的 Sitemaps。 問題:XML Sitemaps 中的“priority”提示會改變我的網頁在搜索結果中的排名碼? 否。Sitemaps 中的“priority”提示只表示在您網站上,某一特定網址與其他網址的相對重要性。 問題:有可以用作 XML Sitemaps 驗證依據(jù)的 XML 架構
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度地質環(huán)境監(jiān)測測量合同協(xié)議4篇
- 2025年中國稀土材料市場供需現(xiàn)狀及投資戰(zhàn)略研究報告
- 2025年度體育賽事贊助合同范本-@-10
- 2025年滌綸披巾項目可行性研究報告
- 2025年反絨革項目可行性研究報告
- 2025年度綠色建筑節(jié)能改造施工合同答辯狀
- 2025年度建筑節(jié)能工程施工合同規(guī)范范本
- 2025年素牛排項目投資可行性研究分析報告
- 2025年度大數(shù)據(jù)股份分配與智慧城市建設協(xié)議
- 2025年中國蒸汽發(fā)動機行業(yè)發(fā)展運行現(xiàn)狀及投資潛力預測報告
- 《工程電磁場》配套教學課件
- 遼寧省錦州市各縣區(qū)鄉(xiāng)鎮(zhèn)行政村村莊村名居民村民委員會明細及行政區(qū)劃代碼
- 改革開放的歷程(終稿)課件
- 職位管理手冊
- IPQC首檢巡檢操作培訓
- 餐飲空間設計課件ppt
- 肉制品加工技術完整版ppt課件全套教程(最新)
- (中職)Dreamweaver-CC網頁設計與制作(3版)電子課件(完整版)
- 行政人事助理崗位月度KPI績效考核表
- 紀檢監(jiān)察機關派駐機構工作規(guī)則全文詳解PPT
- BP-2C 微機母線保護裝置技術說明書 (3)
評論
0/150
提交評論