Sitemap是什么?
站點地圖(Sitemap)是站長用來通知搜索引擎在他們的站點上可以爬行的頁面的一種簡單方法。在其最簡單的形式,一個網站地圖是一個XML文件,列出一個站點的URL以及額外的元數據對每個URL(上次更新時,它通常多長時間發生變化時,是多么的重要,相對于其他網站的URL),以便搜索引擎可以更明智地爬行。
網絡爬蟲通常會從網站和其他網站的鏈接中發現頁面。Sitemaps補充這個數據允許爬蟲支持站點地圖接站點地圖中的所有url和了解這些url使用相關的元數據。使用Sitemap協議并不能保證web頁面包含在搜索引擎中,但是提供了一些提示,讓web爬蟲能夠更好地爬行您的站點。
怎樣制作sitemap?
一、手動標準版的Sitemap文件如下所示:
urlset:這個表情是必須的,詞標簽聲明了Sitemap協議的版本
url:必須的,是它下面所有網址的母標簽
loc:必須的,頁面永久鏈接地址
lastmod:這個是可選標簽,表示頁面最后修改時間
changefreq:可選標簽,代表頁面更新頻率。
priority:可選標簽,表示URL相對于其他的優先權,可選范圍:0.0-1.0 數值越大,說明越重要。
手動制作Sitemap的優點:制作的文件清晰簡單,同時可以自己設定一些自己認為比較重要的URL告訴搜索引擎這個頁面相對重要的程度,如我們可以通過設定priority的值來依次設定首頁、欄目頁的重要程度,當然評判還是以搜索引擎的標準為主。缺點:對于一些中大型網站,頁面眾多很難人工實現。
二、通過一些工具
網上有很多sitemap地圖生成的方法,比如在線生成、軟件生成等(具體什么軟件,大家可以在百度搜下就可以,我就不說出軟件了,免得以為我打廣告),另外現在很多的CMS或博客的程序都自帶一些網站地圖生成插件,我們只要安裝插件使用就行了。
優點:簡單方便,只要輸入你網站的地址,確認就可以給你生產一個網站地址
缺點:會生成很多不必要的標簽。
這里值得一提的是,Sitemap 最多可以列出5萬個URL,且文件不能超過10MB,如果需要收錄的超過,就需要分詞多個Sitemap,但一個網站最多可以有1000個Sitemap。
第三步:Sitemap的提交
將制作好的Sitemap 文件上傳到網站的根目錄下,然后通知搜索引擎,我們可以通過站長工具后臺提交網站地圖文件,還有一種途徑是在robots.txt文件中通知搜索引擎網站地圖文件位置,只要在robots.txt文件中加入一句:Sitemap: http://www.ariproduct.com/sitemap.xml 即可。個人比較青睞。大家都知道robots.txt是蜘蛛(當然谷歌的叫機器人,反正都是一回事了)訪問網站首先要看的文件,他要根據你的指令對網站進行抓取,而把sitemap寫入到robots.txt中大大提高了蜘蛛的效率,這對網站的優化尤其重要
另外就通過修改網站的源文件為地圖增加錨文本,一定要記得是全站的鏈接哦。那樣才能增加Sitemap 的權重,有效的吸引蜘蛛爬行。
【溫馨提示】通過Sitemap網站題圖,引導通知搜索引擎有這些頁面存在,讓他去看看,如果頁面達到搜索引擎的要求,他就會收錄,但如果頁面沒達到要求的話搜索引擎也是不會收錄的,所以布瑞恩提醒各位SEOer要首先做好網站頁面質量。若您對上文有任何疑問,或者是想要咨詢其他相關問題,歡迎點擊頁面右側的在線咨詢服務。