XML Sitemap简介

什么是XML Sitemap

sitemaps是一个XML文件,其中包含站点中所有需要被index的page URLs。Google Search engine bot根据sitmap的内容crawl和indexing你的网站。

SiteMap可以被理解成一个网站(website)的url map(site map),这个map可以帮助Google迅速找到你的站点中所有的页面(或者是所有的link)。

即使你的主站并没有包含你的网站中的所有的link,只要link包含在这个sitemap中,google不仅会将主站的所有内容全部爬出,而且会读取到你的sitemap,将sitemap中的所有url对应的页面内容全部都爬出。当你站点中所有的page的内容都被google爬走后,就保证了一旦有人在google做search,你的站点就可能出现在Search Result中。

如果google不能够爬到你的页面,那么就相当于搜索引擎不知道你的存在,那么不论在任何search 结果中,你都看到不到你的页面。

这样一看来,sitemap对于你的页面在google的search result中的ranking可谓是及其重要了。

XML SiteMap Index File

通常我们会建立一个XML SiteMap Index file,这个文件相当于是一个索引,将不同的内容放到不同的xml sitemap文件中,因为这样做有两个好处:

  • 结构清晰,分层清晰
  • 数量限制
    如果你的website特别大,有很多的link,那么你就需要这样一个XML SiteMap Index file,将link拆分到xml中。这是因为一个单独的xml sitemap文件最好就放置5000个URL,有利于文件load的perfermance。

XML Sitemap File

由URL组成
这些URL就相当于是直接告诉google我们有这些link,你可以直接爬

Which pages should be in your XML sitemap?

如果你希望你网页中的某一个页面出现在search result中,那么就必须要将这个页面放到sitemap中

如果你不希望你网页中的某一个页面出现在search result中,比如还没有完全做完的页面(用户体验可能不是很好),那么就不能写在你网站的sitemap中

例子

对于网站中的搜索页面,如果进行搜索的时候,有某一个搜索页面没有results,那么在这种情况下,我并不想让google爬到这个页面,原因:

  • 这个页面中没有任何有用的信息, 就送被google 爬到也只是一些no result的关键字

  • 理论上所有的no resulr的page都基本长得一样,那么必然会导致很多SRP URL,URL不同但是对应了一样的内容,google会认为我们cheat它

因此我们肯定希望不让google爬到我们这种页面上,那么可以选择在sitemap中直接删除

Where do I place my Sitemap?

方式一

google强烈建议您将Sitemap放在HTML服务器的根目录下:

如果你的html请求是:

http://example.com/index.html

那么你的sitemap最好在:

http://example.com/sitemap.xml.

因为这就相当于你跟google search engine 提前约定好的位置,google search engine会到这个位置寻找你站点的sitemap.

方式二

将你的sitemap file link(有时候我们会将sitemap xml file放在S3上)放在你网站的footer中,这样search engine bot就可以快速的发现你的sitemap,然后高效的crawl/index

Note

sitemap中列出的所有URL必须和sitemap的host相同,比如,如果sitemap在http://www.example.com/sitemap.xml,那么sitemap中绝对不能包含http://subdomain.example.com. If the Sitemap is located at http://www.example.com/myfolder/sitemap.xml, it can't include URLs from http://www.example.com.

How big can my Sitemap be?

Sitemaps should be no larger than 10MB (10,485,760 bytes) and can contain a maximum of 50,000 URLs. These limits help to ensure that your web server does not get bogged down serving very large files. This means that if your site contains more than 50,000 URLs or your Sitemap is bigger than 10MB, you must create multiple Sitemap files and use a Sitemap index file. You should use a Sitemap index file even if you have a small site but plan on growing beyond 50,000 URLs or a file size of 10MB. A Sitemap index file can include up to 1,000 Sitemaps and must not exceed 10MB (10,485,760 bytes). You can also use gzip to compress your Sitemaps.

How To Submit Sitemap To Google Search console

What is Google Search console

那当你已经给你的网站创建好了一个sitemp的XMl File, 除了我在上面提到的两个可以放置XML的位置,你其实还可以放在任意的地方,比如你可以扔在S3上。 那么问题就来了,你需要告诉Google到哪里找我的XML文件,这时候Google Search console,就相当于是一个配置工具,告诉google我的网站域名是啥,下次遇到我的网站的时候应该去哪找我的XML sitemap

How to use

我们通常使用google的工具Google search console 去管理sitemap。

image.png

你可以先为你自己的站点产生一个sitemap file,然后在上图进行配置,

  • 你可以给你的站点提供非常多的sitemap
  • 你可以给你的站点配置sitemap index file

一旦提交之后,google会依次找到你的提交的sitemap然后对sitemap中的url进行crawl。

例子

如上图,我们给网站www.shoutmeloud加sitemap, 相当于google会去www.shoutmeloud/sitemap_index.xml/www.shoutmeloud/post_tag-sitemap.xml...等等爬数据

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,293评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,604评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,958评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,729评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,719评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,630评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,000评论 3 397
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,665评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,909评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,646评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,726评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,400评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,986评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,959评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,996评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,481评论 2 342

推荐阅读更多精彩内容