每个站长都知道。做网站想要加快收录的速度,必须要在想被收录的页面添加百度的自动推送代码,此代码让用户每次浏览该页面的时候都会向百度提交一次。省去了站长的人工操作,极大的提升了收录效率。但是这代码中每一行的含义却少有人知道,仅知道此代码可以自动推送,却不知道是如何实现的,假如知道每一行的含义,则可以根据需要进行自行设置,以降低代码的冗余,提升运行效率。代码如下:
<script>
(function(){
var bp = document.createElement('script');
var curProtocol = window.location.protocol.split(':')[0];
if (curProtocol === 'https') {
bp.src = 'https://zz.bdstatic.com/linksubmit/push.js';
}
else {
bp.src = 'http://push.zhanzhang.baidu.com/push.js';
}
var s = document.getElementsByTagName("script")[0];
s.parentNode.insertBefore(bp, s);
})();
</script>
我们来仔细看看这个JS代码,它首先是用if函数判断了当前浏览的网址协议是经过SSL加密过的https或者是其他类型的网址,根据不同的类型分别访问了2个JS文件。之后会将访问的JS文件内容生成脚本插入到当前的url页面中,运行该脚本则会读取对应的一个非常小体积的gif图像,在这个过程中将url地址推送到百度中。
分析了以上代码我们会发现,它在判断的时候会加载2个百度的js资源,这个可以根据用户自己的url地址类型去掉不必要的判断,并且可以将其直接替换为gif地址。另外一点就是当访问的url地址为动态地址,带有非常多的参数的话,是很不利于搜索引擎爬虫的抓取的。我们在之前使用MIP的时候接触了一个非常有用的标签,那就是canonical标签,可以使用该标签对这一点进行优化。
优化后的代码如下:
<script>
(function(){
var canonicalURL, curProtocol;
//Get the <link> tag
var x=document.getElementsByTagName("link");
//Find the last canonical URL
if(x.length > 0){
for (i=0;i<x.length;i++){
if(x[i].rel.toLowerCase() == 'canonical' && x[i].href){
canonicalURL=x[i].href;
}
}
}
//Get protocol
if (!canonicalURL){
curProtocol = window.location.protocol.split(':')[0];
}
else{
curProtocol = canonicalURL.split(':')[0];
}
//Get current URL if the canonical URL does not exist
if (!canonicalURL) canonicalURL = window.location.href;
//Assign script content. Replace current URL with the canonical URL
!function(){var e=/([http|https]:\/\/[a-zA-Z0-9\_\.]+\.baidu\.com)/gi,r=canonicalURL,t=document.referrer;if(!e.test(r)){var n=(String(curProtocol).toLowerCase() === 'https')?"https://sp0.baidu.com/9_Q4simg2RQJ8t7jm9iCKT-xh_/s.gif":"//api.share.baidu.com/s.gif";t?(n+="?r="+encodeURIComponent(document.referrer),r&&(n+="&l="+r)):r&&(n+="?l="+r);var i=new Image;i.src=n}}(window);})();
</script>
从这个优化过后的代码中引入了canonical标签,无论用户访问的url地址带有什么样的参数,均会返回canonical标签唯一对应的url地址,大大减少搜索引擎爬虫的负担,并减少搜索引擎爬虫对同一页面的抓爬次数,这对于具有大量动态url的网站来说是非常大的提升。另外从优化后的代码中也可以看到,使用了一个三元运算来对url的协议类型进行判定,判定后的结果会直接访问百度对应的gif地址,从而去除了之前代码访问JS脚本的操作,也在一定程度上对页面的性能进行了优化,提升了页面运行的效率。
在使用优化后的代码需要注意的是
1、将r=localcanonicalURL的值修改为用户自己的canonical标签所对应的url的值;
2、时常访问gif地址,确保地址正确可以访问,否则代码会失效,需进行手动更新。