自动提交网站404死链到搜索引擎Shell脚本

大家都知道每个搜索引擎的站长平台都有死链提交工具,为什么要提交死链?引用百度站长平台原话:"当网站死链数据累积过多时,并且被展示到搜索结果页中,对网站本身的访问体验和用户转化都起到了负面影响。另一方面,百度检查死链的流程也会为网站带来额外负担,影响网站其他正常页面的抓取和索引"。 既然要提交死链,那么有没有什么办法能自动收集死链然后提交呢,答案是肯定的,通过Shell脚本每天获取404链接然后提交。

0x01 获取404链接

#!/bin/bash
 
#定义蜘蛛UA信息(默认是百度蜘蛛)
 
UA=+http://www.baidu.com/search/spider.html
 
#前一天的日期(nginx日志)
 
DATE=`date +%Y-%m-%d -d "1 day ago"`
 
#定义日志路径
 
logfile=/opt/nginx/logs/yangfannie.com.log_${DATE}.log
 
#定义死链文件存放路径
 
deathfile=/xxxx/deathlink.txt
 
#定义网站访问地址
 
website=http://yangfannie.com
 
#分析日志并保存死链数据
 
for url in `awk -v str="${UA}" '$9=="404" && $15~str {print $7}' ${logfile}`
 
do
 
grep "$url" ${deathfile} >/dev/null || echo ${website}${url} >>${deathfile}
 
done

然后把脚本通过定时任务每天跑一次即可。

0x02 提交死链

404链接获取到了,接下来就可以上百度站长平台提交了。


站长平台页面

PS:由于脚本是通过nginx的log来获取404链接的,这边就会出现个问题是第一次获取404链接时可能会获取不全的问题,这边可以通过360站长平台的网站安全检测工具来检测出所有的404页面。


博客地址:http://yangfannie.com

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 搜索引擎优化(Search engine optimization,简称SEO),指为了提升网页在搜索引擎自然搜索...
    翻滚吧海阔天空阅读 9,465评论 5 14
  • 网站运营人员对于死链这个概念一定不陌生,网站的一些数据删除或页面改版等都容易制造死链,影响用户体验不说,过多的死链...
    GavinHsueh阅读 1,774评论 0 2
  • 平淡的心情,哀伤的月 时光如影,岁月如梭 青春已成定局,记忆已经删减。该记的不熟悉了,该忘的却还深刻 人生很短,我...
    清风不驻你阅读 1,124评论 6 4
  • 雨,沉沦在世人的眼里。雨声淅沥,我也愿是一滴雨,一滴澄澈而纯净的雨。至少,淋过雨后仰头看天,更清亮了许多 ...
    白色蔷薇香阅读 2,795评论 0 2
  • 我们已经知道系统的力量训练需要系统的计划 根据不同的需求,有不同的规则 其中次数、组数是根据健身者不同的目标制定的...
    全球健身指南阅读 8,631评论 0 3