登录注册写文章

网站URL优化

网站URL优化

域名不属于URL

搜索引擎喜欢静态代码

http://是网络协议，属于网址，https://是网络高级协议

URl称为网页地址，网址后面的内容是网民来源，URL层级越短越容易被抓取，有助于排名。

如何缩减织梦层级？

步骤如下：

织梦后台→系统→系统基本参数→删除 /a 保存（文档html默认保存路径）→核心→栏目管理→选择其中一个栏目更改→文件保存目录→一个 /a →高级选项→文章命名规则→Y 后面“/”改成“-”→生成

需要手动改，没有一键全部改

robots的协议

一、robots.txt协议

1，是纯文本协议，用于声明该网站中不想被蜘蛛访问部分，或者指定蜘蛛抓取的部分

2，不是固定，而是一种约定，需要蜘蛛自觉遵守的一种习俗

二、robots.txt的作用

1，防止私密或重要内容被搜索引擎抓取

2，节省服务器资源，从而提高服务质量

3，减少重复抓取，提高网站质量指定sitemap文件位置

三、robots.txt的常用语法 *是通配符

User-agent

：* 用户代理搜素引擎针对哪个搜素引擎蜘蛛，这里的*代表搜素引擎种类，*是通配符

1、AIIOW 允许：定义的允许蜘蛛抓取某个栏目或文件

2、AIIOW：/cgi-bin/：定义是允许访问cgi-bin目录

3、AIIOW：/*htm$ :允许访问意htm为后缀的URL

4、Disallow 不允许：禁止蜘蛛抓取某个栏目或文件

5、User-agent/admin/禁止抓取admin目录

6、Grawi-delay 延迟时间间隔抓取时间

7、Visit-time:0100-1600 在每天的01:00-16:00允许抓取

8、Request-rate：20/1m 0900-1359 允许在每天9:00-13:59允许抓取，以每秒20抓取

仅允许百度蜘蛛、谷歌蜘蛛访问格式为：

Userr-agent:baiduspider

Allow:/

Userr-agent:Guglebot

Allow:/

Userr-agent:*

Disallow:/

蜘蛛是从上而下爬行的，假设网站只有A,B文件夹，只想让百度蜘蛛看到A文件，格式为：

Userr-agent:baiduspider

Allow:/A

Disallow:/B

Userr-agent:*

Disallow:/

网站地图

网站地图可以理解成是一个文件，包含了自己网站很多重要的链接，蜘蛛可以通过网站地图提高工作效率，能被快速收录页面，一般是和robots.txt放在一起

如何生成网站地图？

百度搜索sitemap→点击小爬虫→输入域名→生成→选择后缀为XML的→出现代码（整篇复制）→桌面新建文本文档，改名sitemap.xml→用记事本打开→粘贴代码

在桌面新建一个robots.txt文本文档，在尾部加上sitemap:http://网址/sitemap.xml，用ftp工具上传到根目录里。

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

关于购物网站及网页小游戏的robots协议
Robots协议（也称为爬虫协议、机器人协议等）的全称是“网络爬虫排除标准”（Robots Exclusion P...
十三不好听阅读 4,940评论 0赞 0
爬虫的"盗亦有道"-Robots协议
网络爬虫的君子协议网络爬虫的尺寸网络爬虫引发的问题性能骚扰法律风险隐私泄露网络爬虫的"性能骚扰"web...
若与阅读 33,783评论 2赞 43

网站 robots.txt 文件编写
网站 robots.txt 文件编写 Intro robots.txt 是网站根目录下的一个纯文本文件，在这个...
天天向上卡索阅读 4,908评论 0赞 2
robots.txt 暂时禁止、允许收录整个网站
robots.txt写法大全和robots.txt语法的作用 1如果允许所有搜索引擎访问网站的所有部分的话我们可...
撸猫真君阅读 13,849评论 0赞 7
苹果将更改iOS 软件开发计划
据悉，苹果公司决定更改2018年的 iOS 软件开发计划，推迟了一些功能，以便重点解决性能和质量问题。苹...
追忆021阅读 2,206评论 0赞 0

赞1赞

赞赏

手机看全文