首先,一些在网上提到的解决办法其实并没有什么用。
比如有的说页面上的链接用地址有帮助,其实小偷程序都会自动替换网址,用相对地址还是地址没什么差别。
还有的说页面上加上网站链接、网站名称、版权声明之类的,搜索引擎会识别哪个是正版。但镜像小偷程序连链接带文字都可以全部自动替换,这么做并没有用。
发现镜像网站后的处理原则就是让镜像网站不能在镜像域名上显示你的内容。考虑到镜像网站是要实时访问和调用被镜像的页面的,所以可以考虑几个方法:
(1)比如用JS代码检测一下正在被打开的页面是不是在自己的域名上,是的话正常显示,不是的话(域名是镜像网站时)强迫转向到自己域名。不过这种方法只对用户有效,搜索引擎不执行JS,还是会抓取到镜像内容。也可以用PHP写脚本判断和转向。
(2)另一个直接的方法是屏蔽镜像网站来访问的IP地址。先查一下镜像网站服务器IP。把对方主机IP先屏蔽了。不过镜像网站来实时抓取用的IP大部分情况下不是域名主机IP,可能是CDN,可能是伪造IP,也可能是多IP的服务器。要发现必须屏蔽的IP,需要查看网站原始日志。我的一个小窍门是,访问镜像网站上一个很少人会访问的页面,比如翻页第70页,然后马上查看日志,这个页面被访问的IP就是应该屏蔽的IP:
屏蔽了这个IP,再访问镜像网站就变成403错误了:
不知道页脚的友情链接是镜像网站自己加的?还是卖程序的人强制加的?
镜像网站经常是会伪造或实时轮换IP地址的,如果屏蔽一个IP网站还能访问,就再访问翻页69页、68页等等,找到更多IP。屏蔽也可以屏蔽IP段。我的经验是,通常镜像网站不会使用超过10个IP地址。
脚本功能就是显示访问的IP,然后自己访问一下小偷镜像网站的脚本网址,页面上就直接显示镜像网站访问你服务器时的IP了。如果镜像网站替换了URL,这个方法就不好用了。无论怎样,日志中是一定有的。
(3)通过域名、title即轻松判断为镜像的恶劣站群,如果依然在各关键词下获得排名,可以通过站长平台进行反馈。
(4)无法快速区分真假的站点,需要保护自我权益的站点可以向百度投诉,并提供各种资质证明,会有百度法务部的员工审核处理。在这里提醒各位站长,请尽可能提供最全最有说服力资质证明,包括且不限于网站备案证明、品牌营业证明等,以帮助工作人员快速判断。
(5)如果站长发现镜像站点同时做恶劣赌博、色情内容,站长可以投诉(http://jubao.baidu.com/jubao/),百度公司相关员工会进行处理。
总结:处理网站被镜像的方法基本就是这些,如果被镜像的网站站已经死链或者在相关关键词下没有排名,那证明镜像站点已被反作弊策略识别并处理,被镜像的站长也就不用担心了。