李亚涛:python判断日志中的IP是否为百度蜘蛛

大家好,今天给大家分享一下如何利用python判断网站日志中的IP是否为百度蜘蛛IP

大家知道网站日志其实是后缀是.log的文件,自己有网站的可以下载日志,比如我下载的日志文件:

打开如下图:

如果判断日志中的IP是否为百度蜘蛛IP,我们需要利用到模块socket

首先我们肯定要获取这个文件里的所有IP,然后再逐个去判断。

由于很多同学可能没有这个日志文件,通常也比较大,所以我就简单写一个列表,给大家演示一下:

代码与运行效果如下:


大家可以看到,我们利用了socket.gethostbyaddr(ip)这个方法,其实这个方法获取到的信息是一个元组,我们取无组的第一个元素作为特征判断是否为百度蜘蛛

好了,今天就简单分享到这里,你学会了吗?

李亚涛简介-一个没有才华的python程序员,关注我学习更多python知识

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容