李亚涛:python判断日志中的IP是否为百度蜘蛛

      李亚涛:python判断日志中的IP是否为百度蜘蛛已关闭评论

大家好,今天给大家分享一下如何利用python判断网站日志中的IP是否为百度蜘蛛IP

大家知道网站日志其实是后缀是.log的文件,自己有网站的可以下载日志,比如我下载的日志文件:

打开如下图:

 

如果判断日志中的IP是否为百度蜘蛛IP,我们需要利用到模块socket

首先我们肯定要获取这个文件里的所有IP,然后再逐个去判断。

由于很多同学可能没有这个日志文件,通常也比较大,所以我就简单写一个列表,给大家演示一下:

代码与运行效果如下:

 

大家可以看到,我们利用了socket.gethostbyaddr(ip)这个方法,其实这个方法获取到的信息是一个元组,我们取无组的第一个元素作为特征判断是否为百度蜘蛛

好了,今天就简单分享到这里,你学会了吗?

李亚涛简介-一个没有才华的python程序员,关注我学习更多python知识