python 代理ip

目标网址 http://lab.crossincode.com/proxy/
目的:获取稳定的ip,这是一个'Crossin的编程教室'的编程公众号提供的一个ip池,我相当于是二次提取.但是可用性够高,粗算了一下ip可用性70%左右,算是很好的池子了.以下是我的IP提取代码,file的位置自己改吧.

import requests
from parsel import Selector
file='F:/Python/精品收藏代码/proxies_my.json'
f=open(file,'w+')#覆盖用w+,新增用a+
url='http://lab.crossincode.com/proxy/'
header={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3112.101 Safari/537.36'}
r=requests.get(url,headers=header)
r.encoding='utf-8'#网页上提供的charset是utf-8
html=Selector(text=r.text)#Selecotor这个模块非常好用
response=html.xpath("//table[@class='table table-bordered proxy-index-table']/tr")
print(len(response))
def proxydownload(s):
    try:
        print(s)
        f.write(s+"\n")
    except Exception as e:
        print(e)
        pass
n=1
for i in range(len(response)-1):
    types=html.xpath("//table[@class='table table-bordered proxy-index-table']/tr/td[4]/text()")[i].extract().strip()
    if types:#选择https类型
        print(n)
        ip=html.xpath("//table[@class='table table-bordered proxy-index-table']/tr/td[1]/text()")[i].extract().strip()
        api=html.xpath("//table[@class='table table-bordered proxy-index-table']/tr/td[2]/text()")[i].extract().strip()
        types=html.xpath("//table[@class='table table-bordered proxy-index-table']/tr/td[4]/text()")[i].extract().strip()
        types=types[-5:]
        ips=ip+":"+api
        s='{"'+types+'"'+":"+'"'+types+'://'+ips+'"}'
        n+=1
        proxydownload(s)
    else:
        pass
f.close()
print('运行完成')

获得的ip如图

_T1P@LI%EJ8)VP3Y_%JR85H.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 135,080评论 19 139
  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 173,886评论 25 709
  • 1. Java基础部分 基础部分的顺序:基本语法,类相关的语法,内部类的语法,继承相关的语法,异常的语法,线程的语...
    子非鱼_t_阅读 31,786评论 18 399
  • 最近看的一本《天才在左,疯子在右》,说实话,这是我最近看的几本书里唯一一本不会让我打瞌睡的书,里面的每一篇文章都让...
    灬冰蝶灬阅读 587评论 0 0
  • 主题:refocus和时间管理 材料中关于“”时间是感情和状态“”这样的定义很刷我的认知,仔细读来的确如此。我们在...
    汪圆圆阅读 170评论 0 1