利用python自动扫描获取可用的http和https代理ip

获取代理ip的网址：http://www.66ip.cn/nm.html

检验是否代理成功的网址：http://pv.sohu.com/cityjson

import requests

import re

import time

from multiprocessingimport Process

def https_ip():

while True:

url ="http://www.66ip.cn/nmtq.php?getnum=&isp=0&anonymoustype=0&start=&ports=&export=&ipaddress=&area=1&proxytype=1&api=66ip" #获取https的ip网址

pattern =r'(.*?)<br />' #提取出ip+port的形式

url_many=requests.get(url).text

ip_list=re.compile(pattern).findall(url_many)

pattern2 =r'[\d.:]+'

#print(ip_list)

p =r'"cip": "(.*?)"'

for iin ip_list:

ip=re.compile(pattern2).findall(i)[0]

#print(ip)

check_url ="http://pv.sohu.com/cityjson" #检测时候代理成功的网址

v ='https://{0}'.format(ip)

proxy = {'https':v}

#print(proxy)

try:

ree = requests.get(check_url,proxies=proxy,timeout=5).text

rr = re.compile(p).findall(ree)[0]

if rr !='自己的真实ip':#判断是否已经代理成功

print("https://",ip)

except:

pass

time.sleep(3)

def http_ip():

while True:

url ="http://www.66ip.cn/nmtq.php?getnum=10&isp=0&anonymoustype=0&start=&ports=&export=&ipaddress=&area=0&proxytype=0&api=66ip"

pattern =r'(.*?)
'

url_many=requests.get(url).text

ip_list=re.compile(pattern).findall(url_many)

pattern2 =r'[\d.:]+'

#print(ip_list)

p =r'"cip": "(.*?)"'

for iin ip_list:

ip=re.compile(pattern2).findall(i)[0]

#print(ip)

check_url ="http://pv.sohu.com/cityjson"

v ='http://{0}'.format(ip)

proxy = {'http':v}

#print(proxy)

try:

ree = requests.get(check_url,proxies=proxy,timeout=5).text

rr = re.compile(p).findall(ree)[0]

if rr !='自己的真实ip地址':

print("http://",ip)

except:

pass

time.sleep(3)

if __name__ =="__main__":

p1 = Process(target=http_ip)

p2 = Process(target=https_ip)

p1.start()

p2.start()

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

利用python自动扫描获取可用的http和https代理ip

利用python自动扫描获取可用的http和https代理ip

相关阅读更多精彩内容

友情链接更多精彩内容