urllib代理服务器设置

ip代理的一个网站,如果代理信息有误或者代理无法使用则会发生被远程主机拒绝访问等错误

#1.首先建立一个名为use_proxy的自定义函数,该函数的主要实现使用代理服务器来爬取url的功能
#2.该函数有两个参数,一个为代理地址,另一个为url地址
#3.使用urllib.request.ProxyHandler()来设置对用的代理服务器信息
#4. 使用urllib.request.install_opener()创建全局opener对象
import urllib.request

def use_proxy(proxy_addr,url):
    proxy = urllib.request.ProxyHandler({'http':proxy_addr})
    opener = urllib.request.build_opener(proxy,urllib.request.HTTPHandler)
    urllib.request.install_opener(opener)
    data = urllib.request.urlopen(url).read().decode('utf-8')
    return data

proxy_addr = '60.178.1.122:8081'
data = use_proxy(proxy_addr,'http://www.baidu.com')
print(len(data))
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 135,131评论 19 139
  • 1. 网络基础TCP/IP HTTP基于TCP/IP协议族,HTTP属于它内部的一个子集。 把互联网相关联的协议集...
    yozosann阅读 3,485评论 0 20
  • 上一篇《WEB请求处理一:浏览器请求发起处理》,我们讲述了浏览器端请求发起过程,通过DNS域名解析服务器IP,并建...
    七寸知架构阅读 81,370评论 21 356
  • 序 在英国有一首民谣: 薰衣草呀,遍地开放。 蓝花绿叶,清香满怀。 我为国王,你是王后。 抛下硬币,许个心愿 。 ...
    咬痕吖阅读 245评论 0 1
  • 第一篇博客,多多指教。 多文件的上传问题 首先File Transfer 插件,可以download、upload...
    龙猫神阅读 580评论 1 3