from bs4 import BeautifulSoup
import urllib.request
import urllib
def pachong(url):
headers = {'User-Agent':
'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36'}
req = urllib.request.urlopen(url)#创建对象
con = req.read()
soup = BeautifulSoup(con,'html.parser')
print(con)
mygirl = soup.find_all('img')
for girl in mygirl:
link = girl.get('src')
print(link)
global x
urllib.request.urlretrieve(link,'image\%s.jpg'%x)
x = x+1
print("正在下载%s张"%x)
url=('https://www.dbmeinv.com/?pager_offset=2')
x=0
for i in range(5):
pachong('https://www.dbmeinv.com/?pager_offset=%s'%i)
# soup = BeautifulSoup(open('test.html'),'html.parser')
# # print(soup.prettify())
# html ='<title>我是科比</title>'
# soup = BeautifulSoup(html,'html.parser')
#print(soup.title)
#soup.prettify() 打印所有内容
#https://www.dbmeinv.com/?pager_offset=2
#'https://www.dbmeinv.com/?pager_offset={}'.format();
#User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36
python爬取网页图片
最后编辑于 :
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
相关阅读更多精彩内容
- 跟着老师做的练习,我发现自己没有能独立做出来。算法方面不如老师做的优秀。 爬取得是knewone.com网站,此网...
- 因为自己在这一块走了点弯路,现在在这里做一个记录为日后作为参考。网上对于Django的动态上传图片的完整实例不多,...
- 友情篇:我们是永远的朋友,如果有一天你过的太辛苦,那就来找我吧。 “敏浩,你是知道我的,我喜欢离群索居的生活,这个...