1.在这样的页面下有一堆offline的机器,我们现在就把Offline Slave Name下的数据全部爬取到本地。
2.这个其实挺简单,F12仔细观察一下页面标签即可找到规律,不用写正则~上代码~
import urllib.request
from bs4import BeautifulSoup#这里需要导入BeautifulSoup
url="http://jenkins.sh.cn.xxx.se/jclouds-offline/ "
content=urllib.request.urlopen(url)
soup=BeautifulSoup(content)#将网页内容转化为BeautifulSoup 格式的数据
for xin soup.find_all('a','model-link inside'):
html=x.get_text()
print(html)
with open('save.txt','r+')as f:
f.read()
f.writelines(html+'\n')
f.closed