import requests
from bs4 import BeautifulSoup
#引入BS库
res = requests.get('https://localprod.pandateacher.com/python-manuscript/crawler-html/spider-men5.0.html')
html = res.text
soup = BeautifulSoup(html,'html.parser') #把网页解析为BeautifulSoup对象
# print(res.text) # 获取到的html文本
# print(soup) # 获取到的html文本
# print(type(soup)) # soup为<class 'bs4.BeautifulSoup'>对象,非字符串
items = soup.find_all(class_='books') # 通过匹配标签和属性提取我们想要的数据
# print(items[0]) # 打印items
# print(len(items)) # 打印items
# print(type(items)) # items的数据类型<class 'bs4.element.ResultSet'>
Tag_title = items[0].find(class_='title')
print(Tag_title)
print(Tag_title['href'])
# print(str(items[0])+'__________________')
2019-05-04
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...