登录注册写文章

第二次作业：爬取网页数据

穿透烟雾lily

第二次作业：爬取网页数据

# 本程序用于爬取酷我音乐网站中新歌榜前200名的歌曲和歌手信息

# # 获取信息保存在xls文件中

import requests

from lxmlimport etree

import xlwt

url ='http://www.kuwo.cn/bang/index'

res = requests.get(url)

html = etree.HTML(res.text)

info_s = html.xpath('//ul[@class="listMusic"]/li')

all_info_list = []

for infoin info_s:

rank1 = info.xpath('div[1]/p')[0]

rank = rank1.xpath('string(.)').strip()

song1 = info.xpath('div[2]/a')[0]

song = song1.xpath('string(.)').strip()

singer1 = info.xpath('div[3]/a')[0]

singer = singer1.xpath('string(.)').strip()

# 打印排行、歌曲、歌手

# print(rank, song, singer)

info_list = [rank, song, singer]

all_info_list.append(info_list)

book = xlwt.Workbook(encoding='utf-8')

sheet = book.add_sheet('Sheet1')

header = ['rank', 'song', 'singer']

for tin range(len(header)):

sheet.write(0, t, header[t])

i =1

for lin all_info_list:

j =0

for datain l:

sheet.write(i, j, data)

j +=1

i +=1

book.save('C:/Users/madin/Desktop/test.xls')

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

第二周作业
import requests from lxmlimport etree import xlwt #定义列表 a...
宝妮柴阅读 1,241评论 0赞 0
第三讲的作业
# 本程序用于爬取新浪网->小说->男生小说人气榜中所有的书名、分类、作者及其排名 # 爬取后的数据保存在test...
丁君毅阅读 988评论 2赞 1

2作业
import requests from lxml import etree import xlwt all_in...
包筱莺阅读 1,105评论 0赞 0
留下来的才是最好的
在工作中或生活中，我们总是会相遇形形色色的人，在时间的洗涤下，最终都会有人离开，有人留下。很...
心月ping阅读 5,212评论 0赞 0
34店模特版区陈列抽屉库房
段亚昕阅读 773评论 0赞 0

赞1赞

赞赏

手机看全文