登录注册写文章

B站搜索结果爬虫

B站搜索结果爬虫

import requests
import json
import pandas as pd
# b站api：http://api.bilibili.com/x/web-interface/search/type?search_type=video&highlight=1&keyword=insta360&from_source=banner_search&page=3&jsonp=jsonp&callback=__jp1&nbsp;&nbsp


# 好像data都不重要
data = {"search_type":"video",
      "highlight":"1",
      "keyword":"keyword",
      "from_source":"banner_search",
      "page":10,
      "jsonp":"jsonp",
      "callback":"__jp1"
}
header = {
    "Referer":"https://search.bilibili.com/all?keyword=insta360&from_source=banner_search",
    "User-Agent":"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36"
}

urls = []
for i in range(51)[1:]:
    url = "http://api.bilibili.com/x/web-interface/search/type?search_type=video&highlight=1&keyword=insta360&page=%i"%i
    urls.append(url)
# print(urls)

list = []

for url in urls:
    r = requests.get(url=url,data=data)
    # print(r.text)
    content=json.loads(r.text)["data"]["result"] #解析返回来的json
    list.extend(content)
df = pd.DataFrame(list)
df.to_csv("insta360_result.csv")

最后编辑于：2019.08.07 00:42:51

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

一次即兴的爬虫经历：A站B站数据分析实战
说明：我不是技术人员，整个过程并没有涉及到一定需要技术的地方。不过，非技术人员去抓取数据，岂不是更有意思的一件事...
天下雪阅读 6,389评论 1赞 13
【连载】（三）《诗与茶之恋》
《诗与茶之恋》 3. 嗯，很好，非常好。盛枯含微微合上了眸子，聆听着世界的安静。恍然间，他微微皱起了眉头。 “...
无清棋何阅读 1,170评论 0赞 0

妖从何来－捉妖记
这是反思的开始，就如十六年前的高三岁月。当时，内忧外患，学习奇差，人生将倾，遂发出了最深刻的呐喊，像民国时民众对拯...
小胡串阅读 1,358评论 1赞 0
180528每天学topik初级词汇22
音频参考喜马拉雅→http://www.ximalaya.com/waiyu/12312964/91212159 ...
Sunny_Hhan阅读 760评论 0赞 0
推荐一些适合0-3岁宝宝大脑发育训练的活动，玩儿起来吧
多年以来，人们一直有一个错误观点，即孩子的大脑完全由父母双方的基因遗传决定。但是神经学家发现，孩子0-3岁是脑部发...
广东蒙台梭利教育阅读 4,147评论 0赞 0

赞1赞

赞赏

手机看全文