【python】b站直播弹幕获取

博主本人在空闲的时候比较喜欢看一些游戏直播,发现好多主播都在使用弹幕姬,便对弹幕姬的原理产生了兴趣,打算自己动手做一个弹幕播报的程序

网页分析

随便进入一个b站的直播间

(本次使用直播间链接:https://live.bilibili.com/528?spm_id_from=333.334.b_62696c695f6c697665.24)

在这里插入图片描述按【F12】 打开开发者工具,然后按【F5】刷新网页,再点击【网络】,查看收发的网络请求包,发现其中有一个名为 “msg”的数据包

在这里插入图片描述msg不就是消息的简写吗!(难道,这个就是传输弹幕信息的数据包吗?)

那就点击进入查看数据包的内容看看和我们想的一不一样,

【右键】这个数据包,选择【在新标签页打开】


在这里插入图片描述打开后将会看到如下画面

在这里插入图片描述点击【admin】前的倒三角折叠该字典 (room应该是房管的消息列表)

我们查看【room】字典的内容 (room应该是房间中的弹幕)

看到用户【zyvvcgnfdfy】,发送了一个消息【快乐】,在【18:09:24】时

在这里插入图片描述,回到直播间中确认是否出现过这条消息(ps:这里就先不演示的,消息闪的太快没截到图),

经过验证后,发现确实是【msg】 这个数据包用来传输弹幕消息的。。

代码解析

-----------------------------------------------------------------------------------------------------------------------------

import requests

import win32com.client

import time

old_list = []

#创建一个old_list列表用于辅助后面的text_danmu方法提取新消息

class Danmu():

#定义一个Danmu类

    def __init__(self):

        self.url = "https://api.live.bilibili.com/ajax/msg"

        self.headers ={

            "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64; rv:65.0) Gecko/20100101 Firefox/65.0",

            "Referer": "https://live.bilibili.com/284165?spm_id_from=333.334.b_62696c695f6c697665.13",

            }

        self.data = {

            "roomid":"5441",

            "csrf_token":"",

            "csrf":"",

            "visit_id":""

            }

        #在 __init__方法中先定义好要使用的请求url,请求头,和请求参数

    def speak_text(self,text):

    #定义一个speak_text方法,并创建形参text,用于作为接下来读取的文字

        speak = win32com.client.Dispatch("SAPI.SpVoice")

        #创建发声对象

        speak.Speak(text)

        #使用发生对象读取文字


    def text_danmu(self,html):

    #创建一个text_danmu方法,用于提取弹幕信息

        global old_list

        #设置变量作用域,使得该方法可以修改全局变量old_list的值

        temp_list = []

        #创建一个temp_list列表用于作为临时列表辅助提取弹幕消息

        for text in html["data"]["room"]:

        #for循环提取html字典中嵌套的子字典data中嵌套的子字典room的内容赋值给text变量

        #这个html字典来自于get_danmu方法传递

            temp_list.append(text["text"])

            #将变量text字典中text键的值添加到temp_list中

        if temp_list == old_list:

            pass

        #检测temp_list临时列表的内容和old_list是否相同,如果相同则跳过

        else:

            for text_number in range (1,11):

            #创建for循环一次将1到10的数字赋给text_number

                if "".join(temp_list[:text_number]) in "".join(old_list):

                    pass

                #使用join方法以""为分割符提取temp_list切割后的列表的内容

                #使用join方法以""为分割符提取old_list列表的内容

                #比较内容是否相同,如果相同则跳过

                else:

                    try:

                        print (temp_list[text_number-1])

                    except:

                        pass

                    else:

                        self.speak_text(temp_list[text_number-1])

                    #尝试打印temp_list指定索引的内容,如果报错则跳过

                    #否则调用speak_text方法,进行文字转语言

            old_list = temp_list[:]

            #将temp_list的值赋给old_list,进行更新旧信息列表


    def get_danmu(self):

        html = requests.post(url=self.url,headers=self.headers,data=self.data)

        html.json()

        self.text_danmu(eval(html.text))

    #定义get_danmu方法

    #使用requests.post方法获取网页内容

    #将网页返回值以json的信息加载

    #调用之前定义的text_danmu方法,传递eval处理后的网页返回值的文本内容

bzhan = Danmu()

#创建一个bzhan实例

while True:

    bzhan.get_danmu()

    time.sleep(3)

    #每三秒钟调用一个bzhan实例的get_danmu方法

----------------------------------------------------------------------------------------------------------------------

原文链接:https://blog.csdn.net/qq_43017750/article/details/88041247

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容