虽然直播是一个非常庞大而复杂的功能,但是通过WebRTC来建立直播却并不复杂,只需要几十行代码就可以完成
建立直播的步骤:
- 创建PeerConnectionFactory对象
- 创建PeerConnection对象:
- 创建RTCConfiguration并按需要设置好相应的字段,如STUN/TURN服务器url,ice gathering策略等
- 创建RTCPeerConnection实例并实现相关的回调
- 创建并添加MediaStreamTracks:
- RTCMediaStream代表一个流,RTCMediaStreamTrack代表流的一个track,pc可以包含多个流,而流又可以包含一个或多个音/视频track。本地音/视频track可以通过WebRTC提供的工厂方法非常容易的创建
- 在旧版的api,如果需要添加一个流,可以用pc调用addStream,stream可以addAudioTrack或addVideoTrack,整个概念非常好理解;目前推荐使用addTrack或者addTransceiver来添加流,而不再直接使用stream。这里的RTCRtpTransceiver可以理解为一个转发器,有audio和video两种类型,每个transceiver都有相应的sender和receiver,也就是说在协商完成前,我们就可以持有remote track的引用了,对于track的操作更加方便
- 生成和发送offer:
- 通过pc获取offer,offer是一个纯文本的sdp,其内容由前面两步的相关设置决定
- 把offer设置为LocalDescription
- 把offer编码并通过信令服务器发送到对端
- 发送我方的ice candidates
- 设置完LocalDescription后,pc会开始生成多个ice candidate,这些candidate同样是sdp的纯文本,可以理解为我方的联系方式
- 把ice candidate sdp编码并通过信令服务器发送到对端
- 接收并设置对方发来的answer
- 接收并添加对方发来的ice candidates
- 这些步骤完成后,WebRTC会自动完成后续的所有工作,如选择一对可用的ice candidates、建立rtp/rtcp流、采集音视频、编解码、打包发送等等。我们要做的就是提供一个窗口把remote video track渲染的画面展示到合适的地方
如何加快直播建立的速度
建立直播一般需要3-4秒的时间,如果是local网络会快一点,如果需要relay则会慢一些
耗时主要包括以下几个部分
- 连接信令服务器和sdp协商用时
- ice candidate gathering用时
- 首个关键帧接收、解码、渲染用时
针对这些耗时点,可以做如下的优化:
- 提前连接信令服务器,提前协商(记得把track都设置为disable)
- 开启continualGathering,让ice协商可以同时进行
- 提供多个STUN和TURN服务器,使得两端可以找到最好的路径
- 当用户退出直播时,只是将track disable而不是关闭连接
其他问题
- 信令服务器是什么
信令服务器是用于通信双方协商时转发sdp的服务器,一般采用WebSocket,因为其双工通信的特性非常适应这个场景。其他的方式如mqtt、http、udp广播甚至是手动输入都可以,只要能够完成双方的通信
- sdp是什么
sdp(Session Description Protocol)是一种用于描述多媒体通信会话的格式,sdp本身不提供任何媒体流,但在端点之间用于协商网络指标、媒体类型和其他相关属性。sdp的生成和处理都是webrtc自己实现的,一般情况下不需要对其进行修改,所以一般的使用可以把它当成黑盒
- 使用WebRTC需要收费吗
WebRTC是apache 2.0开源协议的,本身不收费。使用WebRTC主要是信令服务器和STUN/TURN服务器的相关费用,如果只是本地网络使用,完全可以一毛钱不花
mdn 的webrtc api文档:https://developer.mozilla.org/en-US/docs/Web/API/WebRTC_API
transceiver详细介绍:https://blog.mozilla.org/webrtc/rtcrtptransceiver-explored/