Android音视频开发 二.学习规划

目前的确没有比较系统的教程或者书籍,网上的博客文章也都是比较零散的,查找了很多资料,制定了一个学习路线。


image

音视频内容
核心:
音视频技术=封装技术+视频压缩编码技术+音频压缩编码技术+流媒体协议技术

播放流程: 获取流–>解码–>播放
录制播放流程: 录制音频视频–>剪辑–>编码–>上传服务器
直播流程: 录制音视频–>编码–>流媒体传输–>服务器—>流媒体传输到其他app–>解码–>播放

几个重要的环节:
录制音视频 AudioRecord/MediaRecord
音视频编辑 mp4parser或ffmpeg
音视频编码 aac&h264
上传大文件 网络框架,进度监听,断点续传
流媒体传输 流媒体传输协议rtmp rtsp hls
音视频解码 aac&h264(MPEG-4Part10,h264的功能分为两层:视频编解码层(VCL)和网络提取层(NAL))
渲染播放 MediaPlayer
视频编辑可行性开源方案
ffmpeg(功能强大,包含libavcodec(音视频解码库)和libavformat(音视频格式转换库))
MediaCodec (android自带)
ijkplayer (bilibili开源的)
mp4parser (软解软编音视频混合)
Vitamio

具体实现


image

采集

采集,在音视频开发中主要针对的是数据从哪里来的问题。图像、视频的可视化数据来自摄像头这毫无疑问,而音频数据则是来自麦克风,关于采集的知识点涉及到如下内容:

系统的摄像头采集接口是什么,怎么用 ?
如:Windows:DirectShow,Linux:V4L2,Android:Camera

系统的摄像头采集的参数怎么配置,都是什么含义 ?
如:分辨率、帧率、预览方向、对焦、闪光灯 等

系统的摄像头输出的图像/视频数据,是什么格式,不同格式有什么区别 ?
如:图片:JPEG,视频数据:NV21,NV12,I420 等

系统的麦克风采集接口是什么,怎么用 ?
如:Windows:DirectShow,Linux:ALSA & OSS,Android:AudioRecord,iOS:Audio Unit 等

系统的麦克风采集参数怎么配置,都是什么含义 ?
如:采样率,通道号,位宽 等

系统的麦克风输出的音频数据,是什么格式?
如:PCM

渲染:

渲染,在音视频开发中主要针对的是数据展现的问题。我们知道,图像、视频最终都是要绘制到视图(View层)上面,而音频最终都是要输出到扬声器,因此,做音视频渲染,就要掌握如下的技术知识:

系统提供了哪些 API 可以绘制一张图片或者一帧 YUV 图像数据的 ?
如:
Android:ImageView,SurfaceView,TextureView,OpenGL 等
系统提供了哪些 API 可以播放一个 mp3 或者 pcm 数据 ?
如:
Android:AudioTrack 等

处理:


image

针对图像和音视频的处理,实现方式除了使用系统的 API,大多数也会使用一些优秀的第三方库,通过掌握这些第三方库的原理和使用方法,基本上就可以满足日常音视频处理工作了,这些库包括但不限于:
图像处理:OpenGL,OpenCV,libyuv,ffmpeg 等
视频编解码:x264,OpenH264,ffmpeg 等
音频处理:speexdsp,ffmpeg 等
音频编解码:libfaac,opus,speex,ffmpeg 等

传输:

传输,在音视频开发中主要针对的是数据共享的问题,采集完并处理数据以后,我们如何快速传输数据这一难题又摆在了面前,试想如果一个以音视频为主导业务的APP如果在播放过程中非常卡顿的话,用户体验那会是非常糟糕的。因此,解决传输的问题也就摆在了我们的面前。那么,数据究竟如何实现传输共享呢 ?共享,实现细则最重要的一点,就是协议,因此需要具体掌握的协议如下:

打包,音视频在传输前怎么打包,如:FLV,ts,mpeg4 等
直播推流,有哪些常见的协议,如:RTMP,RTSP 等
直播拉流,有哪些常见的协议,如:RTMP,HLS,HDL,RTSP 等
基于 UDP 的协议有哪些?如:RTP/RTCP,QUIC 等

补充
编码格式
H.264:低码率,高质量,高容错
开源实现:openh264、x264

H.265:能达到H.264两倍之压缩率,可支持4k分辨率,最高到8k。
开源实现:libde265、x265、vp9

对比:
H.265对H.264在码率节省上有较大的优势,在相同RSNR下分别节省了48.3%和75.8%。
H.264在编码时间上有聚到优势,对比VP9和H.265,H.265是vp9的6倍,vp9是H.264的将近40倍。

推送协议
1.RTMP
Real Time Messaging Protocol(实时消息传输协议),基于 TCP,设计用来进行实时数据通信。
RTMP是目前主流的流媒体传输协议,广泛用于直播领域,市面上绝大多数直播产品都采用了这个协议。

2.HLS
http live streaming是由Apple公司定义的基于http的流媒体实时传输协议,可实现流媒体的直播和点播,主要用于ios系统。
原理是将整个流分为多个小的文件来下载,每次只下载 个。客户端只要不停的按顺序播放从服务器获取到的 件,就实现了直播。
分段推送的特点,决定了HLS的延迟一般会高于普通的流媒体直播协议。

3.WebRTC
web real time communication(网页即时通信),是一个支持网页浏览器进行实时语音或者视频对话的API。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,099评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,828评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,540评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,848评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,971评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,132评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,193评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,934评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,376评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,687评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,846评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,537评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,175评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,887评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,134评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,674评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,741评论 2 351

推荐阅读更多精彩内容