音视频学习之路--一些基础概念

前言

本章还是继续了解一些音视频基础的名词等,因为这方面内容非常多,所以还是多阅读、多复习。

正文

视频编码

根据之前的播放器原理,视频编码也就是通过特定的压缩技术,将某个视频格式文件转换为另一种视频格式文件,这个编码技术主要分为2类,一类是H.264、H.265等,还有一种是MPEG。

  1. MPEG系列:MPEG其实就是Moving Picture Experts Group,即运动图像专家组。它在视频编码主要有MPEG1(VCD使用)、MPEG2(DVD使用)、MPEG4、MPEG4 AVC(当前热门),同时它还有音频编码技术,主要有MPEG Audio Layer3(大名鼎鼎的MP3)、MPEG-2 AAC、MPEG-4 AAC(AAC目前热门)。

  2. H.26X系列:这个系列的编码有个侧重点就是网络传输,而且只有视频编码,主要有H.262、H264(这个是MPEG4 AVC合作的结晶)。

音频编码

音频编码主要就以下几种常用,其中AAC目前使用的最多。

  1. AAC:一种专门为声音数据设计的文件压缩格式,与MP3不同的是它采用全新算法编码,更加高效,具有更高的性价比,但同时AAC属于有损压缩,音质和无损压缩的APE等无法比。

  2. MP3:一种音频压缩技术,压缩率能到到1:10左右,特定是利用人耳对高频声音信号不敏感的特效,进行过滤。

  3. AC3:AC3是Dobby实验室发展的,广泛应用于5.1声道等多声道场景。

多媒体播放组件

这里直接说Android平台的情况吧,比如一个视频能在Android平台上播放需要下面相关组件。

  1. MediaPlayer:播放控制。

  2. MediaCodec:音视频编解码。

  3. OMX:多媒体部分采用的编码标准。

  4. StageFright:替代之前的OpenCore,这部分在Android中以动态库的形式存在,也就是libstagefright.so。

  5. AudioTrack:音频播放。

常见的多媒体框架和解决方案

  1. VLC:即Video LAN Client,是一款自由的、开源的跨平台多媒体播放器及框架。

  2. FFmpeg:多媒体解决方案,广泛应用。

  3. GStreamer:一套构建多媒体应用的开源多媒体框架。

DTS和PTS

这2个概念很重要,就是解码时间戳和显示时间戳,这2个是什么用呢,就要涉及I、P、B帧的概念了。

I帧

I帧图像采用帧内编码方式,即只利用了单帧图像内的空间相关性,而没有利用时间相关性。

I帧是帧内压缩,不使用运动补偿,由于I帧不依赖其他帧,所以是随机存取的入点,同时是解码的基准帧。

P帧

P帧和B帧采用的是帧间编码方式,即同时利用了空间和时间上的相关性。P帧图像只采用前向时间预测,可以提高压缩效率和图像质量,也就是P帧依赖于前面的帧数据。

B帧

B帧采用双向时间预测,可以大大提高压缩倍数,这里值得注意的是B帧图像采用了未来帧作为参考,因此MPEG-2编码码流中图像帧的传输顺序和显示顺序是不同的。

从上面概念我们得知,一个I帧可以不依赖其他帧就可以解码出一幅完整的图像,而P帧需要依赖视频流中排在它前面的帧才能解码出图像,而B帧需要依赖视频流中排在它2前面或后面的帧才能解码出图像。

所以就有了DTS、PTS的概念。

DTS

即DTS(Decoding Time Stamp),解码时间戳,这个时间戳的意义在于告诉播放器该在什么时候解码这一帧的数据。

PTS

即PTS(Presentation Time Stamp),解码时间戳,这个时间戳的意义在于告诉播放器在什么时候显示这一帧的数据。

这里我们也就明白了,当视频中没有B帧时,这2个顺序是一样的,当有B帧时就不一定了。

假如有个视频流里面是I P B B这个顺序,显示的顺序是I B B P,这时的解码顺序就不能是I B B P,需要使用I P B B来解码。

所以DTS和PTS就是解决视频流中有B帧时的情况。

YUV和RGB

这属于2种颜色空间,其中RGB我们很好理解,就是3原色混合而成的颜色,这个YUV是啥呢

YUV是电视上使用的一种颜色空间,其中Y表示亮度,其实有了Y之后就能显示出影像了,就是黑白电视的效果,这里很有意思,黑色就是亮度低,白色就是亮度高,这里就是利用了人眼对颜色判断其中亮度比较明显的特效。

有了黑白后,UV就是2个色差分量,通过UV就能显示出彩色了,这2种颜色空间可以相互转换。

音频相关概念

声波

声波这个我们很熟悉了,所有声音都是通过振动来产生的声波,它有几个常用的属性。

  1. 频率,代表音调的高低,频率越高,波长越短;波长越长,声音更容易绕过障碍物,传的更远。

  2. 振幅,代表响度,就是能量大小的反应,分贝是描述响度大小的单位,分贝是无量纲,指2个相同的物理量A1(被度量量)和A0(基准量或者参考量)之比取以10为底的对数并乘以10,即N=10*lg(A1/A0)

  3. 波形,也就代表音色,不同的波形即使音调和响度相同,它的声音也是不同。

数字音频

将音频信号进行数字化,需要3个步骤,即采样、量化和编码。

  1. 采样,采样是在时间轴上对信号进行数字化,根据采样定理,按比声音最高频率2倍以上的频率对声音进行采样。

  2. 采样频率,表示一秒采样的次数,采样率一般为44.1kHz。

  3. 量化,量化是指在幅度轴上对信号进行数字化,比如用16比特的二进制信号来表示声音的一个采集,也就是最终的音频信号在振幅上分为65535层。

  4. 编码,按照一定的格式记录采样和量化的数字数据。

PCM编码

PCM是无损编码,也是音频裸数据,能达到最大程度的高保真。

WAV编码

WAV是一种不会进行压缩操作的编码,在PCM数据格式的前面加上44字节,分别用来描述PCM的采样率、声道数、数据格式信息。

MP3编码

MP3具有不错的压缩比,听感上非常接近WAV文件,音质在128Kbps上表现不错。

AAC编码

AAC是新一代的音频有损压缩技术,在小于128Kbps时表现优异,支持多种音频声道组合。

总结

这里先说这么多,到后面有更详细的概念再进行补充。

相关推荐

Android音视频开发:音视频基础知识到直播推流实战系列教程_哔哩哔哩_bilibili

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,293评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,604评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,958评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,729评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,719评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,630评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,000评论 3 397
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,665评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,909评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,646评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,726评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,400评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,986评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,959评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,996评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,481评论 2 342

推荐阅读更多精彩内容

  • 本文中涉及到的一些编码,图像等的具体处理在代码上的体现可查看:[总结]视音频编解码技术零基础学习方法 基本概念-颜...
    哈库呐玛塔塔__阅读 591评论 0 0
  • 对一个初学者来说,刚刚接触音视频的学习难免会遇到各种个样的术语,一开始我也是云里雾里的,到现在一点一点接触积累,形...
    海盗的帽子阅读 2,245评论 2 9
  • 音视频之所以叫音视频是因为他由音频和视频构成,我们平时看的视频其实就是音视频。本文将记录笔者在学习音视频遇到的概念...
    Seacen_Liu阅读 3,038评论 1 3
  • 目录 序言声音的物理性质数字音频音频编码图像的物理现象图像的数值表示视频的编码方式 一 序言 音视频技术是为了记录...
    路飞_Luck阅读 675评论 0 1
  • 相关文档 音视频技术博客 什么是视频?   首先我们需要理解一个最基本的概念:视频。从感性的角度来看,视频就是一部...
    Mzone阅读 3,203评论 0 10