2019年1月2号更新:老师出的题很简单,高分同学甚至满分应该很多。
考题多为基础知识,我们快速过一遍PPT。
然后上课讲的算法着重复习一下。
群里疯狂吐槽某考研英语老师,何凯文。
群里某位不愿透漏姓名的网友表示:情商高肚子里有墨水的人永远都平平淡淡的
推荐唐迟英语老师。
hr中的傻逼比沙滩上沙子还多,笑点。
第一章
动画矢量,视频
多媒体计算机:MPC
JPEG压缩比25:1
MPEG压缩比200:1
蓝光光碟(简称BD)是DVD之后的下一代光盘格式之一,用以存储高品质的影音以及高容量的数据。其容量可达到27GB。
全息光盘技术:简称HVD,其储存容量高达1TB(1000GB),数据传输率方面远高于现有的硬盘水平,是目前DVD最高速度(16X,约22MB/s)的40倍。
荧光多层存储技术:存储容量可达140GB。
问题:如何满足多媒体通信对速度和质量的需求,给网络技术提出了新的要求?
解决办法:流媒体技术,高速路由技术、电话宽带接入技术等。
虚拟现实系统的关键特性:
1.多感知性:虚拟现实系统应提供包括视觉、听觉、触觉、力觉、运动和味觉等感知能力。
2.临场性:又称存在感,是用户在虚拟环境中产生的身临其境、难以分辨真假的感觉。
3.交互性:指用户对虚拟环境中对象的可操作程度和由环境反馈的自然程度。
4.自主性:指虚拟环境中对象的自主程度。
第二章
声波有三个重要的参数:
振幅、周期和频率。
20到两万赫兹
声音的3个要素:音调(频率)、响度(强弱振幅)、音色
采样频率一般分为22.05KHz、44.1KHz、48KHz三个等级,22.05只能达到FM广播的声音品质,44.1KHz是CD音质,48KHz则是DVD Audio或专业领域才会采用。
影响模拟音频数字化质量的主要参数有:
1.采样频率
2.采样精度
3.声道数
采样频率采用三种:
11.025KHz(语音效果)
22.05KHz(音乐效果)
44.1KHz(高保真效果)。
采样精度也称“量化等级”或“量化位数”,是采样点样本值的二进制位数。经常采用的有8位和16位。量化位数越高,声音质量越好,但需要的存储空间也越多。
数据传输率(bps)=采样频率×量化位数×声道数
音频:WAVE、MP3、WMA、RM、VOC、AIFF、CD、MIDI
wave [1] 真实记录自然声波形。
[2] 基本无数据压缩。
[3] 数据量大。
mp3高达11:1的压缩率
几种音频软件
soundforge GoldWave cooledit pro
第三章
常见的颜色模型有RGB、CMYK、HSL、YUV等。
YUV和rgb颜色转换
图像数字化: 采样和量化
位图文件由4个部分组成:
位图文件头
占用14字节
提供文件格式、文件大小和位图起始位置等信息
与文件相关内容位图信息头 40 字节
颜色表
图像数据
基于DCT和Huffman的JPEG压缩编码:
1使用正向DCT压缩编码
2量化
3使用Huffman可变字长编码器对64个量化系数进行熵编码
解码正好相反拆包装,从内向外
1.离散余弦变化FDCT
JPEG采用的是8×8子块进行DCT变换。进行DCT前,将每个分量图像分割成8×8像素块(称为一个数据单元DU)
无符号数变成有符号数。
进行DCT变换,得到直流(DC)系数 和63个交流(AC)系数。
量化是图像质量下降的最主要原因。
Z字形编码;
直流DC系数——DPCM编码
交流AC系数——RLE编码
H编码
DC系数反映了一个8×8数据块的平均值。
DC系数有2个特点:一是DC的数值比较大;二是相邻8×8图像块的DC系数值变化不大,有较大的相关性。
压缩条件:
数据冗余度 (重复数据、可忽略数据)
人类不敏感因素 (颜色、亮度、细节等)
人类不敏感因素 (颜色、亮度、细节等)
目前电视系统采用隔行扫描方式,它节省频带且硬件实现简单。而计算机中采用逐行扫描方式。
??YUV采样数据量计算
MPEG算法两种思想:
空间冗余——帧内冗余——帧内冗余采样JPEG压缩
时间冗余——帧间冗余——帧间冗余采用运动补偿算法压缩.
I帧—关键帧
P帧——由最近的I帧或P帧经过预测编码得到。
B帧——可以使用前一个和后一个图像作为参考图像,也可以使用前后两个参考图像。(双向预测)
视频修复软件常用的视频修复软件有All Media Fixer Pro等
JPEG中Huffman编码采用查表法来实现,JPEG标准提供了DC、AC两个表分别供亮度和色度DCT系数的Huffman编码使用,共有4个。
JPEG压缩编码算法的主要计算步骤
(1) 正向离散余弦变换(FDCT)
(2) 量化
(3) 编码
Z字形编码
直流DC系数——DPCM编码
交流AC系数——RLE编码
哈夫曼编码:采用查表法来进行。
数据压缩极限
对于n相等的两个文件,概率p决定了压缩极限的大小。p↑(重复越多),表明文件内容越有规律,压缩后的体积就↓;p↓(重复越少)表明文件内容越随机,压缩后的体积就越大↑。
概率p与压缩体积成反比。
信息熵越大,表示占用的二进制位越长,能压缩的空间就越小。
无损编码即熵编码有:
行程编码(RLC) Run-Length Coding)也叫作RLC编码。
哈夫曼(Huffman)
LZW编码
香农(Shannon)编码