为了加深大家的印象,每篇FFmpeg初级开发的文章开头会出现FFmpeg的代码结构和初级开发我们的学习大纲,
FFmpeg的代码结构:
libavcodec: 编码器的实现
libavformat: 流协议,容器格式及基本IO访问的实现
libavfilter:音视频过滤器
libavutil:hash器,解码器和各种工具函数
libavdevice:访问捕获设备和回访设备的借口
libswresample:实现混音和重采样
libswscale:实现色彩转换和缩放功能
FFmpeg初级开发包括:
1. FFmpeg日志Log;
2. FFmpeg文件操作;
3. FFmpeg目录操作;
4. FFmpeg Meta信息;
5. FFmpeg抽取音频数据;
6. FFmpeg抽取视频H264数据;
7. FFmpeg格式转换;
8. FFmpeg音视频裁剪。
上一篇文章我们讲解了FFmpeg文件目录的操作并且编写了一个模仿ls功能的小程序,今天我们来讲一下如何打印音视频的Meta信息
通过本篇文章的学习,你可以打印出一个视频文件的视频流信息,包括时长,帧率,码率,分辨率等信息;音频流的编码,采样率,声道等信息。
那么打印Meta信息主要用到的函数为:
av_register_all(); // 获取所有的格式,协议等信息到程序中
// 打开一个多媒体文件,并且将这个多媒体文件的信息保存到AVFormatContext这样一个上下文中
// 第一个参数:一个上下文,用来存储当前多媒体文件所有的信息
// 第二个参数:要打开的多媒体文件名
// 第三个参数:要指定的格式,如果不需要特殊指定会根据第二个参数的文件格式来指定,这个就可以填NULL
// 第四个参数:命令行的参数,一般为NULL
int avformat_open_input ( AVFormatContext ** ps,
const char * url,
AVInputFormat * fmt,
AVDictionary ** options
)
// 关闭这个多媒体文件,释放资源
// 参数:上下文,用来告诉程序需要释放那个多媒体文件资源
void avformat_close_input ( AVFormatContext ** s )
AVFormatContext // 上下文,用来存储多媒体文件的音视频信息
那么下面是我们使用上面的函数和结构体做的一个小程序,获取一个mp4文件的音视频信息:
#include<libavutil/log.h>
#include<libavformat/avformat.h>
#include<stdio.h>
int main(int argc, char* argv[]){
int result;
AVFormatContext *fmt_cxt = NULL;
// log打印级别是INFO及以上
av_log_set_level(AV_LOG_INFO);
// 获取所有的协议和格式信息
av_register_all();
// 获取输入信息,第一个参数:上下文地址,第二个参数:文件,第三个参数:文件的格式,如果不需要特殊指定就为NULL,第四个参数:命令行参数,一般设为NULL
result = avformat_open_input(&fmt_cxt, "./demo.mp4", NULL, NULL);
if(result < 0){
av_log(NULL, AV_LOG_ERROR, "Cant open input file: %s!", av_err2str(result));
return -1;
}
// 打印demo.mp4音视频信息,第一个参数:format上下文,第二个参数:index序号,第三个参数:文件名,第四个参数:输入流为0,输出流为1
av_dump_format(fmt_cxt, 0, "./demo.mp4", 0);
avformat_close_input(&fmt_cxt);
return 0;
}
运行之后的结果就是:
Input #0, mov,mp4,m4a,3gp,3g2,mj2, from './demo.mp4':
Metadata:
major_brand : isom
minor_version : 512
compatible_brands: isomiso2avc1mp41
encoder : Lavf57.71.100
description : Codec by Bilibili XCode Worker v4.6.27(fixed_gap:False)
Duration: 00:05:49.40, bitrate: N/A
Stream #0:0(und): Video: h264 (avc1 / 0x31637661), none, 426x240, 194 kb/s, 25 fps, 25 tbr, 16k tbn (default)
Metadata:
handler_name : VideoHandler
Stream #0:1(und): Audio: aac (mp4a / 0x6134706D), 48000 Hz, 1 channels, 32 kb/s (default)
Metadata:
handler_name : SoundHandler
Input#0:是音视频的index序号。
Stream #0:0:第一个0代表输入流,如果是输出流那么就是1;第二个0代表视频。
Stream #0:1:第一个0代表输入流,如果是输出流那么就是1;第二个1代表音频。
从Duration开始是比较重要的信息,我们可以看到这个视频的时长是"00:05:49.40",视频的格式是h264,分辨率是426x240,帧率25fps;音频的格式是aac,采样率是48000Hz,单声道等。
这样我们就可以获取这些信息,将来放到App中方便用户查看。