简介
高级 Linux 声音体系(Advanced Linux Sound Architecture,ALSA)是Linux中提供声音设备驱动的内核组件,用来代替原来的开放声音系统(Open Sound System,OSSv3)。除了声音设备驱动,ALSA还包含一个用户空间的函数库,开发者可以通过这些高级 API 使用驱动,不必直接与内核驱动进行交互(1)。
安装
sudo apt install libasound2-dev
流程
- 打开设备
- 分配参数内存
- 填充默认参数
- 设置参数(详细的参见 ALSA - PCM接口)
- 通道数
- 采样率(码率,用来指定时间和文件大小,frames/s)
- 帧数(每次读取的数据长度与该参数有关)
- 数据格式(影响输出数据、缓存大小)
- 设备访问类型(直接读写、内存映射,交错模式、非交错模式)
- 读取、写入数据
简单的例子
- 包含头文件
#include <alsa/asoundlib.h>
- 查看设备,根据最后两个数字确定设备名称,通常default就行了
aplay -L
- 定义相关参数,录放音都要经过相同的步骤,放一起定义
// 设备名称,这里采用默认,还可以选取"hw:0,0","plughw:0,0"等
const char *device = "default";
// 设备句柄
// 以下均定义两个,根据前缀区分,c->capture,p->playback,没有前缀的表示参数相同
snd_pcm_t *chandle;
snd_pcm_t *phandle;
// 硬件参数
snd_pcm_hw_params_t *cparams;
snd_pcm_hw_params_t *pparams;
// 数据访问类型,读写方式:内存映射或者读写,数据
snd_pcm_access_t access_type = SND_PCM_ACCESS_RW_INTERLEAVED;
// 格式,
snd_pcm_format_t format = SND_PCM_FORMAT_S16_LE;
// 码率,采样率,8000Hz,44100Hz
unsigned int rate = 44100;
// 通道数
unsigned int channels = 2;
// 帧数,这里取32
snd_pcm_uframes_t frames = 32;
// 以下为可选参数
unsigned int bytes_per_frame;
// 软件重采样
unsigned int soft_resample;
- 打开设备
snd_pcm_open(&chandle, device, SND_PCM_STREAM_CAPTURE, 0);
snd_pcm_open(&phandle, device, SND_PCM_STREAM_PLAYBACK, 0);
增加一个错误判断
int err;
if ((err = snd_pcm_open(&chandle, device, SND_PCM_STREAM_CAPTURE, 0)) < 0)
{
std::cout << "Capture device open failed.";
}
if ((err = snd_pcm_open(&phandle, device, SND_PCM_STREAM_PLAYBACK, 0)) < 0)
{
std::cout << "Playback device open failed.";
}
- 设置参数,这里就不增加错误判断了,不然显得有些长了
// 先计算每帧数据的大小
bytes_per_frame = snd_pcm_format_width(format) / 8 * 2;
// 计算需要分配的缓存空间的大小
buffer_size = frames * bytes_per_frame;
// 为参数分配空间
snd_pcm_hw_params_alloca(¶ms);
// 填充参数空间
snd_pcm_hw_params_any(handle, params);
// 设置数据访问方式
snd_pcm_hw_params_set_access(handle, params, access_type);
// 设置格式
snd_pcm_hw_params_set_format(handle, params, format);
// 设置通道
snd_pcm_hw_params_set_channels(handle, params, channels);
// 设置采样率
snd_pcm_hw_params_set_rate_near(handle, params, &rate, 0);
// 可选项,不改不影响
// 设置缓存大小
buffer_size = period_size * 2;
snd_pcm_hw_params_set_buffer_size_near(handle, params, &buffer_size);
// 设置段大小,period与OSS中的segment类似
period_size = buffer_size / 2;
snd_pcm_hw_params_set_period_size_near(handle, params, &period_size, 0));
//设置参数
snd_pcm_hw_params(handle, params);
- 读写数据
// 分配缓存空间,大小上面通过buffer_size计算出了
char *buffer = (char *)malloc(buffer_size);
// 读写数据
snd_pcm_readi(chandle, buffer, frames);
snd_pcm_writei(phandle, buffer, frames);
- 循环播放
while(1)
{
snd_pcm_readi(chandle, buffer, frames);
snd_pcm_writei(phandle, buffer, frames);
}
- 捕获一定时间的音频数据到文件流
ofstream output("test.pcm", ios::trunc);
int loop_sec;
int frames_readed;
loop_sec = 10;
unsigned long loop_limit;
// 计算循环大小
loop_limit = loop_sec * rate;
for (size_t i = 0; i < loop_limit; )
{
// 这里还需要判断一下返回值是否为负
frames_readed = snd_pcm_readi(chandle, buffer, frames);
output.write(buffer, buffer_size);
i += frames_readed;
}
- 关闭设备、释放指针
snd_pcm_close(chandle);
snd_pcm_close(phandle);
free(buffer);
封装一下
问题
- [已解决] 录放音过程中出现高音,多半是读写设备是缓存大小设置的问题。
- [已解决] 放音过程中也许会出现"Broken pipe"的错误,添加如下需要重新准备设备
err = snd_pcm_writei(handle, input_buffer, frames);
if (err == -EPIPE)
{
snd_pcm_prepare(handle);
continue;
// 或者
// return 0;
}
- [未解决] 如果录音之后立即放音,开始不会有延时,但是时间长了以后延时会累加。