iOS中开发录制语音的功能非常简单, 只需要使用AVFoundation库下的AVAudioRecorder即可, 是许多标准录音的首选方法
首先, 系统默认的音频会话是<a>AVAudioSessionCategorySoloAmbient</a>, 并不支持音频输入, 所以我们需要先设置音频会话, 修改为<a>AVAudioSessionCategoryPlayAndRecord</a>
- (BOOL)application:(UIApplication *)application didFinishLaunchingWithOptions:(NSDictionary *)launchOptions {
AVAudioSession *session = [AVAudioSession sharedInstance];
NSError *error;
if (![session setCategory:AVAudioSessionCategoryPlayAndRecord error:&error]) {
NSLog(@"Category Error: %@", [error localizedDescription]);
}
if (![session setActive:YES error:&error]) {
NSLog(@"Activation Error: %@", [error localizedDescription]);
}
return YES;
}
如果程序需要运行在真机上, 我们还需要在info文件中添加<a>Privacy - Microphone Usage Description</a>字段
接下来创建AVAudioRecorder对象
这里使用初始化方法<a>- (nullable instancetype)initWithURL:(NSURL *)url settings:(NSDictionary<NSString *, id> *)settings error:(NSError **)outError;</a>
该方法需要传入三个参数:
url: 第一个是语音文件需要保存的位置, 设立使用沙盒的tmp文件夹临时保存文件
settings: 第二个是对于录制音频的一些控制设置, 例如文件的格式, 采样率, 通道数, 指定格式的键, 音频质量等
outError: NSError指针, 当出现错误时可以使用
这里主要讲解第二个参数<a> settings </a>
- 音频格式: AVFormatIDKey定义了写入内容的音频格式
kAudioFormatLinearPCM = 'lpcm',
kAudioFormatAC3 = 'ac-3',
kAudioFormat60958AC3 = 'cac3',
kAudioFormatAppleIMA4 = 'ima4',
kAudioFormatMPEG4AAC = 'aac ',
kAudioFormatMPEG4CELP = 'celp',
kAudioFormatMPEG4HVXC = 'hvxc',
kAudioFormatMPEG4TwinVQ = 'twvq',
kAudioFormatMACE3 = 'MAC3',
kAudioFormatMACE6 = 'MAC6',
kAudioFormatULaw = 'ulaw',
kAudioFormatALaw = 'alaw',
kAudioFormatQDesign = 'QDMC',
kAudioFormatQDesign2 = 'QDM2',
kAudioFormatQUALCOMM = 'Qclp',
kAudioFormatMPEGLayer1 = '.mp1',
kAudioFormatMPEGLayer2 = '.mp2',
kAudioFormatMPEGLayer3 = '.mp3',
kAudioFormatTimeCode = 'time',
kAudioFormatMIDIStream = 'midi',
kAudioFormatParameterValueStream = 'apvs',
kAudioFormatAppleLossless = 'alac',
kAudioFormatMPEG4AAC_HE = 'aach',
kAudioFormatMPEG4AAC_LD = 'aacl',
kAudioFormatMPEG4AAC_ELD = 'aace',
kAudioFormatMPEG4AAC_ELD_SBR = 'aacf',
kAudioFormatMPEG4AAC_ELD_V2 = 'aacg',
kAudioFormatMPEG4AAC_HE_V2 = 'aacp',
kAudioFormatMPEG4AAC_Spatial = 'aacs',
kAudioFormatAMR = 'samr',
kAudioFormatAMR_WB = 'sawb',
kAudioFormatAudible = 'AUDB',
kAudioFormatiLBC = 'ilbc',
kAudioFormatDVIIntelIMA = 0x6D730011,
kAudioFormatMicrosoftGSM = 0x6D730031,
kAudioFormatAES3 = 'aes3',
kAudioFormatEnhancedAC3 = 'ec-3'
指定kAudioFormatLinearPCM会将未压缩的音频流写入到文件中, 这种格式的保真度最高, 不过相应的文件也最大, 比较优质的选择是kAudioFormatMPEG4AAC或kAudioFormatAppleIMA4, 压缩格式会明显的缩小文件大小, 并且能够保存高质量的音频内容
-
采样率: AVSampleRateKey用于定义录音器的采样率
- 采样率定义了对输入的模拟音频信号每一秒内的采样数, 在录制音频的质量及最终文件大小方面, 采样率扮演着至关重要的角色, 适用低采样率, 会导致粗粒度, 不过文件较小, 使用高采样率会得到高质量的内容, 不过文件会较大
- 开发者尽量使用标准的采样率, 比如8000, 16000, 22050, 44100
-
通道数: AVNumberOfChannelsKey用于定义记录音频内容的通道数
- 取值: 1 -> 单声道录制 2 -> 立体声录制, 默认值为1
- 除非使用外部硬件录制, 否则一般都使用单声道录音
音频的质量AVEncoderAudioQualityKey
typedef NS_ENUM(NSInteger, AVAudioQuality) {
AVAudioQualityMin = 0, //最差
AVAudioQualityLow = 0x20, //低等
AVAudioQualityMedium = 0x40, //中等
AVAudioQualityHigh = 0x60, //高等
AVAudioQualityMax = 0x7F //最好
};
录音初始化
下面是语音的初始化代码
NSString *tmpDir = NSTemporaryDirectory();
NSString *filePath = [tmpDir stringByAppendingPathComponent:@"memo.caf"];
NSURL *fileURL = [NSURL fileURLWithPath:filePath];
NSDictionary *settings = @{
AVFormatIDKey : @(kAudioFormatAppleIMA4),
AVSampleRateKey : @44100.0f,
AVNumberOfChannelsKey : @1,
AVEncoderBitDepthHintKey : @16,
AVEncoderAudioQualityKey : @(AVAudioQualityMedium)
};
NSError *error;
self.recoder = [[AVAudioRecorder alloc] initWithURL:fileURL settings:settings error:&error];
if (self.recoder) {
self.recoder.delegate = self;
self.recoder.meteringEnabled = YES;
[self.recoder prepareToRecord];
} else {
NSLog(@"Error: %@", [error localizedDescription]);
}
录音时长
AVAudioRecorder有一个currentTime属性, 记录当前录制音频的时长, 可以使用定时器来轮询这个值, 并展示给用户(由于录音是可以暂停, 然后可以接着继续录制, 所以使用定时器单纯的累加会造成较大的误差)
录音开始, 暂停和停止
- (BOOL)record;
- (void)pause;
- (void)stop;
当使用stop方法后, 会停止语音, 并调用代理的方法, 我们可以在这里对录制完成的文件进行处理
<a>- (void)audioRecorderDidFinishRecording:(AVAudioRecorder *)recorder successfully:(BOOL)flag</a>
音频测量 Audio Metering
在上面的初始化代码中, 使用了一个属性meteringEnabled, 并设置为YES
meteringEnabled: 主要用于音频的测量, 默认为NO, 只有设置为YES才可以进行音频测量, 当然也只有使用音频测量的时候才会设置
AVAudioRecorder和AVAudioPlayer都可以进行音频的测量, 两个类使用的方法都是averagePowerForChannel:和peakPowerForChannel:
两个方法都会返回一个表示声音分贝(dB)等级的浮点值, 这个值从表示最大分贝的0Db(full scale)到表示最小分贝或静音的-160dB
在测量过程中, 每当需要读取值时, 都需要调用updateMeters方法