IOS之语音识别技术

前述:自从看了罗永浩在锤子手机发布会上,展示了一下语音识别技术,锤子手机集成的是讯飞语音技术。感觉好牛逼,很高大上的样子。因为这样我对语音识别技术开始感兴趣了。最近在网上逛网站、技术博客时,看到了一篇介绍苹果自带的语音识别组件Speech的文章。并且仔细查看了该组建的开发文档。所以着手写了这篇文章。

一、SPeech组成部分

SFSpeechRecognizer.h 语音识别器

SFSpeechRecognitionRequest.h 语音识别请求

SFSpeechRecognitionTask.h   语音识别任务

SFSpeechRecognitionTaskHint.h 语音识别的类型

SFSpeechRecognitionResult.h 语音识别的结果

SFTranscriptionSegment.h 转录的子串

SFTranscription.h 语音录制的文本形式

二、语音识别前的验证及准备

声明三个属性:

@property (weak, nonatomic) IBOutlet UITextView *wordTextView;

@property (weak, nonatomic) IBOutlet UIButton *recordBtn;

@property(nonatomic,strong) SFSpeechRecognizer *recognizer;

//识别功能

@property(nonatomic,strong) SFSpeechAudioBufferRecognitionRequest *recognitionRequest;

@property(nonatomic,strong) SFSpeechRecognitionTask *recognitionTask;

@property(nonatomic,strong) AVAudioEngine *engine;

[SFSpeechRecognizer supportedLocales] //当前苹果支持语音识别的时区 目前支持62门语言

NSLocale *cale = [[NSLocale alloc] initWithLocaleIdentifier:@"zh-CN"]; //时区对象

self.recognizer = [[SFSpeechRecognizer alloc] initWithLocale:cale]; //用时区来初始化识别器 目前只支持识别一个时区

self.recognizer.delegate = self; //设置代理

//识别器代理方法 语音识别识别改变的代理方法

-(void)speechRecognizer:(SFSpeechRecognizer *)speechRecognizer availabilityDidChange:(BOOL)available {

//设置控制语音识别按钮的是否可点击

}

//检查设备是否支持语音识别

//注意//注意要在info中加入私有白名单 Privacy - Speech Recognition Usage Description

[SFSpeechRecognizer requestAuthorization:^(SFSpeechRecognizerAuthorizationStatus status) {

BOOL isButtonEnabled = false;

switch (status) {

case SFSpeechRecognizerAuthorizationStatusDenied:

//设置按钮是否可点击

isButtonEnabled = false;

NSLog(@"用户被拒绝访问语音识别");

break;

case SFSpeechRecognizerAuthorizationStatusAuthorized:

isButtonEnabled = true;

NSLog(@"可以语音识别");

break;

case SFSpeechRecognizerAuthorizationStatusRestricted:

isButtonEnabled = false;

NSLog(@"不能在该设备上进行语音识别");

break;

case SFSpeechRecognizerAuthorizationStatusNotDetermined:

isButtonEnabled = false;

NSLog(@"没有授权");

break;

default:

break;

}

//注意当前线程是子线程

NSLog(@"%@",[NSThread currentThread]);

dispatch_async(dispatch_get_main_queue(), ^{

//回到主线程刷新UI,设置按钮是否可点击

self.recordBtn.enabled = isButtonEnabled;

});

}];

三、语音识别

//开始录制 - 识别语音转文字

- (void)startRecording {

if (self.recognitionTask) {

[self.recognitionTask cancel];

self.recognitionTask = nil;

}

//判断语音录入是否可用

AVAudioSession *audioSession = [AVAudioSession sharedInstance];

//注意要在info中加入私有白名单 Privacy - Microphone Usage Description

BOOL audioBool = [audioSession setCategory:AVAudioSessionCategoryRecord error:nil];

//Category

AVAudioSessionCategoryPlayAndRecord 录制音频时使用这个类别

AVAudioSessionCategoryAmbient 使用这个类别的背景声音,如雨,汽车发动机噪音,等等

AVAudioSessionCategorySoloAmbient  使用这个类别的背景声音。其他的音乐将停止演奏

AVAudioSessionCategoryPlayback 使用这类音乐曲目

AVAudioSessionCategoryPlayAndRecord 在录制和回放音频时使用这个类别

BOOL audioBool1 = [audioSession setMode:AVAudioSessionModeMeasurement error:nil];

//mode 

AVAudioSessionModeMeasurement 适用于希望尽量减少系统提供的信号效果的应用程序 处理输入和/或输出音频信号

//激活音频会话

BOOL audioBool2 = [audioSession setActive:true withOptions:AVAudioSessionSetActiveOptionNotifyOthersOnDeactivation error:nil];

if (audioBool || audioBool1 || audioBool2) {

NSLog(@"可以使用");

} else {

NSLog(@"这里说明有的功能不支持");

}

//创建识别请求: 从任意音频缓冲区识别语音的请求

self.recognitionRequest = [[SFSpeechAudioBufferRecognitionRequest alloc] init];

AVAudioInputNode *inputNode = self.engine.inputNode;

//报告这个识别是否是最终结果

self.recognitionRequest.shouldReportPartialResults = true;

//开始识别任务

self.recognitionTask = [self.recognizer recognitionTaskWithRequest:self.recognitionRequest resultHandler:^(SFSpeechRecognitionResult * _Nullable result, NSError * _Nullable error) {

BOOL isFinal = false;

if (result) {

//语音转文本

self.wordTextView.text = [[result bestTranscription] formattedString];

isFinal = [result isFinal];

}

if (error || isFinal) {

//没有识别到,

[self.engine stop];

销毁节点

[inputNode removeTapOnBus:0];

self.recognitionRequest = nil;

self.recognitionTask = nil;

self.recordBtn.enabled = true;

}

}];

AVAudioFormat *recordingFormat = [inputNode outputFormatForBus:0];

////连接上次的语音输入

[inputNode installTapOnBus:0 bufferSize:1024 format:recordingFormat block:^(AVAudioPCMBuffer * _Nonnull buffer, AVAudioTime * _Nonnull when) {

[self.recognitionRequest appendAudioPCMBuffer:buffer];

}];

//识别器准备

[self.engine prepare];

BOOL audioEngineBool = [self.engine startAndReturnError:nil];

NSLog(@"audioEngineBool----%d",audioEngineBool);

}

小伙伴们,这样就识别成功了。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,456评论 5 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,370评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,337评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,583评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,596评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,572评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,936评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,595评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,850评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,601评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,685评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,371评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,951评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,934评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,167评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,636评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,411评论 2 342

推荐阅读更多精彩内容