Speech框架的两种用法【语音转文字】

        最近终于有一点时间抽空来看看最近的新技术,然后发现了苹果在去年出的新框架,可以直接语音转文字,简直厉害了,直接完爆了某些大公司。但是缺点在于只支持iOS10以上的系统,但是也算是一大进步,赞一个。

一、开发环境要求

XCode8以上,只有它之后的编译器里才有Speech.framework

二、创建工程开发

1.导入Speech.framework【Build Phases->Link Binary With Libraries->+】

2.info.plist文件中添加

Privacy - Speech Recognition Usage Description

使用语音识别

Privacy - Microphone Usage Description

使用麦克风

3.第一种:识别本地录音

#import "ViewController.h"#import<Speech/Speech.h>

@interface ViewController ()<SFSpeechRecognitionTaskDelegate>

@property (nonatomic ,strong) SFSpeechRecognitionTask *recognitionTask;

@property (nonatomic ,strong) SFSpeechRecognizer      *speechRecognizer;

@property (nonatomic ,strong) UILabel                *recognizerLabel;

@end

@implementation ViewController

- (void)dealloc {

[self.recognitionTask cancel];

self.recognitionTask = nil;

}

- (void)viewDidLoad {

[super viewDidLoad];

self.view.backgroundColor = [UIColor whiteColor];

//0.0获取权限

[SFSpeechRecognizer requestAuthorization:^(SFSpeechRecognizerAuthorizationStatus status) {

switch (status) {

case SFSpeechRecognizerAuthorizationStatusNotDetermined:

break;

case SFSpeechRecognizerAuthorizationStatusDenied:

break;

case SFSpeechRecognizerAuthorizationStatusRestricted:

break;

case SFSpeechRecognizerAuthorizationStatusAuthorized:

break;

default:

break;

}

}];

//1.创建SFSpeechRecognizer识别实例

self.speechRecognizer = [[SFSpeechRecognizer alloc] initWithLocale:[[NSLocale alloc] initWithLocaleIdentifier:@"zh_CN"]];//中文识别

//@"zh"在iOS9之后就不是简体中文了,而是TW繁体中文

//    [SFSpeechRecognizer supportedLocales];//根据手机设置的语言识别

//    for (NSLocale *lacal in [SFSpeechRecognizer supportedLocales].allObjects) {

//        NSLog(@"countryCode:%@  languageCode:%@ ", lacal.countryCode, lacal.languageCode);

//    }

//2.创建识别请求

SFSpeechURLRecognitionRequest *request = [[SFSpeechURLRecognitionRequest alloc] initWithURL:[NSURL fileURLWithPath:[[NSBundle mainBundle] pathForResource:@"1122334455.mp3" ofType:nil]]];

//3.开始识别任务

self.recognitionTask = [self recognitionTaskWithRequest1:request];

}

- (SFSpeechRecognitionTask *)recognitionTaskWithRequest0:(SFSpeechURLRecognitionRequest *)request{

return [self.speechRecognizer recognitionTaskWithRequest:request resultHandler:^(SFSpeechRecognitionResult * _Nullable result, NSError * _Nullable error) {

if (!error) {

NSLog(@"语音识别解析正确--%@", result.bestTranscription.formattedString);

}else {

NSLog(@"语音识别解析失败--%@", error);

}

}];

}

- (SFSpeechRecognitionTask *)recognitionTaskWithRequest1:(SFSpeechURLRecognitionRequest *)request{

return [self.speechRecognizer recognitionTaskWithRequest:request delegate:self];

}

- (void)didReceiveMemoryWarning {

[super didReceiveMemoryWarning];

}

#pragma mark- SFSpeechRecognitionTaskDelegate

- (void)speechRecognitionDidDetectSpeech:(SFSpeechRecognitionTask *)task

{

}

- (void)speechRecognitionTask:(SFSpeechRecognitionTask *)task didHypothesizeTranscription:(SFTranscription *)transcription {

}

- (void)speechRecognitionTask:(SFSpeechRecognitionTask *)task didFinishRecognition:(SFSpeechRecognitionResult *)recognitionResult {

NSDictionary *attributes = @{

NSFontAttributeName:[UIFont systemFontOfSize:18],

};

CGRect rect = [recognitionResult.bestTranscription.formattedString boundingRectWithSize:CGSizeMake(self.view.bounds.size.width - 100, CGFLOAT_MAX) options:NSStringDrawingUsesLineFragmentOrigin attributes:attributes context:nil];

self.recognizerLabel.text = recognitionResult.bestTranscription.formattedString;

self.recognizerLabel.frame = CGRectMake(50, 120, rect.size.width, rect.size.height);

}

- (void)speechRecognitionTaskFinishedReadingAudio:(SFSpeechRecognitionTask *)task {

}

- (void)speechRecognitionTaskWasCancelled:(SFSpeechRecognitionTask *)task {

}

- (void)speechRecognitionTask:(SFSpeechRecognitionTask *)task didFinishSuccessfully:(BOOL)successfully {

if (successfully) {

NSLog(@"全部解析完毕");

}

}

#pragma mark- getter

- (UILabel *)recognizerLabel {

if (!_recognizerLabel) {

_recognizerLabel = [[UILabel alloc] initWithFrame:CGRectMake(50, 120, self.view.bounds.size.width - 100, 100)];

_recognizerLabel.numberOfLines = 0;

_recognizerLabel.font = [UIFont preferredFontForTextStyle:UIFontTextStyleBody];

_recognizerLabel.adjustsFontForContentSizeCategory = YES;

_recognizerLabel.textColor = [UIColor orangeColor];

[self.view addSubview:_recognizerLabel];

}

return _recognizerLabel;

}

@end

4.第二种:识别即时语音录入

#import "ViewController.h"

#import <Speech/Speech.h>

@interface ViewController ()<SFSpeechRecognizerDelegate>

@property (nonatomic, strong) AVAudioEngine *audioEngine;                          // 声音处理器

@property (nonatomic, strong) SFSpeechRecognizer *speechRecognizer;                // 语音识别器

@property (nonatomic, strong) SFSpeechAudioBufferRecognitionRequest *speechRequest; // 语音请求对象

@property (nonatomic, strong) SFSpeechRecognitionTask *currentSpeechTask;          // 当前语音识别进程

@property (nonatomic, strong) UILabel *showLb;      // 用于展现的label

@property (nonatomic, strong) UIButton *startBtn;    // 启动按钮

@end

@implementation ViewController

- (void)viewDidLoad

{

[super viewDidLoad];

// 初始化

self.audioEngine = [AVAudioEngine new];

// 这里需要先设置一个AVAudioEngine和一个语音识别的请求对象SFSpeechAudioBufferRecognitionRequest

self.speechRecognizer = [SFSpeechRecognizer new];

self.startBtn.enabled = NO;

[SFSpeechRecognizer requestAuthorization:^(SFSpeechRecognizerAuthorizationStatus status)

{

if (status != SFSpeechRecognizerAuthorizationStatusAuthorized)

{

// 如果状态不是已授权则return

return;

}

// 初始化语音处理器的输入模式

[self.audioEngine.inputNode installTapOnBus:0 bufferSize:1024 format:[self.audioEngine.inputNode outputFormatForBus:0] block:^(AVAudioPCMBuffer * _Nonnull buffer,AVAudioTime * _Nonnull when)

{

// 为语音识别请求对象添加一个AudioPCMBuffer,来获取声音数据

[self.speechRequest appendAudioPCMBuffer:buffer];

}];

// 语音处理器准备就绪(会为一些audioEngine启动时所必须的资源开辟内存)

[self.audioEngine prepare];

self.startBtn.enabled = YES;

}];

}

- (void)onStartBtnClicked

{

if (self.currentSpeechTask.state == SFSpeechRecognitionTaskStateRunning)

{  // 如果当前进程状态是进行中

[self.startBtn setTitle:@"开始录制" forState:UIControlStateNormal];

// 停止语音识别

[self stopDictating];

}

else

{  // 进程状态不在进行中

[self.startBtn setTitle:@"停止录制" forState:UIControlStateNormal];

self.showLb.text = @"等待";

// 开启语音识别

[self startDictating];

}

}

- (void)startDictating

{

NSError *error;

// 启动声音处理器

[self.audioEngine startAndReturnError: &error];

// 初始化

self.speechRequest = [SFSpeechAudioBufferRecognitionRequest new];

// 使用speechRequest请求进行识别

self.currentSpeechTask =

[self.speechRecognizer recognitionTaskWithRequest:self.speechRequest resultHandler:^(SFSpeechRecognitionResult * _Nullable result,NSError * _Nullable error)

{

// 识别结果,识别后的操作

if (result == NULL) return;

self.showLb.text = result.bestTranscription.formattedString;

}];

}

- (void)stopDictating

{

// 停止声音处理器,停止语音识别请求进程

[self.audioEngine stop];

[self.speechRequest endAudio];

}

#pragma mark- getter

- (UILabel *)showLb {

if (!_showLb) {

_showLb = [[UILabel alloc] initWithFrame:CGRectMake(50, 180, self.view.bounds.size.width - 100, 100)];

_showLb.numberOfLines = 0;

_showLb.font = [UIFont preferredFontForTextStyle:UIFontTextStyleBody];

_showLb.text = @"等待中...";

_showLb.adjustsFontForContentSizeCategory = YES;

_showLb.textColor = [UIColor orangeColor];

[self.view addSubview:_showLb];

}

return _showLb;

}

- (UIButton *)startBtn {

if (!_startBtn) {

_startBtn = [UIButton buttonWithType:UIButtonTypeCustom];

_startBtn.frame = CGRectMake(50, 80, 80, 80);

[_startBtn addTarget:self action:@selector(onStartBtnClicked) forControlEvents:UIControlEventTouchUpInside];

[_startBtn setBackgroundColor:[UIColor redColor]];

[_startBtn setTitle:@"录音" forState:UIControlStateNormal];

[_startBtn setTitleColor:[UIColor whiteColor] forState:UIControlStateNormal];

[self.view addSubview:_startBtn];

}

return _startBtn;

}

@end

5.引申【各国语言代码】

语言代码

6.知其然知其所以然

SpeechFramework框架中的重要类

SFSpeechRecognizer:这个类是语音识别的操作类,用于语音识别用户权限的申请,语言环境的设置,语音模式的设置以及向Apple服务发送语音识别的请求。

SFSpeechRecognitionTask:这个类是语音识别服务请求任务类,每一个语音识别请求都可以抽象为一个SFSpeechRecognitionTask实例,其中SFSpeechRecognitionTaskDelegate协议中约定了许多请求任务过程中的监听方法。

SFSpeechRecognitionRequest:语音识别请求类,需要通过其子类来进行实例化。

SFSpeechURLRecognitionRequest:通过音频URL来创建语音识别请求。

SFSpeechAudioBufferRecognitionRequest:通过音频流来创建语音识别请求。

SFSpeechRecognitionResult:语音识别请求结果类。

SFTranscription:语音转换后的信息类。

7.Demo地址

https://github.com/BeanMan/SpeechFramWork

参考文章:

http://www.jianshu.com/p/c4de4ee2134d

http://www.jianshu.com/p/487147605e08

站在巨人的肩膀上才有这些总结

菜鸟走向大牛,大家共同前进,如果觉得不错,请给个赞/关注。

一起交流学习,有问题随时欢迎联系,邮箱:383708669@qq.com

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,258评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,335评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,225评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,126评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,140评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,098评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,018评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,857评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,298评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,518评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,678评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,400评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,993评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,638评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,801评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,661评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,558评论 2 352

推荐阅读更多精彩内容