TTS

TTS(Text To Speech 文本转语音缩写)

简介

涉及到AVFoundatio框架中的AVSpeechSynthesizer、AVSpeechUtterance、AVSpeechSynthesisVoice三个类,这三个类的声明都在AVSpeechSynthesis.h里,这三个类比较简单。

需要用到的一些枚举与宏

  • 播放暂停时是立即停止播放语音还是播放完当前词再暂停。

    typedef NS_ENUM(NSInteger, AVSpeechBoundary) {
        AVSpeechBoundaryImmediate,
        AVSpeechBoundaryWord
    }
    
  • 语音质量

    typedef NS_ENUM(NSInteger, AVSpeechSynthesisVoiceQuality) {
        AVSpeechSynthesisVoiceQualityDefault = 1,
        AVSpeechSynthesisVoiceQualityEnhanced
    }
    
  • 速率

    AVF_EXPORT const float AVSpeechUtteranceMinimumSpeechRate NS_AVAILABLE_IOS(7_0);
    AVF_EXPORT const float AVSpeechUtteranceMaximumSpeechRate NS_AVAILABLE_IOS(7_0);
    AVF_EXPORT const float AVSpeechUtteranceDefaultSpeechRate NS_AVAILABLE_IOS(7_0);
    
  • 注意:设置属性字符串时,AVSpeechSynthesisIPANotationAttribute的正确使用,最后会有Demo传送门

    AVF_EXPORT NSString *const AVSpeechSynthesisIPANotationAttribute;
    

AVSpeechUtterance

要开始说话,请指定AVSpeechSynthesisVoice和要说出的字符串,然后根据需要随意更改速率,音高或音量。

四种初始化方法

+ (instancetype)speechUtteranceWithString:(NSString *)string;
+ (instancetype)speechUtteranceWithAttributedString:(NSAttributedString *)string API_AVAILABLE(ios(10.0), watchos(3.0), tvos(10.0));

- (instancetype)initWithString:(NSString *)string;
- (instancetype)initWithAttributedString:(NSAttributedString *)string API_AVAILABLE(ios(10.0), watchos(3.0), tvos(10.0));

通过以上创建出来的实例,其语音、语速、音调、音量都是默认的,可以通过属性进行定制,但是在入队后设置这些值将不起作用。其中rate的值应该介于AVSpeechUtteranceMinimumSpeechRate和AVSpeechUtteranceMaximumSpeechRate之间

@property(nonatomic, retain, nullable) AVSpeechSynthesisVoice *voice;
@property(nonatomic) float rate;           
@property(nonatomic) float pitchMultiplier;  // [0.5 - 2] Default = 1
@property(nonatomic) float volume;           // [0-1] Default = 1
@property(nonatomic) NSTimeInterval preUtteranceDelay;    // Default is 0.0
@property(nonatomic) NSTimeInterval postUtteranceDelay;   // Default is 0.0

有两个属性可以获得当前播放的字符串或属性字符串

@property(nonatomic, readonly) NSString *speechString;
@property(nonatomic, readonly) NSAttributedString *attributedSpeechString

AVSpeechSynthesisVoice

通过指定应该在其中说出文本的语言代码来检索语音,或者通过使用voiceWithIdentifier来获取已知语音标识符。

现支持的语音语言37种,可以用类方法speechVoices获取

+ (NSArray<AVSpeechSynthesisVoice *> *)speechVoices;
language name quality identifier
ar-SA Maged Default com.apple.ttsbundle.Maged-compact
cs-CZ Zuzana 同上 com.apple.ttsbundle.Zuzana-compact
ar-SA Maged 同上 com.apple.ttsbundle.Maged-compact
cs-CZ Zuzana 同上 com.apple.ttsbundle.Zuzana-compact
da-DK Sara 同上 com.apple.ttsbundle.Sara-compact
de-DE Anna 同上 com.apple.ttsbundle.Anna-compact
el-GR Melina 同上 com.apple.ttsbundle.Melina-compact
en-AU Karen 同上 com.apple.ttsbundle.Karen-compact
en-GB Daniel 同上 com.apple.ttsbundle.Daniel-compact
en-IE Moira 同上 com.apple.ttsbundle.Moira-compact
en-US Samantha 同上 com.apple.ttsbundle.Samantha-compact
en-ZA Tessa 同上 com.apple.ttsbundle.Tessa-compact
es-ES Monica 同上 com.apple.ttsbundle.Monica-compact
es-MX Paulina 同上 com.apple.ttsbundle.Paulina-compact
fi-FI Satu 同上 com.apple.ttsbundle.Satu-compact
fr-CA Amelie 同上 com.apple.ttsbundle.Amelie-compact
fr-FR Thomas 同上 com.apple.ttsbundle.Thomas-compact
he-IL Carmit 同上 com.apple.ttsbundle.Carmit-compact
hi-IN Lekha 同上 com.apple.ttsbundle.Lekha-compact
hu-HU Mariska 同上 com.apple.ttsbundle.Mariska-compact
id-ID Damayanti 同上 com.apple.ttsbundle.Damayanti-compact
it-IT Alice 同上 com.apple.ttsbundle.Alice-compact
ja-JP Kyoko 同上 com.apple.ttsbundle.Kyoko-compact
ko-KR Yuna 同上 com.apple.ttsbundle.Yuna-compact
nl-BE Ellen 同上 com.apple.ttsbundle.Ellen-compact
nl-NL Xander 同上 com.apple.ttsbundle.Xander-compact
no-NO Nora 同上 com.apple.ttsbundle.Nora-compact
pl-PL Zosia 同上 com.apple.ttsbundle.Zosia-compact
pt-BR Luciana 同上 com.apple.ttsbundle.Luciana-compact
pt-PT Joana 同上 com.apple.ttsbundle.Joana-compact
ro-RO Ioana 同上 com.apple.ttsbundle.Ioana-compact
ru-RU Milena 同上 com.apple.ttsbundle.Milena-compact
sk-SK Laura 同上 com.apple.ttsbundle.Laura-compact
sv-SE Alva 同上 com.apple.ttsbundle.Alva-compact
th-TH Kanya 同上 com.apple.ttsbundle.Kanya-compact
tr-TR Yelda 同上 com.apple.ttsbundle.Yelda-compact
zh-CN Ting-Ting 同上 com.apple.ttsbundle.Ting-Ting-compact
zh-HK Sin-Ji 同上 com.apple.ttsbundle.Sin-Ji-compact
zh-TW Mei-Jia 同上 com.apple.ttsbundle.Mei-Jia-compact

获取设备当前语言语音码

+ (NSString *)currentLanguageCode;

根据指定的语言语音码获取语音

+ (nullable AVSpeechSynthesisVoice *)voiceWithLanguage:(nullable NSString *)languageCode;

根据指定的语言语音标识码获取语音 iOS9.0之后可用

+ (nullable AVSpeechSynthesisVoice *)voiceWithIdentifier:(NSString *)identifier NS_AVAILABLE_IOS(9_0);

获取某个语音的信息,只读

@property(nonatomic, readonly) NSString *language;
@property(nonatomic, readonly) NSString *identifier NS_AVAILABLE_IOS(9_0);
@property(nonatomic, readonly) NSString *name NS_AVAILABLE_IOS(9_0);
@property(nonatomic, readonly) AVSpeechSynthesisVoiceQuality quality NS_AVAILABLE_IOS(9_0);

AVSpeechSynthesizer

合成器

是否正在播放、暂停

@property(nonatomic, readonly, getter=isSpeaking) BOOL speaking;
@property(nonatomic, readonly, getter=isPaused) BOOL paused;

将已加入或正在讲话的相同AVSpeechUtterance加入会引发异常。

- (void)speakUtterance:(AVSpeechUtterance *)utterance;

以下方法只对正在讲话的语音进行操作才有效。 如果成功则返回YES,失败则返回NO。

- (BOOL)stopSpeakingAtBoundary:(AVSpeechBoundary)boundary;
- (BOOL)pauseSpeakingAtBoundary:(AVSpeechBoundary)boundary;
- (BOOL)continueSpeaking;

指定要用于合成语音的音频通道,如AVAudioSession当前路径中的通道描述所述。
语音音频将复制到每个指定的频道。默认值为nil,表示系统默认值。

@property(nonatomic, retain, nullable) NSArray<AVAudioSessionChannelDescription *> *outputChannels;

学习资源

#import "ViewController.h"
#import <AVFoundation/AVFoundation.h>

@interface ViewController ()

@property(nonatomic, strong) AVSpeechSynthesizer *speechSynthesizer;
@property(nonatomic, strong) AVSpeechUtterance *utterance;
@property(nonatomic, strong) UILabel *label;

@end

@implementation ViewController

- (void)viewDidLoad {
    [super viewDidLoad];
    // Do any additional setup after loading the view, typically from a nib.
    self.speechSynthesizer = [[AVSpeechSynthesizer alloc] init];
    [self commonInit];
}


- (void)didReceiveMemoryWarning {
    [super didReceiveMemoryWarning];
    // Dispose of any resources that can be recreated.
}

- (void)commonInit {
    UISwitch *senderSwitch = [[UISwitch alloc] init];
    senderSwitch.on = YES;
    senderSwitch.frame = CGRectMake(0, 0, 100, 20);
    senderSwitch.center = self.view.center;
    [senderSwitch addTarget:self action:@selector(updateUtterance:) forControlEvents:UIControlEventValueChanged];
    [self.view addSubview:senderSwitch];
    
    self.label = [[UILabel alloc] initWithFrame:CGRectMake((self.view.bounds.size.width - 200)/2.0f, CGRectGetMaxY(senderSwitch.frame) - 80, 200, 20)];
    self.label.textAlignment = NSTextAlignmentCenter;
    [self.view addSubview:self.label];
    
    UIButton *btn = [UIButton buttonWithType:UIButtonTypeCustom];
    btn.frame = CGRectMake((self.view.bounds.size.width - 128)/2.0f, CGRectGetMaxY(senderSwitch.frame) + 20, 128, 128);
    [btn setImage:[UIImage imageNamed:@"audio"] forState:UIControlStateNormal];
    [btn addTarget:self action:@selector(btnClick:) forControlEvents:UIControlEventTouchUpInside];
    [self.view addSubview:btn];
    
    [self updateUtterance:senderSwitch];
}

- (void)updateUtterance:(UISwitch *)sender {
    sender.on = !sender.isOn;
    if (sender.on) {
        NSMutableAttributedString *attString = [[NSMutableAttributedString alloc] initWithString:@"Tsutsumi"];
        // 这里的国际音标可以随意修改 eg:"tən.tən.mə"  "tən.mə" ... 可以多试试其他的情况
        [attString addAttribute:AVSpeechSynthesisIPANotationAttribute value:@"tən.tən.mi" range:NSMakeRange(0, attString.length)];
        self.utterance = [AVSpeechUtterance speechUtteranceWithAttributedString:attString];
        
        self.label.text = @"Tsutsumi(Attributed)";
    } else {
        self.utterance = [AVSpeechUtterance speechUtteranceWithString:@"Tsutsumi"];
        self.label.text = @"Tsutsumi";
    }
}

- (void)btnClick:(UIButton *)sender {
    if (self.speechSynthesizer.isSpeaking) {
        NSLog(@"正在朗读中....");
        return;
    }
    [self.speechSynthesizer speakUtterance:self.utterance];
}

@end

想看Demo的同学请移驾-->TTS

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,456评论 5 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,370评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,337评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,583评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,596评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,572评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,936评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,595评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,850评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,601评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,685评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,371评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,951评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,934评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,167评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,636评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,411评论 2 342

推荐阅读更多精彩内容

  • 前言 在IOS7之前一般语音识别是靠一些第三方库,iOS7之后,苹果提供了文字转语音的API可以使用。 导入框架 ...
    超_爱编程阅读 5,558评论 5 2
  • 前言: 本文仅供学习之用,如果侵权请联系删除!文本转语音技术也叫TTS,是Text To Speech的缩写.iO...
    麦穗0615阅读 6,099评论 1 9
  • 1、通过CocoaPods安装项目名称项目信息 AFNetworking网络请求组件 FMDB本地数据库组件 SD...
    阳明先生x阅读 15,967评论 3 119
  • 项目中使用了TTS(语音合成功能)刚开始自己准备使用科大讯飞的TTS SDK 但是公司经过半天调研(省钱)决定使用...
    liliLearn阅读 2,280评论 0 1
  • 这周,周一周二在上班,周三周四周五高考放假,周末补课。 周二上午十点左右,高三年级拍毕业照。我拿着微单,戴着帽子也...
    Ruth0419阅读 187评论 0 0