微软语音包下载地址:
https://www.microsoft.com/en-us/download/details.aspx?id=27224
可以选择中文相关的下载
MSSpeech_TTS_zh-CN_HuiHui.msi
MSSpeech_TTS_zh-TW_HanHan.msi
MSSpeech_TTS_zh-HK_HunYee.msi
MSSpeech_SR_zh-CN_TELE.msi
MSSpeech_SR_zh-TW_TELE.msi
MSSpeech_SR_zh-HK_TELE.msi
涉及的术语:
TTS(Text To Sound)是文本转语音
SR(Speech Recognition)是语音识别
根据提示,需要先安装运行环境。
如果是软件开放,还需要安装SDK
Windows系统中如何添加语音
设置 -> 时间和语言 -> 语音,点击添加语音,弹出框中输入中文查询/添加
安装pyttsx3
pip install pyttsx3
更多内容见官网:https://pypi.org/project/pyttsx3/
简要介绍pyttsx3的特性
- 可以使用本机的语音包将文字转换为语音。
- 可以直接播放语音,也可以将语音保存为mp3文件。
- 可以设置音量,可以调整语速。
官网中提到 voices[0].id 是男声,voices[1].id) 是女生,描述不准确,应该和自己电脑中的语音包有关。
在我的电脑,默认有三个voice,分别是中文、日语、英语。
voices = engine.getProperty('voices') #getting details of current voice
#engine.setProperty('voice', voices[0].id) #changing index, changes voices. o for male
engine.setProperty('voice', voices[1].id) #changing index, changes voices. 1 for female
Python代码查看本机可用的语音包
import pyttsx3
tts = pyttsx3.init()
voices = tts.getProperty('voices')
for voice in voices:
print('id = {} \nname = {} \n'.format(voice.id, voice.name))
我又安装了两个语音包,所以本机有5个语音包
id = HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_ZH-CN_HUIHUI_11.0
name = Microsoft Huihui Desktop - Chinese (Simplified)
id = HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_JA-JP_HARUKA_11.0
name = Microsoft Haruka Desktop - Japanese
id = HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_EN-US_ZIRA_11.0
name = Microsoft Zira Desktop - English (United States)
id = HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_ZH-HK_TRACY_11.0
name = Microsoft Tracy Desktop - Chinese(Traditional, HongKong SAR)
id = HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_ZH-TW_HANHAN_11.0
name = Microsoft Hanhan Desktop - Chinese (Taiwan)
各种语音包效果(不能上传语音,放弃)
曾经有一份真诚的爱情摆在我的面前,但是我没有珍惜。等到了失去的时候才后悔莫及,尘世间最痛苦的事莫过于此。如果上天可以给我一个机会再来一次的话,我会对你说三个字‘我爱你’。如果非要把这份爱加上一个期限,我希望是一万年!
python程序(通过程序界面实现文字转语音功能)
运行后界面如下:
效果评价
满满机器人发音味道,声音不够自然。
python源代码
import PySimpleGUI as sg
import pyttsx3
import time
# 语音包序号,默认第一个(中文)
voiceIdx = 0
# 主题色
sg.theme('DarkAmber')
# 窗口布局
layout = [
[sg.Text('请输入需要转换为语音的文字')],
[sg.Multiline('', size=(100,10), key='textContent')],
[sg.Text('调整速率')],
[sg.Slider(range=(100,400), default_value=200, size=(50,15), orientation='horizontal', font=('Helvetica', 12), key='rateNumber')],
[sg.Text('语音选项')],
[sg.Radio('中文', 'S1', enable_events=True, key='id0', default=True),
sg.Radio('日语', 'S1', enable_events=True, key='id1'),
sg.Radio('英语', 'S1', enable_events=True, key='id2'),
sg.Radio('中文(香港)', 'S1', enable_events=True, key='id3'),
sg.Radio('中文(台湾)', 'S1', enable_events=True, key='id4'),],
[sg.Button('试听', key='ttsButton1'), sg.Button('转换为MP3', key='ttsButton2'),]
]
# 创建窗口
window = sg.Window('文字转语音工具', layout)
# 循环处理事件
while True:
event, values = window.read()
# 用户点击X关闭窗口或点击退出按钮
if event == sg.WIN_CLOSED:
break
if event == 'id0':
voiceIdx = 0
if event == 'id1':
voiceIdx = 1
if event == 'id2':
voiceIdx = 2
if event == 'id3':
voiceIdx = 3
if event == 'id4':
voiceIdx = 4
print(voiceIdx)
if event == 'ttsButton1' or event == 'ttsButton2':
# 初始化
tts = pyttsx3.init()
# 获取新旧 RATE
rate = tts.getProperty('rate')
newRate = int(values['rateNumber'])
# 修改 RATE
tts.setProperty('rate', newRate)
# # 获取 VOICES
voices = tts.getProperty('voices')
# # 修改 VOICE
tts.setProperty('voice', voices[voiceIdx].id)
# 获取文字
textContent = values['textContent']
# 试听
if event == 'ttsButton1':
tts.say(textContent)
tts.runAndWait()
tts.stop()
#并转换为MP3
if event == 'ttsButton2':
mp3Filename = str(voiceIdx)+'_'+str(time.time())+".mp3"
info = '转换成功,详见:' + mp3Filename
tts.save_to_file(textContent, mp3Filename)
tts.runAndWait()
sg.popup('', info, '', title='提示')
window.close()
补充
如果你本机的语音包和我的不同,需要修改语音选项相关代码