我将利用gTTS库实现将文本转换为语音的功能,从语言选择、音频参数设置到文件保存等环节进行详细编写。运行前请确保已安装gTTS库,安装命令为pip install gTTS。ai数字人系统系统源码,AI数字人开发
from gtts import gTTS
import os
import logging
# 配置日志记录
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')
# 语音合成函数
def text_to_speech(text, lang='zh - CN', slow=False, output_file='response.mp3'):
try:
# 创建gTTS对象,设置文本、语言、语速
tts = gTTS(text=text, lang=lang, slow=slow)
# 保存音频文件
tts.save(output_file)
logging.info(f"语音合成成功,音频已保存为 {output_file}")
return output_file
except Exception as e:
logging.error(f"语音合成过程中出现错误: {e}")
return None
上述代码中,text_to_speech函数接收输入文本、语言代码(默认为中文zh - CN)、语速标志(默认为正常语速)以及输出文件名(默认为response.mp3)。通过gTTS库生成语音并保存为指定音频文件,同时利用日志记录合成过程中的关键信息与错误。