登录注册写文章

Day 2689：学习

Day 2689：学习

Seed-TTS 是由 ByteDance 研发的高质量、多功能的语音生成模型家族。该模型能够生成与真人语音几乎无法区分的合成语音，支持零样本内容学习，能够在发声器、情感控制和语音因子分解等方面实现高度的控制。通过自我微调方法，该模型在发声器优化和发声风格模拟方面取得了显著的效果。此外，Seed-TTS 还支持非自回归（NAR）的变体 Seed-TTSDiT，该变体采用全扩散架构，不依赖于预先估计的音素持续时间，能够通过端到端的处理进行语音生成，并在语音编辑方面展现了良好的性能。Seed-TTS 还能够进行跨语言内容创作，支持多种语言的语音生成，并在朗读、语音编辑和不同速度的语音生成等应用场景中表现出色。

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

ICLR2020国际会议精彩演讲抢先看（含源码）！！
来源：AINLPer微信公众号（点击了解一下吧）编辑: ShuYini校稿: ShuYini时间: 2020-02...
Shu灬下雨天阅读 2,766评论 0赞 0
语音合成学习（一）学习笔记
语音合成学习（一）学习笔记我们先要弄清楚一个问题：什么是语音，语音是由哪些成分构成的？语音就是人说的话，它的记...
鲸落_ALin阅读 621评论 0赞 1
语音合成(三)：端到端的TTS深度学习模型tacotron
TACONTRON: A Fully End-to-End Text-To-Speech Synthesis Mo...
MiracleJQ阅读 4,171评论 0赞 1
解析最接近人脑的智能学习机器--深度学习及并行化实现
摘要深度学习可以完成需要高度抽象特征的人工智能任务，如语音识别、图像识别和检索、自然语言理解等。深层模型是包含多...
蓝鸥科技阅读 1,331评论 1赞 14
语音交互学习
几个常见的语音交互平台的简介和比较 2018年07月12日 11:38:19青龙战阅读数：577 1.概述最近做...
Amy_GAOGAO阅读 804评论 0赞 3

赞1赞

赞赏

手机看全文