好莱坞明星中谁与自己的声音最相似? ​​​​

简评:声纹识别可以说是非常酷了 ~

戳链接直接试用:Voice Vector Webpage

每个人都有自己的声音,不同的人会有不同的声音。

有些人是萝莉音,有些人则是铁观音。

有些人的声音听起来很像,有些人则完全不同。

(突然正经)

这个项目基于分类模型的体系结构,利用神经网络,使用 VoxCeleb 数据集来查找单个语音向量(voice vectors),其中包含 1251 名好莱坞明星的 145379 句话语。数据集概况:

  • 性别分布:690 名男性;561 名女性
  • 年龄分布:20+, 30+, 40+, 50+, 60+(岁)分别为 136, 351, 318, 210, 236
Architectures

在神经网络训练的每一步,演讲者都是随机的。语音向量与文本无关,这意味着来自同一讲话者的任何一对话语都具有相似的语音向量。矢量距离越近,声音越相似。

使用 t-SNE 进行可视化时,声音有明显地依性别分类的趋势:

上方蓝点为 male,下方蓝点为 female

不过并没有年龄相关性的表现:

由此也一定程度上解释了,为什么有些人能完美模仿正太音、萝莉音、少女音和御姐音。(一个猜测,不一定对)

好了快回到文首玩玩这个声纹识别吧 ~


Github:andabi/voice-vector
推荐阅读:用 150 行 Python 代码写的量子计算模拟器

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 承接前面的《浅谈机器学习基础》、《浅谈深度学习基础》和《浅谈自然语言处理基础》,主要参考了《解析深度学习:语音识别...
    我偏笑_NSNirvana阅读 23,719评论 6 66
  • 昨晚,下了地铁,沿路走回家。 空气还有些许热度,白天的余温散播在空气中。路旁是小花园,零星几朵月季,正在盛放。比之...
    大溪阅读 657评论 3 2
  • 作为一个已经读研的新闻学学生,说一句我是新闻人,却一点都不为这个职业感到骄傲,随着自媒体的强势崛起,随时随地...
    暖风过境_阅读 557评论 0 0
  • 不管你做什么都要有一个好的心态,心态决定一切,何况我们做了微商更加要有一个好的心态, 我们无论遇到多不好的事情,...
    微微一笑_737d阅读 334评论 0 0
  • 生活就是一个坑, 坑了他和她,还要坑了我。 生活就是一个洞, 摔了他和她,还要摔了我。 生活还是一场梦, 梦了他和...
    暖笑如云阅读 174评论 0 1