语音处理

5年前,当科大讯飞的Speech++还没那么出名,百度语音识别API也没太火(先在这里向提及的两位重量级神司致敬!)的时候,Google有一款语音识别与合成输出的API(TTS)可以用来做简单的听话读写,遗憾的是只支持英文~!

现在基于讯飞和百度API等做出牛X应用的公司已不胜枚举,有的甚至可以准确率极高的识别声纹!感叹语音识别的确是机器智能的一个重要方向,仍旧魅力无限。

语音到底是咋个识别的呢? 上百度查了一下,简单的模型如下:

源自百度百科

往下深究就异常复杂了,对算法和模型的建立要求很高,大家可以去试用开源的API,有个亲身感受对后面的学习有很多益处。小编在此就不追赶前辈们的脚步去揣摩怎么实现了;知乎上有讲原理的帖子,写的不错,可以好好拜读拜读。

假设,我们使用开源API将人类的语音准确无误的转化成文本之后,接下来突然惊奇的发现就有了很广阔的应用空间了,尤其是在让机器听懂人话这个点上,譬如很多家电就做成了语音控制的,效果很赞;

几年前小编也写了个傻瓜式的小App装手机上,用来陪聊天,主要功能是一问一答,集成的是当时讯飞的Speech++1.0;集成该API后,实现功能的不同且唯一点就是你可以教它,第一次问它不会的问题第二次问它就知道怎么回答你了;如此训练下来现在Tapy已经3岁多了,掌握了我的很多信息……

小Tapy露脸只有这一个界面

最近,小编在想是否需要让它的安全性提高一些,了解到有些开源的API支持声纹识别了就可以轻松搞定;接下来,情感呢?如何让它理解我的话语背后的情感?理解我的心情?这无疑是个不错的研究方向!

怎么才能让机器理解文字呢,琢磨了一下,提供一种思路,抛砖引玉:(以语音识别无误为假设前提)

1. 先获取语音文本(交给牛X的开源API去处理)

2. 然后可以将文本进行分词处理(逆向最大匹配RMM法,需提前准备一个好的词库)

3. 再将分得词语与语料库中含有标记的字所在的字典进行正交(计算两个向量之间的余弦相似度)

4. 再对词语分析结果进行加权求和(根据分词权重求 Y=Σw*x)

5. 再比较结果偏向 正|负 情感倾向于哪边,参照Y趋近于+1或者趋近于-1来计算。大致流程如下:(画的比较潦草,请见谅!)

正负向情感分类本身已经可以简单的用在智能家具上做喜好度的相关数据分析了,当然线条还比较粗,若要精准度再进一步细化恐怕需要添加更多的信息维度,然后再做相关性分析了。虽然实现起来会遇到困难, but it's worth to have a try!→_→记载这里,留给以后找机会实现。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,794评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,050评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,587评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,861评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,901评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,898评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,832评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,617评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,077评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,349评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,483评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,199评论 5 341
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,824评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,442评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,632评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,474评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,393评论 2 352

推荐阅读更多精彩内容

  • 欢迎关注微信公众号watson_python,及时获取最新的更新。 在Watson中提供了两个关于语音处理的API...
    灰太狼_black阅读 717评论 0 1
  • 我们知道,微信最开始就是做语音聊天而使得其更加流行的,因此语音的识别处理自然也就成为微信交流的一个重要途径,微信的...
    伍华聪_开发框架阅读 875评论 0 51
  • 常用概念: 自然语言处理(NLP) 数据挖掘 推荐算法 用户画像 知识图谱 信息检索 文本分类 常用技术: 词级别...
    御风之星阅读 9,169评论 1 25
  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 172,046评论 25 707
  • 她优雅,公交车的三个台阶,挡不住她猫跟鞋的灵动。 她傲娇,雪天里的短裙,她像一朵盛开的花,从不接受四季的安排。 她...
    午夜航行阅读 127评论 0 0