[2014.02.12] 介绍 Wit Speech 接口

原文: https://wit.ai/blog/2014/02/12/speech-api

语音控制是未来。科幻小说在几十年前就有这些情节了,但是我们现在还必须要移动一段距离去开电视或者设置一个闹钟。我们的任务就是去改变这个现状。给应用或者设备加上语音接口应该是一件容易的事情。

把说话转化成可以操作的数据

今天,我们非常兴奋得发布我们的新接口“说话转化成JSON”, 在“文本转化成JSON”接口运行四个月之后。
![]{https://d2n5jyo54r6d2a.cloudfront.net/blog/images/speech/speech2json.png}

从现在开始,您的应用,设备或者您的网站都可以发送音频流到我们的服务器,在返回值中拿到可以操作的数据。

我们来看一下它在智能家庭场景下的应用:
http://youtu.be/HXLmhyWkvFM

它是如何实现的?

在屏幕后面,Wit整合了多种最先进的自然语言处理技术和多种说话识别引擎以达到即使在充满噪音的环境或者语言有多种变化的情景下的低延迟性和高健壮性(对同一件事可以有一百种说法)。

值得高兴的是,您不需要关心所有这些细节。我们致力于创造极致简单的开发者体验。您只需要花费几分钟在我们的网站上就能启动起来。Wit可以适配您的所有领域,从冰淇淋分发到空间问题,我们不做任何的假设,保证100%的可配置。

您需要花费5分钟去构建属于自己的配置
http://youtu.be/CLVysc62w_A

使用API

接下来,调用API也是很简单的。我们提供了多种客户端的SDK完成音频记录和发送,在IOS和Android,甚至单个网页上。你也可以使用HTTP接口实时得录音和上传音频文件。

让我们来处理这段声音(录制在一处山谷中的庆典上,能听出来是谁吗?)

通过POST请求提交到 Wit API
curl -XPOST 'https://api.wit.ai/speech'
-i -L
-H "Authorization: Bearer $TOKEN"
-H "Content-Type: audio/wav"
--data-binary "@sample.wav"

您会得到这个返回值
{
"msg_id" : "6a84eae3-969c-41ad-94d9-85076fbbdc99",
"msg_body" : "set the kitchen table on fire",
"outcome" : {
"intent" : "set_fire",
"entities" : {
"object" : {
"value" : "kitchen table",
"body" : "kitchen table"
}
},
"confidence" : 0.997
}
}

想构建您自己的语音接口?来这里注册吧!
https://wit.ai/

Wit 团队

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 随着机器学习算法的流行,Amazon、Google,、IBM和Microsoft等公司在机器学习云服务市场接连出手...
    一个AI阅读 737评论 0 4
  • 001一秒做出决定(而不是一秒决定午餐) 书中分享的方法:限制时间、固定安排、犹豫机制,适用很多情况,但却没法决定...
    圣诗曼阅读 164评论 1 1
  • 去年冬天,我接了一个纪录片字幕编辑的工作,说是编辑字幕,其实就是最初级的将人物对话一点点敲击成文字。由于人物对话大...
    向小园子阅读 516评论 0 0
  • 由于我小学毕业了,大姐家又添加了二个孩子所以大姐又把妈妈接到家里我又一次离开了我的老家丁家仑,二姐巳在大哥努力下安...
    黄衍生阅读 228评论 0 1