你想过充满语音的未来有什么不同么

城市未变,生活变了

语音是很多刚刚想涉足人工智能领域的人所忌惮的,因为从多个角度来说,语音的发展进程较为波折,有几个现状:

语音方面的技术比较难实现,预处理过程比较复杂,语料库不充足,研究的人少,均导致各方面开放的资源就相对稀缺,发展起来也就更加缓慢

现在移动互联网时代还是人们生活的主要解决问题的方式,而媒介是手机,使用界面来传递信息的,这几年人们已经习惯这种方式,突然之间换到没有界面,传递信息相对单一而且缓慢的语音方式,就会有很多抵触的地方,使用起来感觉很奇怪,让不少产品横尸街头

人工智能虽然被大力支持,但开始的时间还为时较短,人才供应难以满足企业的需求,企业想要短时间内将技术可以产品化的成熟工程师,毕竟消耗的财力物力巨大,不过还在转型的工程师,或者读相关专业的学生很多还不足以达到这个标准,语音尤为明显,所以市场上处于一个浮躁,焦虑的状态。


但是意味着语音会在发展中慢慢淡化,甚至只能成为一场泡沫么,我认为不仅非但如此,语音才是人们接受人工智能真正的入口,而且也是将来应用范围最平常,也最广泛的场景。现在的界面给了人们挑选的空间,多样性,信息输入的多样性,但是人们越来越受其影响,效率低下,疲于选择,易于沉迷。

就上面,我分开而谈。我说语音是入口,这样讲,如果你问一个普通人,你认为在一张图片中检测出车牌号,手机APP给你推送你最喜欢的新闻,商品,这是人工智能么,他可能也说不清楚是与否,可能他都没有察觉出这些变化,但是你要问他,你能和机器像和人一样对话,是人工智能么,它会毫不犹豫的肯定,因为说话是判断一个人最直观,也最自然不过的方式,人们不懂算法,也不懂数据,就知道我面前的这台冷冰冰的机器能和人一样与我交流,在交流中为我服务,那就是智能,所以,语音是最合适的入口。

而我之所以会说语音的应用场景会是将来最广泛的,是因为随着对模型的不断训练,医院可以通过扫描过大量图片的机器判断疾病,警察可以通过人脸检测判断嫌疑犯,金融可以通过相关算法预测股票,但是语音最合适的场景却是贴近人们再平常不过的生活,教育,法律,生产虽然都会加入语音,但是机器真正解决人们需求的关键点并不在此,它放在具体的这些领域就是换了一种输入输出方式,其实是可有可无的,但是在普通人的生活中,可以随着语音在各类场景的全覆盖,经过长时间的体验,适应,改变解决问题的方式,会潜移默化的让人们从屏幕上解脱出来,摆脱地点的限制,随时随地用最直接的方式接收输出信息,控制生活的一切,最终享受于只要说话就可以解决生活很多问题的状态。

再向前进一步想象,语音的普及状态会是什么样的,那将会是一个万物互联的社会,最近总频繁听到这个描述着未来的词,那么怎么一个互联的方式呢?泛泛而谈比较抽象和枯燥,也有点一直给语音打广告的嫌疑,那我用你将来平常的一天说说这个用语音互联起来的生活。

语音引领万物互联

未来的一天,早上六点整,智能音箱叫醒还在熟睡的你,你随口询问今天的天气情况,报告天气后,它顺便提醒你今天是冬至,别忘了吃饺子,你们简单的探讨了一下什么馅更好吃之后,让音箱在附近的饭店定了一盘水饺外卖,并备注让店家40分钟后送来,因为跑步是你每天要做的事。出了门你戴上配套的智能耳机,唤醒了助手,让他放几首平时爱听的歌。跑着跑着,看见几只小猫在公园里,忍不住去逗逗它们,竟忘记了时间,耳机提醒,还有5分钟外卖就要送到了,你开始往家跑,还是迟了,外卖小哥打来电话,用耳机直接接听后,叮嘱他放在门口。回到家,摘下耳机,洗漱过后,唤醒了音箱,让它播送最近的新闻,一边听,一边吃饺子,口令换了几个频道,没有什么感兴趣的,就关掉了。

吃饱后,开车去上班,上车后唤醒了车载语音助手,让它给自己导航现在不堵的路线,毕竟是早高峰。刚要启动,突然想起家里的灯没关,就让助手赶紧把家里的灯关了,并让它检查了一遍还有什么没有关,确认无误后,安心上路。开了一会,车载助手提示你有人给你发微信,你让它把内容念一下,原来是在家读书的妹妹今天过生日,忙于工作的你竟然忘记了,就让助手选一只价格在200元左右的钢笔,选好颜色后,助手把图片发到了车载屏幕上,感觉不错,就口令支付购买了,然后让助手给妹妹发一条“给你准备了一个小礼物”的回复,算是有惊无险。

到了单位,唤醒办公室的音箱,询问了一下你今天有几个任务要完成,怕自己偷懒,你让它给你为每一件事设定了完成的时间,到时提醒。其中有一件是你需要给其他的同时发邮件,你就直接一边想内容,一边说给助手,让他给同事发去了,省去了界面切换的繁琐步骤。正在埋头苦干,领导突然让下周去外地出差,于是急忙让助手订一张前一天的机票,同时订了一家机场旁边的酒店,简单选择好房型,价格后迅速预订,继续工作。中午吃饭回来,老板通过助手叫你们开会,你们一边听,一边交流,效率很高,会议室的助手已经把会议记录转写了文字,发到了邮箱里,不用担心错过或者忘记什么内容。

下班回家,出了公司,戴上耳机,询问了下给妹妹买的钢笔发没发货,顺便让助手把家里的热水器打开,操作和等待变成了一句话。开车到了家,一个人的生活难免比较无聊,就习惯了叫助手陪着聊会天,他什么都知道,也会给你打开一些工作中的心结。聊着聊着,心情不错,让它看看冰箱里有什么菜,给你推荐了几个对应能做的菜谱,选了一个简单的,它一边念,你一边做,并贴心的放起了平时爱听的歌,别有惬意。睡觉之前,和它交代了一下明天的工作任务,就睡了,明天又是重新开始的一天。


故事讲述起来是平淡无奇的,但是这平淡无奇的一面就是大多数人生活的样子,而语音在这种平淡无奇的生活中,才能发挥它的极大价值。(故事没有描述快递是无人车送达,吃饭的服务员都是自动化餐桌或者机器人服务员,楼道里的清洁人员已经是扫地机器人,公司或马路上配备的自动诊疗仪可以随时检查身体状况,我们主要说语音的应用)

通过故事可以看出,虽然只是一个普通的上班族,在使用语音设备为其服务时,都会包括但不限于上面提到的,物流,外卖,电商,记事,提醒,发信息,导航,读文本,家居,闲聊,听歌,接听电话,支付,新闻等等众多领域,我们总说互联网应用场景的丰富给了人工智能更多的发展空间,但正因为应用场景多了,要想满足人们生活里再平常不过的需求也变得不那么容易,一旦场景的丰富度不够,那么体验效果就会有所下降,如果硬件环境不能随着场景一起覆盖,不能完全发挥语音的便利性,所以语音的这条路还要有很多事情要完成。

我们借用语音的意义就在于增加我们解决问题的效率,多样性和趣味性,不是刻意的使用语音,而是在随时想要快速完成一件事情时,只要自然地,习惯性地说一句话,就可以解决,而这需要机器将前期工作做到极致,也需要搭建起软硬件丰富的生态圈。

故事里有几个现在在技术和产品设计上都尚需攻克的问题:

一、如何将多种硬件(耳机,音箱,家电)互相之间建立联系,彼此控制,软件是互通的,并且实时在更新内容

二、如何实现用耳机,音箱可以长时间,远距离语音听写,同时还要设计好随时删除,修改的功能

三、如何预定各种票务,购买商品

四、计算机用算法筛选商品不是问题,怎么以用户最方便的方式接收到结果

五、如何根据用户一段时间的生活习惯,主动为其推送消息,或者主动服务一些功能,以什么形式,什么时间点呈现?

六、机器能否实现同时并行的做两件或者以上的事(放音乐,说菜谱)

七、闲聊时候不能总是用兜底回复的方法,如何解决百科问题,专业问题,甚至情感上需求的问题,态度中立,理性分析,这可能不只是技术上的事

八、由于场景的多样性,不能一直处于唤醒的状态,如何在没有唤醒的状态下也能提醒用户日期,日程,新消息等信息

九、如何做到摆脱界面的支付,同时具有较高安全性

十、如何控制说话的信息量,说话节奏,语速,音量,才能让用户不会排斥

十一、说出去的话,泼出去的水,语音这种即时性的使用方式,如何设计才能给用户以确认的时间。提示?还是重复?

语音因为受众面是每一个普通人,所以对于产品的体验要比其他方向更看重,反倒对技术的精准性达到人们满意的程度就好,这样对交互设计师,产品经理的要求也就更高。

带着上面这些问题,接下来我对现在AI各公司的应用,芯片,开放平台等布局进行总结以及分析,看看哪些问题已近解决,那些仍有很长一段路要走,哪些更侧重于技术,哪些更侧重于设计,这对于各公司找准定位,竞品,发展方向,找到解决问题的思路都有一定益处。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,192评论 6 511
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,858评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,517评论 0 357
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,148评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,162评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,905评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,537评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,439评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,956评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,083评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,218评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,899评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,565评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,093评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,201评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,539评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,215评论 2 358

推荐阅读更多精彩内容