关于语音助手,普通人类想要知道的都在这里了

首先,点开这篇文章看的你,一定是不普通的人类。因为在这个时代使用语音助手,意味着你要有很多好奇心和耐心,去探索并包容新生事物的不足,去相信“未知”一词包含的无限可能性。

没有你坚持不懈地调戏人家,

语音助手就不会变聪明、

未来人工智能就不能顺利统治地球呢!

是的,当前形态的语音助手并不足够好,但它依然是人工智能技术在我们日常生活中最成熟、广泛的应用方式。你可以将语音助手看做是一个住在各种智能设备里的机器人大脑幼体程序,当它进化出判断力和创造力之日,就是人人拥有强大的管家贾维斯之时(也可能是被统治、每晚给语音助手讲恐怖故事:程序猿来了)。

语音助手是什么

语音助手是一种语音控制程序,通过智能设备上的收音硬件,它能听见你的话,进行语义判断,然后在前台迅速做出回应:通过麦克风和你语音聊天,或者听令帮你操控智能设备。

这种黑科技是如何实现的

语音助手被唤醒、听明白、会说话的过程,背后对应的是机器学习(深度神经网络)和数据挖掘算法,以及语音识别、语义理解、语音合成技术,并需要语音知识数据库进行云端支持。

高能预警:这一趴内容打开姿势较为专业~

* 何谓机器学习

拿灵犀语音助手来举例,将科大讯飞公司的讯飞超脑技术作为深度神经网络后,就能不断自我学习了解主人的说话方式和爱好需求,进而给予个性化反馈服务。

* 何谓语音唤醒

通过含有特定唤醒词的语音输入来“触发”语音识别系统以实现后续的语音交互。全天候黑屏唤醒最早由摩托罗拉在2013年通过硬件优化实现,摩托罗拉重返中国后的第一款手机 moto x通过灵犀语音助手来实现唤醒后的操控(相关视频见文章最尾部)。

* 何谓语音识别和语义理解

声音是一种波,说到底还是信号处理问题。你可以理解为建立一套人和语音助手都懂的编码,语音助手的理解过程,就是通过解码引擎在云端数据库里又快又准找到编码对应的最优内容。

* 何谓语音合成

像指纹一样,每个人也有独特声纹,语音合成就是将真人声纹特征采样、编码,经过连读韵律优化后,将任意文字有表现力得转化成虚拟人声。

世界上第一个使用全息投影技术举办演唱会的虚拟偶像、宇宙第一公主殿下、全二次元维度人类的老朋友——初音未来就是因为使用了这项技术被怀疑假唱的。

人类对人工智能的幻想成真史

各国神话、传说里一早就有工匠创造人形生命的真假故事。中国古代神话中三头六臂的哪吒也可以看作是一例,以莲托生,法力无边。

世界第一部科幻小说,英国诗人雪莱的妻子玛丽·雪莱1818年创作的《弗兰肯斯坦》描述人类试图以科学研究制造智能生命的故事。

1950年,计算机学家阿兰·图灵提出著名的“图灵测试”。如果一台机器与人类(通过电传设备)展开对话不被辨别出身份,就具有智能。

1952年,贝尔实验室研制出首个实用语音识别设备,能识别10个英语数字发音。

1968年,科幻大师克拉克电影《2001太空漫游》中,2001年人类能够制造超级人工智能HAL-9000。其中,HAL在被关机时唱的歌,正是1961年贝尔实验室创造出的、世界上第一首由电脑唱出的歌。

1966年,最早也是最著名的聊天机器人程序Eliza诞生,她被设定为一个精神治疗医师。有趣的是,Siri发布时,Eliza也被再次请出进行对话。当时,Eliza和 Siri 之间年龄相差 45 岁,内存相差 200 万倍。

1976年,美国克雷公司推出了世界上首台运算速度达每秒2.5亿次的超级计算机Cray-1。

1997年,IBM公司的“深蓝”电脑打败了世界国际象棋冠军盖瑞·卡斯帕罗夫。“深蓝”每秒可以计算2亿步。

2004年,日本本田公司研发出先进的人形机器人Asimo。

2011年,IBM研制的超级机器人“沃森”在连续三天的比赛中战胜了“快问快答”节目中最优秀的两名人类选手。后来他们就跑去TED,靠吐槽沃森为生了。

从1952年开始用时半个多世纪,语音识别技术经历了由小词汇量、孤立词的识别到大词汇量、非特定人连续语音识别的飞跃,终于,2011年10月,苹果公司发布搭载了人工智能软件Siri的iPhone 4S手机,语音助手从此被公众所关注。

那些出名要趁早的语音未来们

由于智能语音技术的研发周期长、投入大,行业进入壁垒较高,时至今日,全球范围内技术应用成熟的语音助手并不多。当下认知度较高的语音助手包括:乔布斯家的Siri,谷歌家的Google Now、微软家的Cortana小娜,我国国内也有技术成熟厂家,在中文识别方面甚至更胜国外巨头一筹,如科大讯飞家的灵犀语音助手,以及Robin最近力推的度秘等。

需要区分的是,早年的MSN机器人、小黄鸡Simsimi以及小冰其实属于聊天机器人范畴,而“闲聊”在语音助手的职业生涯里只属于附属功能,后者更注重事务处理和知识服务。

谁是最强的语音助手?

我们可以看到,以上日常能用到的语音助手,出于平台需要、发展战略等原因,它们像人类一样,包装有不同个性和生存技能,但从本质上来说,判断一个语音助手强不强,要看它的大脑模型是否聪明,语音识别率是否准确。这决定了在日常环境中,它是不是一个随时待命、反应迅速、机智体贴的虚拟陪伴者。

假如各具特色但本质相同的语音助手们合体成一个,作为主人的你,一天将是怎样度过?

↓↓↓这盛世如你所愿↓↓↓

有了语音助手,哪些人类职业最先狗带(go die

1. 百事通

讯息爆炸时代,百科知识交给语音助手背后的搜索引擎来记录就好,同时也要警惕知识外包的后果。

2. 秘书助理

个人日程安排交给语音助手来处理,更高效、私密。

3. 毒舌主持人,《奇葩说》嘉宾等

除了不会翻白眼,我们语音助手吐得一手好槽呀!

最后,未来的语音助手究极体是什么形态?

可个性定制,以虚拟+实体形态和主人愉快玩耍。

......放错图了。

必须是个性定制的全能信息处理者,主动判断、预知需求。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,029评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,395评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,570评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,535评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,650评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,850评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,006评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,747评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,207评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,536评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,683评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,342评论 4 330
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,964评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,772评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,004评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,401评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,566评论 2 349

推荐阅读更多精彩内容