人工智能与语音识别
讯飞语音输入
关于今天体验了一下百度输入法8.0版本的语音输入的功能。
就体验来看,它的语音输入的能力是很不错的。显然,语音识别已经达到了国内关于中文语音识别的领先水平,当然和方片收集里面用的讯飞引擎还是有一些差距的。
具体的,我正在用语音来记录自己的想法,我现在感受就很明显,讯飞的识别率基本上是不会出错的,特别是关于中文方面,百度有的地方就会出现一些小的瑕疵。其实,关于这一点,我更多的是没想到百度在语音方面竟然逐渐的追上了讯飞,包括腾讯,搜狗,阿里,对于这方面都有一些自己独到的模型和算法。讯飞作为国内语音识别的第一人,确实感到了巨大的压力,不过讯飞在这方面确实是领先的,虽说可能是百分之一的差别,但确实是这百分之一造成的了一个短期内不可跨越的鸿沟,讯飞还是当之无愧的第一。
技术的积累还是需要一个长期过程。所以,讯飞在未来的时间内,不仅仅是要寻求技术的突破,更多的是需要从技术到应用上面能够突破,形成自己的生态的完美闭环。
中文识别进展
据此,想到我们国内关于语音识别的技术,中文语音识别只有中国人能够做到了,国外的一些技术大咖可能关于这些方面的论文有很多,都有独到的见解,但是毕竟那是试用于国外的语的,中文语音的说话方式,发音方式以及遣词造句的方式都是与英文或者说以拉丁文为母系语言的是完全不同的,是独立于他们之外的一套语言系统。
我作为一个文科生,也很关注这些关于未来的一些变化,整体来看,人工智能和AI必然是大势所趋,像谷歌的语音助手已经能够具有上下文语境语音识别的功能,在语境中能够进行分析,目前国内的还做不到。
机器学习里面的模型关于语音识别的有很多, 但需要大量的语义资料和语音数据来分析和模型优化。目前国内的积累还是有所欠缺,但是我们不妨朝前看,未来我们肯定能够做到这一点的,由于中文的问题,可能难度更大,但是大不了就让机器人多问一些问题罢了,但结果必然是好的。
特例苹果公司
苹果公司是一个例外,为什么苹果自带的语音助手siri还是这么笨,虽然说采用的是shortcut这个办法能够让你的助手越来越智能,但实际上却是伪智能,将操作的流程和结果用语音识别保存,就相当于是设定了一个脚本,无非是个脚本的执行方式,不是你点一下按钮而是用语音识别来实现。
苹果在语音识别方面没有取得先机而落后于其他的互联网公司,这点是我没有想到的。国内一直是紧跟着潮流,把国内的各方面都做到紧跟上国际的形势,这件事非常值得我们去称赞,尤其是有些比国外更厉害。比如说智能音箱,我也买了一两个,特别是天猫精灵,用了之后,感觉上来说还是比较笨,只能说用最简单的指令,说你好天猫,然后告诉他帮我干什么事情。而且“你好,天猫”是唤醒词,每一句指令的前面都要加上这四个字,而且不具有上下文的语境识别功能。虽说已经具有了声纹支付的能力,但是最关键的上下文的语境分析能力还很不成熟。
语音识别上,讯飞、百度、搜狗、阿里和腾讯都具有了一定的技术积累,随着水平不断提高,在不远处的未来,肯定是可以实现上下文语境识别功能的,完整的机器人与人的对话也是指日可待的。
人工智能与未来
在这样的浪潮中,我们能够做什么呢?未来必然是人工智能的时代,就像是外国的书《奇点临近》一样,现在机器人的智力已经逐渐逼近人的智力,甚至有所超越,而且理解能力已经跟人的水平快不相上下了。目前人工智能还没办法写代码,如果人工智具有人的理解能力,能写出逻辑代码那么就可以自我复制,这件事想想就很可怕,显然机器人还远远做不到这一点的。目前来说,机器人关于创造性的工作是不行的,还是需要人的,自动化也是在部分程度上解决人的劳动,将人从更繁复的工作中解放出来,让人在更具有创造性的和难以用机器人取代的工作上面来。不能成为研发者,成为应用者也是顺应时代了。
语音识别的应用
语音识别方面就有很多可以利用的地方,如我现在把自己一些想法直接说出来,然后转换成文字存储起来,再用其他的时间整理一下思路,比我用手来打字快了很多,而且不必局限在电脑和手机前面,文字编辑将是人人都可以尝试的了。
当然,由于是说出来的,会带有很多的口语的东西,这也是我在说的过程中必须去极力避免的。 另外一个就是要口齿清晰,吐字清楚,它才能更好的识别出来。目前我说的过程中有些口齿不清的地方,结果就会出现很尴尬的错误。
整体来说,这样把我一些想法,把我的一些想写的东西,都可以更加快速的说出来,其实是很舒服的。难点在于目前对于数学公式、代码,这些还是没办法识别出来,看来程序还是需要程序员来写,具有不可替代性。
说文章还有一个坏处,就是你想到哪里说哪里,没有一个整体的概念。这样的话就是有点像是意识流,整篇文章就会显得有些散,后面编辑的话就会花费大量的功夫。小说或者推理性强的悬疑之类的就很难通过说能够把这样的文章写成了。
我们不单说它的好处,我们也不仅仅谈论它的坏处。综合评价,这样的方式,对于写一些新闻稿,写些快讯,写些想法,是很有帮助的,写技术类的文章可能就捉襟见肘了。
拥抱未来
对于未来,我是抱有乐观的态度的,未来肯定是值得我们去,想象和赞美的。
如何去拥抱未来,如何不让未来把自己淘汰,这是我们现在必须关注的,未来的10年乃至20年必然是激荡的。这两年的无人驾驶,能够有效的取代长途货运司机,但实际上长途货运的300万工人,或者是中国的800万工人,如果取代了之后,他们将去何去何从,这不仅仅是技术问题的,更多的是社会的问题,更多的是伦理的问题,在保证技术的发展,同时要保证社会的进步,这才是关键。
社会在进步,我们也必须要进步,只有我们的进步大于社会的发展,我们才能不被社会所淘汰,当然这是理想的。技术和社会的发展太过于迅猛,我们要紧跟着时代的步伐,不能让自己被社会淘汰,不能成为社会的领军者,我们也要努力的跟上时代,不能成为时代的弄潮儿,我们也要抓住时代的尾巴。