一、 前言
1、背景介绍
人工智能近年非常火爆,但概念居多,让市场上印象非常深刻的产品,尤其ToC的产品相对较少。虽然人工智能未来发展不可估量,但找到合适的应用场景,落地实现,无论到何时都是非常重要之事。作为想要转型AI的产品经理,面对市场上琳琅满目的产品,我选取了在语音识别领域非常出色的科大讯飞公司出品的讯飞语记这款产品进行了体验。
2、体验环境
2.1产品名称:讯飞语记
2.2 APP版本:3.0.1147
2.3体验机型:魅族Pro6
2.4系统版本:Flyme6.1.0.0A基于Android6.0
2.5体验时间:2017.07.29
3、分析目的
了解讯飞语记的产品定位、产品功能、商业目标等
从讯飞语记入手,了解语音识别的基本情况,了解AI在产品上的应用
通过产品的优劣势分析,总结产品上应如何利用AI,优化产品体验
4、需求分析
1)基本型需求:记录笔记、字体样式调整、笔记搜索收藏、多端同步、笔记分享、笔记密码
2)期望型需求:语音笔记、语音录入、备忘提醒、多语言识别、更精准的识别、离线识别
3ㄘ 兴奋型需求:笔记语音导出、多语音音效、语音搜索、接管系统语音、朗读阅读软件中电子书
4)无差异需求:分享纯文本、试听笔记
5)反向需求:广告、识别不准确、合成声音不清晰
二、 产品分析
1、产品定位
1.1产品现况
讯飞语记,首先是一款笔记类应用,但不同于其他笔记产品,讯飞语记主打语音记录,支持语音笔记,语音录入,同时还可以将笔记用语音进行导出。
从产品月均使用设备数量来看一年时间里,使用数量增长两倍左右。环比增长降低,仅有1.7%。目前使用数量相对较稳定。但17年1月份使用设备数量出现明显的下降,一方面或许与过年前后使用的人数减少,一方面,1月份后增加了两种账户类型,其中对于VIP账户,开始了收费模式。另一方面,或许与讯飞16年11月份刚刚做了一次产品发布,发布会后有大量用户下载,随着时间,有些用户开始不再使用。但考虑到讯飞一直处于不太作宣传的情况,留下的用户以及之后新增的用户大部分为自愿使用,故留下的用户,大多比较稳定。
1.2用户画像
从使用人群来看,不同的统计渠道得到的结果非常不一致,但有一点是确定的使用的男性较多。个人猜想,可能一方面,男性更愿意使用笔记记录日常的工作或学习以及其他笔记(有道云笔记、印象笔记均显示男性使用者比女性使用者更多)。另一方面,可能男性对新的科技,例如语音识别,语音合成等更感兴趣,而讯飞语记则主打语音,故男性用户会更多一些。
从使用人群年龄分布来看,大多集中在25-30岁与31-35岁之间。这应该跟这部分年龄的人,大多已经在工作阶段,大多数会有记录笔记并且多端共享的需求,这点与其他云笔记类产品相同。
用户区域大多在一线城市与沿海城市,可能这与人群密度以及城市发达程度有关,并且这些城市也有更多的科技类公司。同时,对于不同的笔记类产品,南方一代会有讯飞语记用户比有道云或其他的笔记类用户多的情况。个人猜想,或许与语音识别中支持粤语等很多南方方言,使的识别度更高有关。
由于百度指数中没有讯飞语记这个关键词,故我直接查询了讯飞这个词,从这个需求图谱来看,查询讯飞的人,大多关心语音、翻译、输入法。可见讯飞的语音识别深入人心,而关注讯飞的人,大多数都是对语音输入或者语音翻译感兴趣的。
1.3总结
从以上分析可以看出,首先讯飞语记作为科大讯飞出款的产品,语音识别是其最大的竞争优势,而使用的用户,也大多是因为语音开始使用此款产品,但此产品作为笔记类产品,并没有除语音外特别明显的优势。
2、产品体验
2.1产品基本框架
2.2产品核心功能
2.2.1编辑笔记
讯飞语记作为一款笔记类产品,基本的笔记编辑功能都有,常见的项目编号,删除线,字体的编辑等基本功能都有,并且还增加了一个引用的功能,对于引用某些内容时,可以非常清楚的表示出来。同时,有一些差异化的功能,例如插入语音,语音录入。但还是欠缺很多功能,例如插入表格,字体颜色的调整均没有。
2.2.2语音录入
对于一款备忘笔记类产品,当突然想起记点什么东西的时候,语音录入会比手动录入方便很多。同时,对于一些灵感,需要记录时,可以随时拿起手机说出来,记录下来,然后晚上在家可以在进行整理。由于用嘴直接说出来,要比用手打字会快很多,这样,也可以很好的提升效率。但我在使用的时候,发现还是会有一些不够方便的点。1)唤醒程序不是非常好用,当接管了系统的语音识别后,每次说打开讯飞语记都会在网页进行搜索,却无法直接打开程序。而直接说”语记“,则会被识别为”雨季“,无法打开程序。但很奇怪的是尝试几次后,打开其他程序,例如微信、支付宝反而可以顺利打开。2)通知栏快捷记录需要手机解锁、下拉通知栏、选择语记,步骤链路过长,当需要语音记录时,很多是由于不方便打字,这个时候,减少手机上的触屏操作才能带来更好的体验。3)记录的时候,由于是靠停顿长短增加逗号与句号的,但记录时,识别不够准确,而且有时思考说的内容也会停顿,同时,文思泉涌时又不会停顿,导致整片都没有标点。并且符号单一,只有逗号,句号问号,对于一些其他的标点或换行均不能支持。虽然增加了语音记录的同时,可以手动选择一些符号,但是在语音记录时,更多的场景是不方便手直接打字,例如走路时,跑步时,买菜时等等,想直接口述完成所有的事情,如果口述时还需要记录手动增加标点事情反而变得更复杂了,同时也无法很好的提升效率。4)记录时选择了普通话则无法识别英文,选择了英文则无法识别普通话与其他方言。但很多时候,我们记录多是想到什么说什么,就像我们平时说话,还是会有各种语气,中英穿插,或者穿插着方言,如果记录时需要不停的切换还是不够方便。5)识别率,虽然讯飞的识别准确率已经比较高,但还是经常出现识别错误的情况,并且对周围的环境要求很高,如果噪音较大,则无法顺利识别。
2.2.3生成语音
生成语音这个功能,是在分享笔记时可以选择生成语音,生成后可以转发至微信、朋友圈、QQ等,同时也可保存至本地。其实将笔记直接生成语音进行分享,我个人没有太想到太多可以用到的场景,毕竟对于一篇笔记,看的速度要比听音的速度快很多,并且可以随时看上一句。虽然我们聊天时有时会选择语音,那是因为这种语音是带有语气语调感情的,但目前这种合成语音还不能很好的表达感情,并且一些断句做的也并不是很好(之前用过其他的语音合成软件,可以通过详细调整每个词的停顿与语音的升降来更好的合成语音,但这大多是应用于广告宣传片的培训,对于这种笔记的分享,如果生成语音还需要做这么多的处理,相对来说,还是成本大了些)。同时,在一些场景,例如开会时,可能并不方便听语音。不过,通过生成语音,将笔记以语音的形式保存下来,倒是对于一些不方便看的场景下,反而可以听,例如运动的时候。并且生成语音时的多种音效,多种发音人的选择,给这个过程也带来了一些乐趣。关于生成语音,或许随着技术的发展,可以合成含有感情的语音,甚至可以写出谱子,直接合成音乐,这样应该可以更加吸引人吧。
2.2.4跨软件阅读
这个功能其实不太容易发现,因为整个语记里并没有太提到这个功能。但是当打开一些阅读软件,例如QQ阅读,选择人声朗读时,会发现,直接选择的是语记中的发音人,如果此时没有安装语记,还会直接提示安装讯飞语记。其实听书这个功能很多阅读软件都是支持,但是这种朗读与生成语音有很多相似之处,听起来并没有非常自然。我曾经尝试过,有的时候听书还会把自己听困了,反而没有读书效率高。但与前面语音一样,还是会有一些场景可以用到,例如运动时,例如睡觉前等到。
三、总结建议
讯飞的这款产品,立足于记事笔记,充分的利用了自己的智能语音及语言技术的优势,将传统的笔记功能与语音相结合,使记笔记这件事情变得更轻松,读笔记也变得更多样化。整体体验下来,有以下两点想法:
1 )应用场景
像上面提到的,的确会有很多这样可以语音记笔记的场景,但是很多时候,我们需要记录,或有灵感的时候,未必是方便语音,或者是环境比较安静可以很好的识别我们说的话的时候。像我们一天在家、路上、公司这三个场景,其中大多只有在家,和在路上走路并且得是周围人不是很多(a.人太多路太吵识别效果不是很好 b.对我们来说笔记的内容有的时候是偏个人的,不太希望别人听到)的时候才会使用这种方式记录,而在家有的时候可能就直接使用电脑或者手机pad直接记录了(当然还是有用语音的时候,例如家里跑步的时候)。所以其实使用的场景虽然有,但对于记笔记这种功能,并不是非常多。其实很多语音类产品会有这个问题,毕竟我们打字是相对来说较隐私的,不会被他人干扰也不会干扰他人(或许有一天,会出现脑机笔记,只要一想,就自动记录。到那时就不用再考虑被人干扰,也不用担心有遗漏了。单纯脑洞一下),但语音笔记要有声音,所以会有很多局限性。从这点来看,很多家居类的语音产品反而会好很多,因为首先已经将场景确定了在家里,接下来语音的功能就会自然很多。
同时,目前讯飞语记在语音记录上,由于对噪音的处理不是很好,需要离话筒很近才能有效果,同时会员才可以最长录音2小时,普通用户只能录音1分钟,所以对于一些讲座需要记录笔记这种需求就很难满足。
2 )定位
科大讯飞一直深耕在语音这块,有特别大的语音优势。但是对于笔记这一块目前讯飞语记做的与印象笔记和有道笔记还是有一定差距。例如笔记整理,虽然有分类标签,但是分类整理做的还是比较弱,这对于后期查看比较不便。再例如笔记的编辑上,样式的调整距离这些成熟的笔记还是有所欠缺。同时对于markdown格式的支持,笔记中嵌入的文档的支持,以及OCR的支持,都还不够,电脑上记录笔记的体验也差很多。而且目前有道云笔记也支持了语音速记,虽然做的还不够好,但对于一款笔记类产品,很多人还是会因为他的整体功能会去选择有道云笔记这类产品。
虽然发布会上讯飞语记团队对讯飞语记的定义是可以跟有道云笔记和印象笔记互争雄长的产品,但整体看讯飞语记,其实更偏重与语音的支持,不论是快速语音录入这样的便捷功能、语音导出、还是监管系统的语音识别与合成、跨软件阅读,都更像是一款语音插件产品,也有很多人疑惑讯飞语记和语音+有什么区别,产品的评价中,也大多数是使用其语言阅读的功能。其实或许讯飞采取与其他笔记类产品合作,就想QQ阅读中的人声朗读一样,继续深耕语音技术,带来更好的体验也未尝不是一个很好的路径。(纯粹个人想法)
讯飞语记作为一款笔记产品,充分的利用了其在语音这个领域的强大优势。或许在现阶段,当没有找到AI具体的落地产品,落地场景时,利用已有的AI技术与一些产品结合,无论是ToC还是ToB都能创造出一些更好的体验并提升效率。尤其是在一些垂直领域中,或许可以带来很大的效率提升,并在应用的过程中,找到更多的落地场景,也在落地过程中,找到倒逼技术进行突破。毕竟任何技术的发展,最终总要落地,服务于我们的生活。