问题
当时间大量地被各种手机应用占据时,打字输入一度让我不想再用手机。很多人习惯发微信语音,可在忙的时候接收到一堆微信语音时,我的内心是崩溃的。不提其语音转文字的准确率,操作步骤多(单条长按、点击),转换速度也慢。发出消息者省心省时间,但接收者相反。以前我忙的时候也会发语音给别人,现在更多地选择用讯飞语音输入,这样不会给对方造成阅读负担。语音输入准确率虽然勉强可以接受,但还远不能替代打字。为什么?怎么办?
守
早期打字输入法的结果列表是完全固定的,包括排序,现在语音输出的结果也只有一种。打字一般一次输入一个字/词,语音则是一句,得到多条结果供用户选择是一种偶尔有效的小策略,但很容易推想这绝对不够,尤其是输入非日常用语时。后来搜狗输入法等开始记忆每个用户的用词习惯,调整排序,并统计学习新词,不断扩充更新词库,于是打字输入法完成了一个质的飞跃。所以我们如今打字不再需要经常展开结果列表,去选择排位靠后的结果。语音输入能模仿它吗?可是只有一条结果怎么记忆学习?
破
打字输错时,我们移动光标,删除文字,重新打字输入。语音输入效率之所以高,就是因为整句输入输出。以讯飞为例,输出语句直接出现在输入栏里,如果其中有错误,也需要执行同样的步骤,包括重新打字输入。因为错误率更高,修改的地方多,又因为整句输出,光标要不断重新定位,手指定位很容易错,还要回到打字输入……所以工作上的沟通,我基本不会用它。据我观察,即使日常对话,身边也极少有人用。
打字错了重新打,语音识别错了也应该能够针对错字/词重新识别,而不是重新打字。比如,再念一次觉得有误的地方,念之前可以加个特殊口令,然后得到几个可选结果。输入法自动识别匹配的词段并替换,同时后台记录学习。这里再作细分,比如出现了一个错别字,一是用户重念了这一个字,但是整句话里存在多个同音字,输入法无法直接定位就需要用户自己来;二是用户重念了它所在的词段,输入法直接匹配,但可选结果恐怕不太乐观,经常需要一个个字确认,就像打字输入。
离
昨天讯飞把我说的“曹东”识别为了“朝东”,“曹东”是曹光彪东楼的简称,我发音没有问题但它的词库里没有,可以理解。如上所述,语音输入可以照搬打字的方法,从而记住这个特殊的简称,先在“cáo”的列表里找到“曹”,再在“dōng”的列表里找到“东”。但它应该有更humanistic的方法。我对一个人说“曹东”,会解释为“曹操”的“曹”,“东西”的“东”,对方一定就清楚了。对待语音输入,也可以这样,就像教一个小孩,或者培(tiáo)养(jiào)一个助理,它一学就会,对我们自己也有好处,何乐而不为?具体交互方式就不探讨了,可以是一个按钮,一个口令,技术发展已经让交互方式简化了很多。