语音输入这样做还可以更好

问题

当时间大量地被各种手机应用占据时，打字输入一度让我不想再用手机。很多人习惯发微信语音，可在忙的时候接收到一堆微信语音时，我的内心是崩溃的。不提其语音转文字的准确率，操作步骤多（单条长按、点击），转换速度也慢。发出消息者省心省时间，但接收者相反。以前我忙的时候也会发语音给别人，现在更多地选择用讯飞语音输入，这样不会给对方造成阅读负担。语音输入准确率虽然勉强可以接受，但还远不能替代打字。为什么？怎么办？

守

早期打字输入法的结果列表是完全固定的，包括排序，现在语音输出的结果也只有一种。打字一般一次输入一个字/词，语音则是一句，得到多条结果供用户选择是一种偶尔有效的小策略，但很容易推想这绝对不够，尤其是输入非日常用语时。后来搜狗输入法等开始记忆每个用户的用词习惯，调整排序，并统计学习新词，不断扩充更新词库，于是打字输入法完成了一个质的飞跃。所以我们如今打字不再需要经常展开结果列表，去选择排位靠后的结果。语音输入能模仿它吗？可是只有一条结果怎么记忆学习？

破

打字输错时，我们移动光标，删除文字，重新打字输入。语音输入效率之所以高，就是因为整句输入输出。以讯飞为例，输出语句直接出现在输入栏里，如果其中有错误，也需要执行同样的步骤，包括重新打字输入。因为错误率更高，修改的地方多，又因为整句输出，光标要不断重新定位，手指定位很容易错，还要回到打字输入……所以工作上的沟通，我基本不会用它。据我观察，即使日常对话，身边也极少有人用。

打字错了重新打，语音识别错了也应该能够针对错字/词重新识别，而不是重新打字。比如，再念一次觉得有误的地方，念之前可以加个特殊口令，然后得到几个可选结果。输入法自动识别匹配的词段并替换，同时后台记录学习。这里再作细分，比如出现了一个错别字，一是用户重念了这一个字，但是整句话里存在多个同音字，输入法无法直接定位就需要用户自己来；二是用户重念了它所在的词段，输入法直接匹配，但可选结果恐怕不太乐观，经常需要一个个字确认，就像打字输入。

离

昨天讯飞把我说的“曹东”识别为了“朝东”，“曹东”是曹光彪东楼的简称，我发音没有问题但它的词库里没有，可以理解。如上所述，语音输入可以照搬打字的方法，从而记住这个特殊的简称，先在“cáo”的列表里找到“曹”，再在“dōng”的列表里找到“东”。但它应该有更humanistic的方法。我对一个人说“曹东”，会解释为“曹操”的“曹”，“东西”的“东”，对方一定就清楚了。对待语音输入，也可以这样，就像教一个小孩，或者培（tiáo）养（jiào）一个助理，它一学就会，对我们自己也有好处，何乐而不为？具体交互方式就不探讨了，可以是一个按钮，一个口令，技术发展已经让交互方式简化了很多。

最后编辑于：2017.12.03 03:10:47

语音输入这样做还可以更好

问题

守

破

离

推荐阅读更多精彩内容