拼音输入的误区

初学者在使用拼音输入法时,因为缺乏指导、随意输入,使得不少人养成了不好的输入习惯,陷入了拼音输入的一些误区,比如整句误区、联想误区和简拼误区。现在将对这些误区进行逐一剖析,以求规避之道。

1. 整句误区

现在的拼音输入法常常被称为智能整句输入法。人们在描述输入法发展历史的时候,也常常说从字到词到句。从理论上来说,更大的语境更有利于提高音字转换的正确性。从算法上来说,通过长期的积累,已经有成熟的隐马尔科夫模型。从硬件上来说,CPU、内存、硬盘等性能大幅提升,价格大幅下降,已经不是问题。加上互联网的成熟,更可以利用大厂服务器的资源和大数据来提升智能整句输入法的能力。从用户的角度来说,使用整句输入可以没有分词的负担,还可以少按大量的空格,只需要练熟 400 来个音节拼式,只管一个劲地击键就行了。似乎一切都完美了!

然而,实际情况却让人大跌眼镜,绝大部分人并没有以整句为单位来输入,真正采用整句输入的人其输入的效率也并不高。最能称得上整句输入法的微软拼音整句模式,可以算是技术上的精品了,但是采用的人并不多。微软拼音在面对搜狗、百度等利用搜索引擎和网络词库的次整句输入法时,显得力不从心,用户数量越来越少。所谓次整句输入法是指它遇到空格和标点符号就会上屏默认转换结果,而并不是要等到一句话输入完成才确定转换结果,介于整句模式与字词模式之间。为什么会出现次整句输入法大行其道的局面?这难道不是一种倒退吗?难道用户都这么愚昧吗?整句输入的问题出在哪里?问题出在以下几个地方。

(1) 编码效率低

拼音作为编码来说,编码效率太低,导致平均码长过长,超过了三码。汉语拼音的设计初衷是用于注音识读,所以遵循了音素化和国际化的原则。在这些原则的指导下,由于普通话自身的特点,使得拼音字母的利用效率很低,存在大量冗余。从编码的角度来说,用 26 个字母表达 400 个音节,每个音节只需要不到 2 个字母,因为 26×26=676,可用的编码空间远远大于 400,而汉语拼音却用了超过 3 个字母,所以效率会低。

(2) 确认成本高

整句的转换结果在输入的过程中可能会不断地发生变化,所以不到输入结束是不能判断其正误的,能够判断正误的只有输入的拼音串,拼音串不会发生变化。然而拼音并不是文字,人们对它的识读能力是很弱的,最多只能快速找出刚才输入的一两个音节的错误。因此,在输入过程中,最多只能做到输入的拼音串尽量不要出错。在一句话输入完成后,用户不通读一遍转换结果,是无法知道对错的,即使结果完全正确,这一步都是少不了的,而且句子越长判别正误的成本越高。

(3) 回改成本高

如果在上屏前确认时发现了错误,就需要进行回改。错误可能发生在一句话的任何位置,可能是转换结果有错,也可能是输入的拼音串有错。发现错误的位置后,需要先定位才能修改,其定位方法一般是用左箭头键逐个音节向前移动,用右箭头键逐个字母向后移动。箭头键的位置远离本位键,操作跨度大,缓慢、费时。还有一个少用的方法是用 Ctrl 加字母键来定位,其特点是用键次数少,但是操作难度大。

(4) 残错概率大

不少人习惯于在输入过程中监视转换结果,在输入最后一个字词时就不再观察转换结果,然而可能会正是这最后一个字词又导致前面已有的结果发生变化,导致错误。这种错误,用户往往不容易发现,使得残错率升高,因为他不自觉地会认为,前面是正确的,最后一个选择也正确的话,就不会有错了。另一种情况是,明明知道还有错误,但是因为觉得修改太麻烦了,就不愿意修改而直接上屏了;这在打字比赛之类的紧急场合和聊天之类的不严肃场合是很常见的。

有鉴于以上原因,拼音输入应该以字词为单位而不是以句子为单位。实际上,除了极少数死心塌地的整句派,大多数人也是这么做的。先进行正确的分词,然后按字词进行输入,可以在一定程度上同时克服以上四个问题。在输入字词时可以适时地使用简拼,从而缩短码长,提高编码效率。字词的长度一般不会超过四个字,确认和回改的成本会大大降低,错误更容易发现和修改,残错率也会减小。

我们现在举两个例子来加以说明,使用的是搜狗输入法。都采用两种方式来输入,一种以整句为单位,另一种以字词为单位,后者不便于截图就没有附图了。在拼音串中,阿拉伯数字表示选择,_表示空格,. 表示翻页。

例子 1(22 字):中文输入法是在信息社会必须使用的重要工具之一
整句(65 键):zhongwenshurufashizaixinxishehuibixushiyongdezhongyaogongjuzhiyi2
字词(55 键):zhongw_srf_s_z_xinx_sheh_bix_shiy_d_zhongy_gongj_zhiyi_

搜狗例子1

例子 2(16 字):声笔系列码是顶功输入法的典型代表
整句(64 键):shengbixiliemashidinggongshurufadedianxingdaibiao.2..32..4.3..23
字词(52 键):shengbi.43_xil_ma.2s_dinggong.42srf_d_dianxing_daib_

搜狗例子2

可以看出,即使在例子 1 完全输入和转换正确的情况下,整句方式的用键都更多;在例子 2 转换错误比较多的情况下,就更是如此了。如果例子 1 中【在】字的拼音误输成了 za,那么麻烦就大了。

搜狗例子3

这时,要么按 15 次左箭头键定位到 za 之后追加 i,要么先选中 za 之前正确的【中文】【输入法】【是】三个词再想法修改,此时显然后者划算一点,按此操作后的情况如下。

搜狗例子4

此时,按 Home 键先定位到 za 之前,再按两次右箭头键定位到 za 之后,追加 i 后,总算是修改正确了。

搜狗例子5

可见,定位修改过程之繁琐。更可悲的是,许多人还根本不知道这种定位修改法,搜狗的官网帮助都没有介绍。于是使用者往往是将错就错,或者是上屏后再来修改。如果是以字词为单位输入,那么在输入【在】字时一般只用声母加空格就行了,或者在输入 za 后立刻就可以发现错误、进行纠正了,绝不会变得如此积重难返。

搜狗、百度等输入法还都支持按住 Ctrl 键 + 字母来进行音节首字母定位,重复按加按同一个字母则定位下一个以此字母开头的音节。这样,上例只需要按 Ctrl+x 就可以定位在 za 的后面了,可以少许多次按键。

image.png

然而,对一般的人来说,加 Ctrl 的复合键操作难度是很大的,很容易按错键,也不是很实用,不能改变整句方式不好用的本质。

2. 联想误区

在使用默认开启联想的输入法(例如百度手机输入法)时,有的用户不自觉地会养成单字加联想的输入习惯。在没有指导的情况下,对于初学者来说,逐字输入,选择重码上屏后,根据联想来再次选择所需要的字词是最为轻松的路径。这种输入方式在不用分词这一点上与整句输入是类似的,是初学者喜欢的原因之一。

不少初学者觉得,汉字输入不就是输入汉字吗?于是,输入一个音节后就看看有没有自己要的字,没有的话翻页再找直到找到为止,然后选择上屏。上屏后发现输入法居然提示了自己想要的字词,心中大喜,毫不犹豫地再次选择上屏,就这样逐步对联想产生了依赖。由于依赖的缘故,即使在当前页没有提示出自己想要的字词,即使输入法没有收录,也会不自觉的翻页去查找,在尝试多次找不到以后,才会重新输入字的拼音。以上过程周而复始地进行,便陷入了联想的误区。

现在以百度手机输入法举例来说明一下单字加联想的输入方式。由于单字重码多,而且联想的内容也可能很多,所以需要大量费时的查找选择操作,输入效率很低。

例子:联想误区
操作:在输入 lian 后,首页找到了「联」字。

百度例子1

选择上屏后,在首页又找到了「想」字,再次选择上屏。

百度例子2

在输入了 wu 后,首页并没有「误」字,需要下拉翻页才能找到。

百度例子3

选择「误」上屏后,首页找不到「区」字,需要滑动翻页查看才能找到。

百度例子4

实际上,以上例子直接用词组来输入是非常简单快捷的。输入 lianx,在首页就出现了「联想」。

百度例子5

输入 wuqu,在首页就出现了「误区」。

百度例子6

可喜的是,大多数拼音输入法已经意识到了这种联想输入方式带来的问题,所以默认大都不会开启联想功能,有的甚至取消了这个功能。不过,一定要提醒用户,注意避开这个误区。

3. 简拼误区

有些比较聪明的初学者,特别是那些韵母掌握不太好的,会陷入简拼的误区。他们发现许多词组只要输入声母就可以出来,于是希望尽量利用这个 “窍门” 来节约用键,避免输入韵母,养成了只打声母,然后进行查找选择的习惯。

我们以百度 PC 端拼音输入法为例来说明。

在输入「我们」「他们」「可以」之类的词组时,一般都只需要输入两个字的声母就出来了,而且往往是首选。

百度例子7

但是,如果输入「简拼」,只输入声母的话,重码太多,在第 16 页上还是没有发现。

百度例子8

即使补全「拼」字的韵母后,也要在第 4 页上才会出现。

百度例子9

所以,虽然简拼有的时候能够大大节约用键,提高输入效率,但是运用不好的话,也可能适得其反,更不能教条化地无条件使用。至于如何正确使用,我们将在讲到拼音输入技巧时详细论述。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,240评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,328评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,182评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,121评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,135评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,093评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,013评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,854评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,295评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,513评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,678评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,398评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,989评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,636评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,801评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,657评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,558评论 2 352

推荐阅读更多精彩内容

  • 汉语拼音输入法相对比较简单,主要就是对比各家输入法的吸星大法,谁的算法吸词、拆句成词、智能纠错能力强,谁的效率就高...
    orienome阅读 1,643评论 0 1
  • 目前,绝大多数人使用的都是全拼输入法,主要由搜狗、百度和讯飞提供,功能上大同小异。虽然随着技术的发展,全拼输入法已...
    声笔系列阅读 1,144评论 0 0
  • 一、概述 声笔简码建立在声笔码基础之上,基本上克服了声笔码的两个不足之处:码长不定和调头取笔。如果说声笔码是顶功的...
    声笔系列阅读 754评论 0 0
  • 不知不觉,岁寒输入法的更新历史已经可以列出这么一长串来了。从中可以看出,岁寒的发展过程也是一个不断试错的过程,其中...
    临岁之寒阅读 33,957评论 1 6
  • 一 概述 Lu鹭输入法(或者Lu输入法)基于小鹤音形输入法音形码,重点改进词组输入体验,适合全拼输入法转双拼输入法...
    ledao阅读 5,823评论 2 51