目前,绝大多数人使用的都是全拼输入法,主要由搜狗、百度和讯飞提供,功能上大同小异。虽然随着技术的发展,全拼输入法已经取得了长足的进步,但是仍然存在以下严重问题。
- 音节界线不清
- 拼写形式过长
- 字词重码过多
- 回溯修改麻烦
这些问题在声笔拼音中都得到了较好的解决。声笔拼音明确了音节界线,简化了拼写形式,支持模糊后缀查找,能够直接用笔画筛选重码,基本上兼容一般拼音输入法,可以实现零成本迁移,但是输入效率得到了较大提高。
在声笔拼音之后,讲解了基于声笔拼音的顶功方案 —— 声笔顶拼,它利用顶功大大提高了拼音输入法的效率,是推荐的拼音输入方式。
有关软件的安装与卸载、笔画反查、翻页、标点、符号、词库同步、自定义词典、中英文混合输入、手机操作等声笔系列码共有的内容,请阅读《总体介绍》中的相关部分,这里就不再赘述。
一、声笔拼音
1. 零声母表示方法
在汉语拼音中,以 a e o
开始的音节,如 a ao an o ou ong e en er
等,是没有声母的,或者说这些音节的声母为零声母。在声笔拼音里,是用 v 来代表零声母的。这样,在一串拼音中基本上可以完全确定音节的界线,从而可以提高拼音汉字转换的准确性。
在传统拼音输入法中,常常会产生音节的切分歧义。比如,pingan
可能是 ping'an
,也可能是 pin'gan
,而在声笔拼音中 ping'an
会拼写为 pingvan
,从而避免切分歧义。又如,在传统拼音中,xian
也可能是 xi'an
,而在声笔拼音中,后者必须拼写为 xivan
,从而避免了歧义。再如,斗志昂扬
的简拼,在传统拼音中为 dzay
,可以切分为 d'za'y
或者 d'z'a'y
;而在声笔拼音中,其简拼为 dzvy
,是没有切分歧义的。
2. 拼音形式的简化
一般拼音输入法拼式太长,影响了它的效率。所以,声笔拼音对以下音节的拼写形式进行了简化,可以用来提高输入效率。
- 将声母 zh、ch、sh 合并到 z、c、s,即不分平舌和翘舌;例如,拼音里的
shi si
在声笔顶拼里均为si
。 - 将韵母 er 合并到 e,ü 合并到 u,ê 合并到 e,例如:
er
变成了ve
(前面加v
是因为er
为零声母音节),而nü
变成了nu
。 - 声母 j、q、x 后接韵母 ia、ie、iao、ian、iang、iong 时,要省略 i;例如,拼音里的
jie qiong xiang
在声笔顶拼里会变成je qong xang
。
以上拼式简化,只有第一项是强制的,后面两项是可选的。
3. 模糊后缀匹配法
声笔拼音输入时,不必输入完整的音节,也就是说可以模糊掉后缀,例如:前qa 便bi 编码biam 贡献goxa
等,这样有利于提高输入的效率,同时也降低了拼音输入法的门槛。除了 21 个一简字是静态的、固定的外,其它码位上的字都会根据语境和使用情况动态调整,以便提高输入效率。
4. 直接笔画筛重法
在遇到重码的时候,声笔拼音可以通过用 aeuio
代表折横撇竖捺
直接追加笔画来快速筛选重码,例如:请qingoa 像xangu 估计gujio 祖母zumua
等。这就巧妙地克服了拼音输入法重码过多这个痛点,在输入过程中基本上不用翻页。虽然搜狗拼音能采用笔画来减少重码,但是必须先用 TAB 键引导,而且只能对首音节的重码进行筛选,不仅难用,而且功能很弱。
5. 回改时的快速定位
在用拼音输入中文时,往往需要进行定位,以便选择重码,一般拼音输入法是通过移动光标来定位的。但是移动光标存在的问题是,光标键位置较远,而且常常需要多次移动,效率低下。而声笔拼音提供了一种快速定位的方法,可以利用数字 1234
将光标一次性地定位到待定的第 1 至 4 个音节之前,用 5
将光标定位到最后,而 TAB 可以快速从当前位置向前逐个音节移动。
6. 重码选择方法
声笔拼音选择重码时,使用 67890
,这一点与传统拼音输入法是不一样的。之所以这么设计,是因为 12345
已经用于快速定位, 也因为在声笔拼音输入时左手的负担已经很重,改用 67890
后,让右手承担重码选择的任务,可以平衡用键。
7. 零声母和笔画的助记方法
声母和笔画是声笔系列码的基础,在声笔系列码中占有非常重要的位置,“声笔系列码” 中的 “声笔” 就是由此而来的。声笔系列码中的所有输入法都体现了对声母和笔画的灵活、巧妙运用。实际上,声笔系列码的图标就是在说明零声母与笔画的表示方法,如下所示。
图上倒三角的下面两边就是 V
的形状,蕴涵了零声母之意。之所以标注的是大写字母,是因为其形状可以用来帮助记忆笔画:A 去掉中间的短横后形状像折,所以表示折;E 的首笔为横,所以表示横;I 就的形状像竖,所以表示竖;O 缩小后形状像点,所以表示点(捺);U 纵向从中间分为两半的话,右半像撇,所以表示撇。
在手机上,还提供了更加直观的零声母和笔画助记方法。在默认的情况下,助记是关闭的,可以长按 N
键打开助记,再次长按 N 键则关闭助记。下图所示为声笔拼音的助记,其键面字符 aeiou
下面分别标注有笔画フ一丨丶丿
,而 v
下面标注有零
,表示零声母。
二、声笔顶拼
如果用户觉得声笔拼音的效率还不够高,那么就可以进阶到声笔顶拼。
声笔顶拼的目的是让现有的拼音输入法用户以最小的学习代价就能大大地提升输入的效率。它通过对汉语拼音的简化和巧妙的字词编码,在保持易学的前提下,既能充分利用简拼来缩短词组的码长,又能通过追加韵母来延长编码,还能用 a、e、u、i、o 代表折、横、撇、竖、捺直接追加笔画来筛选重码字词。
为了支持顶功和缩短码长,在声笔顶拼中,拼音形式的所有简化都是强制性的,这与整句模式的声笔拼音是不一样的,后者只有零声母的表示和翘舌音的简化是必须的。声笔顶拼的字词编码自带了明确的边界,当后接声母时,可以将前面的字词顶上屏幕而省略空格,从而大大提高输入效率,这也是声笔顶拼中顶字的由来。在码长短的时候采用静态编码,易于让常见字词的输入形成条件反射;在码长长的时候进行动态码长调整,有利于缩短平均码长。采用 a、e、u、i、o 选择重码字词,能避免使用不便击打的数字键。
1. 编码规则的规范
- 单字的编码方法是拼音加顺序笔画直到码长为 6,笔画不足时反复追加末笔;例如,
汉 字
作为两个单字的完全编码为hanooe ziooaa
,其中汉
在拼音后附加了前三笔ooe
,字
在拼音后附加了前四笔ooaa
。 - 二字词的编码方法是首字的声母加次字的拼音再加首字的顺序笔画直到码长为 6,笔画不足时反复追加末笔;例如,
汉字
作为一个词组的完全编码为hziooe
,在拼音编码后附加了汉
的前三笔ooe
。 - 三字词的编码方法是取各字的声母加末字韵母的第一字母再加首字的顺序笔画直到码长为 6,笔画不足时反复追加末笔;例如,
输入法
这个词组的完全编码为srfaea
,在拼音编码后附加了输
的前两笔ea
。 - 四字及以上词(多字词)的编码方法是前三字和末字的声母再加首字的顺序笔画直到码长为 6,笔画不足时反复追加末笔;例如,
欢天喜地
这个词组的完全编码为htxdao
,在拼音编码后附加了欢
的前两笔ao
;再如,中华人民共和国
这个词组的完全编码为zhrgia
,在拼音编码后附加了中
的前两笔ia
。
以上所说的是完全编码的情况,但实际输入时所用的输入码在绝大多数情况下不会是完全编码,而且是用尽量简短的输入码。声笔顶拼在字、词的编码和输入方式上做了比较严格的限制。这种做法有利有弊,但是利远远大于弊。为什么这样说呢?因为这种做法虽然提高了用户的学习门槛,上手难度有所增大,但是养成习惯后,输入效率会大大提升,即以短期的少量付出可以获得长期的收获。
相比而言,拼音整句在输入方式上具有巨大的灵活性,用户上手非常容易,几乎没有学习门槛。然而,也正是这种灵活性,给用户带来了伤害,而且是不知不觉的、长期的伤害。这种灵活性,实际上是把用好输入法的责任推卸给了用户。这就等于说,我也不知道哪种输入方式好,你们自己看着办吧。从我的观察来看,很多拼音整句输入法用户都养成了不好的输入习惯(比如单字加联想、简拼加选择、整句加回改),结果是浪费了大量宝贵的时间在汉字输入上。
虽然声笔顶拼的学习难度不大,但是为了进一步减轻初学者的记忆负担,在手机上提供了助记皮肤,可以长按 N
键打开或者关闭助记。在打开时,给出了笔画和零声母用键(aeuio
和 v
)的提示,如下图所示。
2. 单字的输入
声笔顶拼在输入的单字时候,进行了分级处理,采用出简不出全来减少重码。一至二级简码字为静态单字,其输入码是固定不变的,以便用户对常用字形成条件反射,从而提高输入效率。三码及以上的单字为动态单字,其码长是可变的,即会随着用户的输入习惯而发生变化,用户经常使用的字其码长会缩短,相对不常用的其码长会变长,这也有利于提高输入效率。
(1)静态单字
声笔顶拼的静态单字包括一简单字和二简单字。
一简单字有 21 个:b不 p平 m没 f发 d的 t他 n你 l了 g个 k可 h和 j就 q去 x下 z在 c出 s是 r人 y一 w我 v而
,一般需要用空格上屏。一简单字在声笔系列码的所有输入法中都是一模一样的。
二简单字有 98 个,其常用程度仅次于一简单字,一般可被顶上屏幕而节约空格。二简单字的例子有 ku快 re任 fu夫 te特 xa小 je接
等。值得注意的是,二简单字的拼音并不一定是完整的,这样有利于缩短码长。在上述例子中,快
的输入码是 ku
而不是 kuai
,任
的输入码是 re
而不是 ren
。用户在开始使用声笔顶拼的时候,遇到这类字常常会打过头,需要注意观察提示行。另外,小
的输入码 xa
和接
的输入码 je
,按声笔顶拼的拼音简化规则省略了 i。
(2)动态单字
例如,之
的完全编码为 zioaoo
,而其初始输入码为 zio
,在读音后附加了一个笔画。如果输入了与之
前三码相同的字,比如字
,那么 zio
这个输入码上的字就可能变为字
,而之
的输入码可能被动态地调整为 zioa
。同时,还可能影响其它后缀相同的字的优先级别。
再如,讲
的初始输入码为 jangoa
,如果输入了讲
字,那么它的输入码可能缩短为 jan
或 jang
,具有相同前缀的见
、将
和江
的输入码就会跟着发生相应的变化。
(3)编码反查
在输入的时候,往往会遇到不会读的字。怎么办呢?系统提供了直接用 aeuio
按顺序输入笔画进行反查的手段,例如「兀」字可以如下反查。
另外,通过 i 引导的拼音还支持用字海两分法来进行反查, 支持查找八万多汉字,一般用于难读而易于两分的字进行反查或者 GBK 以外字的输入。GBK 以外的字,快码不提供正常编码,不能按正常方式输入,只能在两分查找到后选择输入。下面是字海两分法查找的例子。
3. 二字词的输入
声笔顶拼在输入二字词的时候,进行了分级处理,采用出简不出全来减少重码。一至二码的二字词为静态词组,其输入码是固定不变的,以便用户对常用词形成条件反射,从而提高输入效率。三码及以上的二字词为动态词组,其码长是可变的,即会随着用户的输入习惯而发生变化,用户经常使用的二字词其码长会缩短,相对不常用的其码长会变长,这也有利于提高输入效率。
(1)静态词组
声笔顶拼的二码词组有 441 个,如:bb并不 pj平静 mn美女 fx分析
等,一般需要空格上屏。声笔顶拼的二码词组与声笔简码的二码词组是一模一样的。
(2)动态词组
例如,真是
的完全编码为 zsieii
,而其初始输入码为 zsi
,没有附加笔画。如果输入了与真是
前三码相同的词,比如正式
,那么 zsi
这个输入码上的词就可能变为正式
,而真是
的输入码可能被动态地调整为 zsie
。同时,还可能影响其它后缀相同的词的优先级别。
再如,逝世
的初始输入码为 ssieie
,如果输入了逝世
,那么它的输入码可能缩短为 ssi
或 ssie
,具有相同前缀的实施
、事实
和损失
的输入码就可能会跟着发生相应的变化。
(3)空位词组
从编码的角度来讲,汉语拼音的编码效率是很低的。声笔顶拼对汉语拼音进行了适当的简化和压缩,但是二码单字码位仍然有七个空闲的。为了把这些空码位充分利用起来,在上面安排了常见的词组。为了避免死记,对这类词组进行了提示,如下图中的口水
一词。
以下列出了所有七个顶拼空位词组。
防止 fi
赶紧 gi
何时 hi
口水 ki
安上 vi
而今 vu
违背 wi
(4)数选简词
为了提高输入效率,顶拼提供了数选简词。所谓数选简词,是指用数字键来选择的简码词组。为了减少记忆量,数字的使用并不是随机的,而是用 23789 来代替 aeuio 表示笔画。
为什么用 23789,而不用传统的 12345 呢?这一方面是因为 23789 比 12345 更加容易操作,另一方面是 23789 可以与 aeuio 在键盘上位子形成近乎完美的映射,除 2 外正好位于相应笔画字母上一排相同的位置,非常容易记住,如下图所示。
数选简词一共有 105 个,其编码格式为 s1n2
,即首字的声母加第二字的数字首笔,所以又称为 sn 词。如果记住它们可以大大提高输入效率,现在它们罗列如下。
b 不能2 不过3 必须7 不是8 北京9
c 才能2 出来3 查看7 此时8 成为9
d 到了2 第一3 当然7 但是8 地方9
f 发展2 发现3 发生7 非常8 方法9
g 更加2 过去3 工作7 共同8 国家9
h 孩子2 还有3 忽然7 还是8 会议9
j 继续2 今天3 进行7 就是8 经济9
k 可以2 看到3 看看7 可是8 科学9
l 领导2 离开3 老人7 历史8 立刻9
m 面对2 没有3 明白7 美国8 目前9
n 能力2 那样3 你们7 那些8 难道9
p 旁边2 朋友3 脾气7 贫困8 漂亮9
q 妻子2 起来3 其他7 企业8 情况9
r 人民2 然而3 如何7 如果8 认为9
s 所以2 市场3 什么7 世界8 说道9
t 提出2 通过3 他们7 同时8 提高9
v 儿子2 安排3 爱人7 而且8 欧洲9
w 为了2 完成3 我们7 问题8 无法9
x 系统2 现在3 先生7 心中8 希望9
y 已经2 一样3 一个7 一点8 因为9
z 自己2 这样3 这个7 中国8 知道9
4. 三字词的输入
声笔顶拼没有静态的三字词,所有三字词均是动态的,可以有三至六码。常用的三字词,输入前三码就够了。如果你需要的三字词还没有出来,追加一个韵母,还是没有出来,就追加首字的笔画。三码就出来的三字词,不能用后续的声母顶屏,需要用空格上屏,当然标点符号仍然是可以顶屏的。
例如,计算机
的完全编码为 jsjioa
,而其初始输入码长为三。如果输入了与计算机
前四码相同的词,比如接收机
,那么 jsj
这个输入码上的字就可能变为计算机
,而计算机
的输入码被动态地调整为 jsji
。
再如,输入法
的初始输入码为 srfa
。如果输入了输入法
,那么它的输入码可能缩短为 srf
,具有相同前缀的杀人犯
的输入码就会变成 srfa
。
5. 多字词的输入
声笔顶拼没有静态的多字词,所有多字词均是动态的,可以有四至六码。在一般情况下,输入前四码就够了。如果有重码,而且你需要的多字词还没有出来,就可以追加首字的笔画。
例如,将计就计
的初始输入码为 jjjj
。如果输入了与将计就计
前四码相同的词,比如斤斤计较
,那么 jjjj
这个输入码上的字就可能变为斤斤计较
,而将计就计
的输入码被动态地调整为 jjjju
。
再如,技术交流
的初始输入码为 jsjle
。如果输入了技术交流
,那么它的输入码可能缩短为 jsjl
,具有相同前缀的计算机网络
的输入码就会变成 jsjlo
。
6. 连续顶屏
顶功输入法最显著的特征就是可以连续顶屏,声笔顶拼也不例外。传统四码输入法如五笔字型和自然码等,在输入四码后,如果再输入下一字词的时候,首选项可以被顶上屏幕而节约空格,否则必须用空格上屏首选项后才能输入下一字词。拼音整句则在任何时候都需要空格来上屏首选项,唯一的另外是后接非编码非数字的符号时。
例如,若以单字方式输入声笔
,使用声笔顶拼时输入码为 sengbiu
,使用拼音整句时输入码可能为 sheng3bi3
或 sheng bi3
。也就是说,即使声
通过调频而处在重码的首选,也是需要用空格上屏的,而声笔顶拼是不需要空格的。
再如,若连续输入汉字
和输入法
,使用声笔顶拼时输入码为 hziosrfa
,使用拼音整句时输入码可能为 hanzi srf
。也就是说,即使汉字
通过调频而处在重码的首选,也是需要用空格上屏的,而声笔顶拼是不需要空格的。
由于在实际的中文输入过程中,传统字词模式输入法使用空格的频率非常高,所以声笔顶拼通过省略这些空格可以大大地提高输入效率。
7. 歧义处理
在用声笔顶拼进行输入的时候,在个别情况下会产生编码歧义。
例如,jan
可能是 jan件
,也可能是 ja家n你
;sjin
可能是 sjin神经
,也可能是 sji世纪n你
。如果用退格键删除 n,再用空格键上屏「家」或「世纪」,然后再输入 n 的话,就非常低效。为此,声笔定制程序专门提供了快捷键 Shift+BackSpace
来一键完成前述三个动作。在手机上,用左滑 BackSpace
键来代替 Shift+BackSpace
即可。
以上歧义发生在元音后接 n 时,另一种歧义的情况是 n 后接 g。例如,jang
可能是 jan件g个
,也可能是 jang将
。这时, 同样可以用以上快捷方法来快速更正。
8. 字母选重
声笔顶拼在输入六码后,如果有重码,那么可以用 aeuio
来进行选择,比搜狗拼音等传统输入法用数字键选择更方便、快捷。
例如,声笔顶拼输入 ssieie
后,其候选窗的状态可能会如下图所示。
9. 重码筛选
声笔顶拼在输入完编码中的拼音部分后,如果还没有见到所需的字词,则可以直接追加首字的笔画来进行筛选。搜狗拼音也可以通过笔画来筛选重码字,但是必须先按 TAB 后再加笔画,而且对词组无效。
例如,第一次输入珍
字时,声笔顶拼的输入码为 zenee
,而搜狗拼音为 zhen{Tab}hh
,其中 {Tab}
表示 Tab 键。
再如,第一次输入拘束
时,声笔顶拼的输入码为 jsuei
,可以追加两个首字笔画,而搜狗拼音在输入 jshu
后只能翻页查找。
10. 词组的管理
声笔顶拼目前自带 48 万多词组,覆盖的面已经很广。但是,用户在使用过程中不可避免地还会遇到缺词的情况,而且对于不满意的词组可能还想删除。
(1)自动造词
顶拼的造词是在输入过程中自动进行的。例如:输入声seng 笔biu
后,下次输入声笔sbieie
时就会有该词了,只是如果有重码的话,新造的词会排在后面。如果重码太多,可以用 Tab 一次性地跳到最后,以避免多次翻页;前提是你还没有进行过翻页操作,否则会被当作向前翻页处理。自动造的词组是临时词组,带有太极标志,优先级别低,只有在选择使用一次以后,才会成为正式词组,并提高优先级别。另外,如果之后马上使用了退格键,系统就会自动删除所造的词组;中间夹杂有非汉字的话,也会中断造词。
(2)词组的删除
声笔顶拼能够将用户几乎不使用的新造词组自动清除。对于少量暂时还未被清理的废词,用户不必理会,到时限后就会被自动删除。在必要的时候,如用户错误地确认了临时词组,系统也提供了手动删除的手段,方法是先将光标移动到该词上面,再按 Control + Delete 键来删除。注意,如果是非临时词组,需要删除两次才能删除。第一次删除时只是把它变成了临时词组。在安卓手机上的删除方法是,用左右滑动空格定位词组,再用删词键来删除。
11. 综合示例
以下是一些综合的输入示例,注意四码及以上的字词其码长可因码长调整而发生变化,除一简单字和二简二字词外,其它字词都可以利用顶功来省略上屏的空格键。
例 1:我们大家都喜欢研究输入法
输入:我们wm_ 大家dj_ 都dou 喜欢xh_ 研究yjiu 输入法srfa
从这个例子可以看出,声笔顶拼的常用单字和词组输入效率相当高,而且与拼音的形式很接近。
例 2:古之立大事者,不惟有超世之才,亦必有坚忍不拔之志。
输入:古guei 之zio 立lio 大事dsieu 者zee, 不b_ 惟weioo 有yo 超caoei 世sieii 之zio 才ca, 亦yioeu 必bio 有yo 坚忍不拔jrbb 之zio 志zieie。.
从这个例子可以看出,声笔顶拼输入古文等离散程度高的文本的效率是比较低下的,但是仍然比拼音整句要强得多,这得益于顶拼直接追加笔画和连续顶屏的能力。