一、概述
声笔简码建立在声笔码基础之上,基本上克服了声笔码的两个不足之处:码长不定和调头取笔。如果说声笔码是顶功的开山之作,那么声笔简码就是顶功的成熟之品,是总结声笔码、声笔飞码等顶功输入法的使用经验,并反复实验、改造的结晶,这个过程经历了漫长的十多年。在这十多年中,顶功输入法得到了蓬勃的发展,数十种顶功输入法应运而生。但是,它们都或多或少地面临类似的问题。声笔简码的成功经验,也可以用于克服声笔飞码等顶功输入法的不足,而且很容易用来简化传统输入法的规则并提高传统输入法的效率。
声笔简码引领的是顶功输入法向传统的一种回归,但又不是简单的回归,而是革命性的回归,是螺旋式的上升。它使得顶功输入法更接近传统输入法,但又不失顶功的效率,是传统与现代的完美结合。可以预计,它将再一次对输入法的发展方向产生深远的影响。
本文除了讲解声笔简码外,还将在章末介绍声笔简整。声笔简整是基于声笔简码的整句方案,在使用上比声笔简码还简单得多。理解了声笔简码就很容易理解它,所以仅仅花费少量篇幅介绍就行了。
有关软件的安装与卸载、翻页方法、标点、符号、词库同步、自定义词典、中英文混合输入、手机操作等声笔系列码共有的内容,请阅读《总体介绍》中的相关部分,这里就不再赘述。
声笔简码的优势可以总结为:简单性、高效性和知识性。它比拼音更简单,比五笔更高效,还有利于人们巩固语文知识。
声笔简码非常简单,具有易学、易用的优点,只需要知道用 v 表示零声母,用 aeuio 分别表示折、横、撇、竖、捺五种笔画,便可以上手使用了。与搜狗拼音、百度拼音等拼音输入法相比,它不用区分平、翘舌,不需要知道韵母,没有区分前、后鼻音等的烦恼。
根据王力德《汉字编码的普及目标体系与编码实例》的研究,在各种汉字属性中,声母和笔顺在必修系数、规范系数、简单系数和记忆系数四大方面得分都是最高的,如下表所示。
汉字属性必修系数规范系数简单系数记忆系数合计
表中,必修系数为某汉字属性对 “中小学语文课所必修” 的隶属度,必修者为 1,非必修者为 0。规范系数为某汉字属性对规范性的隶属度;完全明确且有公认的统一标准,不产生歧义者为 1;基本有公认标准,但使用时存在比较大的模糊性为 0.5;没有公认标准,无论范围或分类全部都是各家任意规定,模糊性相当严重者为 0。简单系数为某汉字属性对简单性的隶属度;简单、直观、易掌握者为 1,有一定难度者为 0.5,难学者为 0。记忆系数为某汉字属性对记忆性的隶属度;某属性种类少,记忆量少,无须强制记忆,回生率低则为 1;反之为 0;介于两者间的为 0.5。
声笔简码仅仅使用了不分平翘舌的声母和按书写顺序的笔画,所以它在必修系数、规范系数、简单系数和记忆系数四个方面都是最好的。不仅如此,汉字的笔画信息还十分丰富,给编码带来了巨大的灵活性,可以做到伸缩自如。
声笔简码具有静态编码的 126 个简码字和 441 个简码二字词,还有 105 个两键数选简词和大量三键数选简词,对其它字词的码长还可以进行动态调整,并且可以自动造词、自动淘汰罕见词组,使其能不断地适应输入者的需要,逐步成为专门为用户量身定做的输入法,比以速度见长的五笔字型输入法的平均码长还短得多。
根据北京语言文化大学的大型字频率统计资料,抽取其中的 GB2312 汉字对几个输入法的单字输入效率所作的统计分析,在字均用键上进行比较的结果为:声笔简码(3.1678)< 五笔字型(3.2658)< 自然码(3.3061),均未计算标点符号。也就是说,声笔简码的单字输入效率比五笔字型提高了 3.09%,比自然码提高了 4.37%。对于大字符集(如 GBK 字符集和 GB18030 字符集),由于增加的都是不常见的汉字,所以对该统计结果基本上不会产生什么影响。不过,需要注意的是,统计是针对典型的汉字文本得出的,是在统计平均意义上的结果,并不排除有的文本会产生不同甚至相反的结果。
上面讨论的是完全用单字输入汉字且不进行动态码长调整的情况,而实际输过程中往往是字词混合输入的,而且码长是动态变化的。由于词组的数量非常庞大,而且不同的输入法所收的词组的数量和种类都不大一样,因此要根据词频表来统计字词混合输入时各种输入法的效率是非常困难的。不过,词组输入是声笔简码的强项,字词混输加动态码长调整时,声笔简码的字均码长仅为 1.6 左右,大大优于五笔字型,因为五笔字型的字均码长为 2.1 左右。声笔简码的动态码长,从信息论的角度来讲,相当于利用通用数据压缩算法对汉字信源进行了压缩。数据压缩技术的应用十分普遍,WinRar 和 WinZip 等常规数据压缩软件已经成为现在人们使用的必备软件了。声笔简码缩短码长的原理与它们是类似的。
有人可能会马上反驳说,声笔简码的只有 126 个简码字、441 个简码词和一些数选简词能够盲打,其它字词的码长会发生变化,打字时需要观察提示行,所以不能像全静态的五笔或者小鹤音形那样完全盲打,所以打不快。这种说法有一定道理,但并不完全正确。动态码长的字词不能盲打,这一点是对的。但是,打不快就不一定对了。盲打固然能提高击键速度(键速),然而打字的速度不仅仅取决于键速,它还取决于平均码长,因为打字速度 = 键速 / 码长。声笔简码通过缩短码长补偿了键速的损失,从而同样能实现高速打字,取得中文录入的高效率。更为主要的是,绝大多数人在绝大多数场合,其打字的使用场景都是有限的,而且其输入的文本都是比较简单的连续文本,比如聊天、写公文等,而且一般人的键速都不会很快,所以使用声笔简码打字反而比使用五笔之类的输入法来「盲打」更高效。
声笔简码还是帮助人们巩固语文知识的绝佳手段。为什么呢?
现在绝大多数人使用的拼音输入法完全没有字形的信息,长期使用拼音输入法以后,往往会产生「提笔忘字」的现象,有意无意地采用同音替代,如「突破」误为「图破」、「重点」误为「终点」等;而长期使用五笔字型之类纯形码,则常常会产生「见字失读」的现象,打字时可能出现形似替代,如「紧」误为「紫」、「租赁」误为「租凭」等。音形结合的输入法,如自然码和小鹤音形,则有利于克服这种窘境,但是需要同时掌握双拼和拆分的双形,学习难度相当大,虽然可能比学习五笔字型的门槛要低点。
声笔简码也是一种音形结合的输入法,但是用的是音里面最简单的声母(而且不分平翘舌)和形里面最简单的笔画(而且按笔顺取),所以学习难度非常低。人们「提笔忘字」和「见字失读」基本上都只是缺少联想线索而导致想不起来了,而不是忘得一干二净。只要稍加提示,比如提示声母或者首笔,就会「哦」的一下回忆起来。故而,声笔简码就以最小的代价,帮助人们巩固了语文知识 —— 汉字的读音和字形,而且笔画和笔顺是遵从国家标准的,不是五笔字型和其他音形码那种非标准的拆分。不规范的部件和拆分仅仅是为了满足汉字输入的需要,不但不具备知识性,而且还会有误导的作用。五笔在这方面比较突出,成为五笔被许多人诟病的原因之一。
实际上,纯音码输入法和纯形码输入法都是不完备的中文输入法。纯音码输入法遇到不知道读音的字就无法输入,所以拼音输入法提供了 U 模式,用笔画或部件来反查拼音。纯形码输入法遇到想不起字形或者不会拆分的字也无法输入,所以就会「卡壳」,需要通过拼音来反查字形,比如有的五笔用户就干脆用「五笔拼音」混打模式,以便快速反查。
声笔简码极其简单,没有什么学习门坎。需要了解的基本内容是:用 v 表示零声母,用 aeuio 分别表示折、横、撇、竖、点五种笔画。用一句话概括声笔简码的话,可以说成是「简拼加笔画」。
虽然声笔简码已经非常简单了,但是为了进一步减轻初学者的记忆负担,在手机上提供了助记皮肤,可以长按 N 键打开或者关闭助记。在打开时,给出了笔画和零声母用键(aeuio 和 v)的提示,如下图所示。如果是在电脑上,则可以把该图放在电脑桌面上,在打字的时候帮助记忆,一般几分钟就记住了。
声笔简码的编码规则和示例如下。其中,s 表示声母(大写的 S 则表示要用大写字母,手机上大写字母通过上滑对应字母键来输入),不区分平翘舌,b 表示笔画。b 为 aeuio,s 为 b 之外的 21 个英文字母,数字表示第几字(其中 0 表示末字),| 表示或者。注意,在您输入时,三码及以上的字词可能有变化,这是因为动态码长调整的缘故(后面在动态码长一节会专门讲这一点)。
单字:sbbb,即声母加前三个笔画。一码字的例子有就j_ 我w_ 没m_(用_表示空格),二码字的例子有从cu 此ci 起qe 来le,三码字的例子有接jei 威weu 凝noe 关gou,四码字的例子有教jeie 钱quee 貌muoo 源yooe。
二字词:s1s2b2b2,即各字的声母加第二字的前两个笔画。二码二字词的例子有关系gx 参加cj 东西dx 还有hy,三码二字词的例子有高兴gxo 睡觉sjo 模范mfe 决定jdo,四码二字词的例子有答应dyoe 画像hxui 估计gjoa 理想lxei。
三字词:s1s2s3b3,即各字的声母加第三字的首笔。三码三字词的例子有计算机jsj 输入法srf 想不到xbd,四码三字词的例子有教师节jsje 杀人犯srfu 宪兵队xbda。
多字词:s1s2s3b0|S0,即前三字的声母加末字的首笔或者声母。三码多字词的例子有爱因斯坦vys 有限公司yxg 人民共和国rmg,四码三字词的例子有声东击西sdje|sdjX 穿针引线czya|czyX 供销合作社gxho|gxhS。
我们再来看一个综合的例子:我们wm_ 大家dj_ 都dei 喜欢xh_ 研究yjo 中文zwo 输入法srf。从这个例子可以看出,声笔简码的常用单字和词组输入效率非常高。
当一个字有多种不同的读音且声母不同时,则可以用多种方法输入该字。例如,「盛」对应的拼音有 cheng 和 sheng,对应了 c 和 s 两个不同的声母,因而它在声笔简码中也会有两个编码,分别是 ceua 和 seua。
对于非成字偏旁部首,一般取其名称首字的声母作为它的声母进行编码。例如,「亻」的名称为单人旁,取「单」字的声母 d 作为「亻」的声母,可以用 duii 输入「亻」。不知道非成字偏旁部首的名称也没有关系,因始终可以用纯笔画的方式输入。比如,「亻」可以用 uiiii 输入。
有个别汉字和偏旁部首的笔顺容易弄错,在《总体介绍》的附录二中罗列了出来,建议对不熟习笔画的人专门练习一下。熟练掌握正确的汉字笔画,是用好声笔简码的前提条件,也是用声笔系列码其它输入法的前提条件,必须高度重视。因为笔画和笔顺是一种语文知识,所以系统没有为其提供容错码,即用户必须使用正确的笔画和笔顺才能输入。
在学习简码之初,往往会遇到不会打的字。怎么办呢?系统提供了用笔画或拼音来反查编码的手段。在不知道读音的时候直接用 aeuio 按顺序输入笔画进行反查,在不知道笔画时用 a 引导拼音反查(注意零声母要用 v)。以下是几个反查的例子。
另外,通过 i 引导的拼音还支持用字海两分法来进行反查, 支持查找八万多汉字,一般用于难读而易于两分的字进行反查或者 GBK 以外字的输入。GBK 以外的字,简码不提供正常编码,不能按正常方式输入,只能在两分查找到后选择输入。下面是字海两分法查找的例子。
在传统字词型输入法如五笔字型中,当字词的码长不足四时,需要用空格上屏,只有码长为四时的首选字词才能省略空格。在声笔简码中,除了一码字和二码词外,所有的字词在后续非笔画编码字符时都可以被顶上屏幕,无论是否达到最大码长都可以。所以说,声笔简码具有「顶功」,可以大大地节约用键,提高输入效率。
例如,五笔字型的二码字吧kc 给xw 和三码字华wxf 动fcl 都是需要空格上屏的。声笔简码中的二码字,如从cu 此ci 和三码字接jei 威weu,在连续的输入过程中一般都是不需要空格的。另外,声笔简码中的三码词,如高兴gxo 计算机jsj,也是不需要空格的。
再如,同样是用纯单字输入中国人民站起来了。这句话。用五笔字型输入时的用键为 k_l_w_n_uh_fhn_go_b.,共使用了 20 键。用声笔简码输入时的用键为 zigir_mazoeqelel.,共使用了 17 键,其中「站」字也有可能是用 4、5 键,因为大于二码的字输入码不是固定的。用搜狗拼音输入时,则完全没有固定的输入方法,它所有字的编码默认都是动态变化的,所以它的用键会在 17 到数十键不等。
正是由于连续顶屏的优势,使得声笔简码的纯单字输入平均码长在没有动态码长调整的情况下也只有 3.1678,低于五笔字型的 3.2658。这是一个让人吃惊的结果,因为声笔简码的单字输入是其弱项,居然比历史上以快速著称的五笔字型单字码长还短。
在传统输入法如五笔字型中,四码的字、词是混合编码的,它们共享同一个编码空间。在发生重码时,究竟把单字排在前面,还是把词组排在前面,面临艰难的决策。当收录的单字和词组数量增大时,这个问题会变得更加突出。
在声笔简码中,单字和词组各自有不同的编码格式,甚至不同类型的词组也有不同的格式,它们享有不同的编码空间,不会发生冲突,不存在单字和词组那个优先的问题。单字肯定是用 sbbb 格式,二字词肯定是用 s1s2b2b2 格式,三字词肯定是用 s1s2s3b3 格式,多字词肯定是用 s1s2s3b0|S0 格式。只有多字词的 s1s2s3b0 格式与三字词共享一个编码空间,其它编码空间都是独立的,互不干扰。
例如,四码字教jeie 钱quee 貌muoo 源yooe,四码二字词答应dyoe 画像hxui 估计gjoa 理想lxei,四码三字词和多字词教师节jsje 杀人犯srfu 声东击西sdje 供销合作社gxho,它们之间是绝对不会重码的。
传统输入法通常都是用数字键来选择重码字词。由于击打数字键需要跨行进行,容易产生误击,一般人都无法盲打,所以会严重影响输入速度。搜狗拼音虽然可以设置用字母选择重码字词,但是必须先用空格键引导,效果大打折扣。
拼音用户对数字键的依赖程度比五笔用户高得多,熟练的五笔用户只在输入四码后出现重码时,才会使用数字键选择,有的甚至通过左右 Shift 键选择 1、2 重码来避免使用数字键,以便提高击键率,降低误击率。搜狗拼音的重码很多,前后翻页的操作很频繁,所以它把逗号和句号键作为默认的前后翻页键,以便快速、准确地翻页。但是,这样做又使得在输入逗号和句号这两个常见标点符号时无法进行顶屏而实现快速输入。
在声笔简码中,当输入的编码达到四码时,如果有重码字词,那么就用 aeuio 兼做重码选择键。这时,重码字前的 aeuio 并不代表笔画,仅仅表示出现的顺序,和传统输入法的数字选择键作用完全一样。不过,用户在击打 aeuio 时要比击打数字键方便、快速得多。
例如,搜狗拼音输入 jiao 时,会出现很多同音字供用数字键选择,可能的选项如下,因动态调频的原因,结果会有出入。
声笔简码则不一样,在输入 juau 时,出现的重码字则是用 aeuio 选择,可能的选项也会因动态码长调整而发生变化。
再如,搜狗拼音输入 shij 时,会出现很多同音词,需要用数字键选择,可能的选项如下,因动态调频的原因,您的结果可能会有出入,如下所示:
而在声笔简码中,输入 sjoo 后,可能的结果如下。
此时,如果要输入「视觉」一词,则用 e 进行选择;如果要输入「圣洁」一词,则用 o 进行选择。
声笔简码的四码空间很小,单字的 sbbb 四码空间只有 21×5×5×5 = 2,625 个码位,二字词的 ssbb 四码空间只有 21×21×5×5 = 11,025,三字词和多字词的 sssb 四码空间也不大,为 21×21×21×5 = 46,305 个码位。多字词的 sssS 四码空间比较大,为 21×21×21×21 = 194,481 个码位,但它只是一种备用的输入方式。
与上述四码空间形成鲜明对照的是,声笔简码收录了 GBK 字集超过两万的汉字,收录的词组数量有 48 万多,其中二字词有近 20 万。所以,无论是单字还是词组,四码时的重码现象都很严重。即使比较常用的字词,都有可能需要翻页,甚至数次翻页来输入。翻页查找属于强交互的操作,每页都需要用眼睛扫瞄六个选项,是非常耗费时间的,会大大降低输入效率,而且容易看花眼而出错。
声笔简码首创了扩展编码,利用编码的顶功特性,通过追加两个笔画就能迅速扩大 25 倍的编码空间,可以快速筛选出所需的重码字词。结合后述动态码长的使用,完美地兼顾了编码空间与输入效率,既能享有巨大的编码空间,又能具有很短的平均码长,两全其美。
比如,「揪」字在第一次输入时,在输入 jeie 后需要按三次翻页键,然后再用 a 选择,如下图所示。每翻一页,都需要用眼睛扫视 6 个选项,人机交互频繁,既费眼又累心,效率很低。
然而,如果再追加两个笔画的话,「揪」字就成了第一选项,如下图所示。
可见,在输入罕见字时,通过追加两个笔画,会大大地提高输入效率。声笔简码将四码选重和扩展编码有机结合,是一大创新,既能照顾初学者的传统输入习惯,又能让高级用户采用更快速的输入方法,做到在日常的输入过程中几乎不进行翻页操作。
搜狗拼音在输入罕见字时,也可以追加笔画或者部件编码来减少重码,但是需要用 TAB 键手动触发加码模式,同时需要空格或者数字键上屏,显得非常笨拙。例如,输入「揪」字时,要用 jiuTABpz2。TAB 键和数字键比 aeoiu 难操作得多。
再如,「转正」一词在第一次输入时,在输入 zzei 后需要按七次翻页键,即出现在第八页上,然后再用 a 选择,如下图所示。每一页,都需要用眼睛扫视 6 个选项,人机交互频繁,效率很低。
然而,如果再追加第一字前两个笔画的话,「转正」就出现在第一页上,只需用 e 选择上屏就可以了,如下图所示。
可见,在输入重码太多的二字词时,通过追加首字头两个笔画,会大大地提高输入效率。
三字词和多字词也可以类似地使用扩展编码。比如,「旧石器」一词在第一次输入时,在输入 jsqi 后需要按多次翻页键,然后再进行选择,效率比较低,但是在追加首字的前两笔 ii 后它就出现在第一页上了。再如,「今生今世」在第一次输入时,输入 jsje 后需要按多次翻页键才能找到,而在加上首字的前两笔 uo 后就出现在第一页上了。
在声笔简码中,当某个字词在输入时若码长大于三,它的码长可能会被自动缩短,下次输入该字词时就可以少用按键了,其它的字词输入码则依次向后推移。这就是所谓的动态码长调整。
例如,在第一次输入「狡」字时,如果是用 juau 后选择 a 上屏的,那么下次输入可能就只需要 juau 了,再下次输入就只要 jua 了。可见,自动码长可以大大地缩短码长,有效地提高输入速度。
搜狗拼音的调频与自动码长有些类似,而五笔字型则没有动态调整功能。搜狗拼音在输入 jiao 后需要翻页 7 次再用数字键选择才能将「狡」字上屏,然后再输入 j 时,「狡」字就出现在第一页上了,但是仍然要用数字选择上屏。五笔字型在输入「狡」字时,始终使用 qtu 加空格。
再如,在第一次输入「视觉」一词时,如果是用 sjoo 后选择 e 上屏的,那么下次输入可能就只需要 sjo 就可以了,节约了两键,如下所示。
如果第一次输入某个字词时需要多次翻页,那么节约的用键就更多了。动态码长调整对用扩展编码输入的字词也是有效的。比如, 「揪」 字,在用 jeieue 输入后,下次输入时可能就只需要用 jei 就可以了。当然,如果此后 jei 又因自动码长调整被别的单字所用的话,「揪」字就会被向后推到 jeie 上去。
声笔简码具有自动词组功能。也就是说,它能够利用用户之前输入的字词来自动创造新的词组,同时也能够将用户几乎不使用的新造词组自动清除。对于少量暂时还未被清理的废词,用户不必理会,到时限后就会被自动删除。在必要的时候,如用户错误地确认了临时词组,系统也提供了手动删除的手段,方法是先将光标移动到该词上面,再按 Control + Delete 键来删除。注意,如果是非临时词组,需要删除两次才能删除。第一次删除时只是把它变成了临时词组。在安卓手机上的删除方法是,用左右滑动空格定位词组,再用删词键来删除。
例如,如果要造「声笔」一词,可以先按单字方式输入声和笔。然后,按词组方式输入 sbue,由于系统词的重码已经超过一页,需要翻页找到声笔一词,或者追加「声」的前两笔 ei 来快速过滤重码,快速找到造好的词组,或者用 TAB 快速定位到重码词的末尾。在选择输入一次新造的「声笔」后,它的码长就会动态地缩短,下次输入的时候可能就只需要 sbu 或者 sbue 了。
再如,要造「声笔码」的话,若前面已经造好了「声笔」,所以可以拆成「声笔」和「码」来输入。然后,按三字词方式输入 sbme,按 TAB 快速定位新词,可见临时词组「声笔码」已经造好了。选择上屏一次后,「声笔码」就会成为正常的词组,而且它的输入码长可能缩短。
最后,如果要造「声笔简码」一词,可以先输入「声笔」和「简码」。下次多字词方式输入 sbje 或者 sbjM 时就有「声笔简码」 一词了。
当然,在用户不知道系统中有某个词组的时候,如果按照词组的方式来输入,就可能因为系统没有该词而找不到想要的词组,即发生所谓打空的情况。此时,建议用 ESC 键一次清楚编码,拆开打一次就能够自动造出想要的词组,供下次使用。
需要注意的是,为了避免发生组合爆炸,产生太多的垃圾词组,系统默认限制了自动造词的最大长度为 5,且不能有非汉字字符。另外,在进行枚举式自动造词的时候,是以编码对应的字、词为单位来进行组合的,并不是以单字为单位的。例如,在输入声笔sbu 系列xleu 码meu 后,生成的词组为「声笔系列码」「声笔系列」「系列码」,而不会生成「声笔系」「笔系列」「列码」等。另外,如果造词之后马上使用了退格键,系统就会自动删除所造的词组;中间夹杂有非汉字的话,也会中断造词。
声笔简码的二字词空间非常有限,造成四码时的选重频繁或者常用字词的码长较长。为了缓解这种情况,特提供了 105 个 sn 型数选简词,其中 n 为用数字表示的笔画,即 23789 分别对应 aeuio,表示折横撇竖捺。在编码格式上,sn 型的数选简词为首字的声母加第二字的首笔。在输入的时候,对这些数选简词进行了提示,以方便用户使用,避免死记硬背,下图是几个例子。
值得注意的是,数选字词的使用不是强制性的,用户可以根据自己的情况或多或少的使用。不过,建议用户将牢记 105 个 sn 型简词,可以显著提高输入效率。
(1) 词组过滤
对声笔简码来说,在默认情况下,多字词有 s1s2s3b0 和 s1s2s3S0 两种输入方式,其中 s1s2s3b0 与三字词的编码空间是重叠的,有时重码现象比较严重。如果希望多字词只用 s1s2s3S0 方式输入,那么就可以将 Translator 下的 enable_filtering 选项设置为 true,以过滤掉 s1s2s3b0 上的多字词,如下图所示。这样,三字词和多字词之间就实现了编码空间的分离。
(2) 小写模式
对声笔简码来说,在默认情况下,多字词的第四码可以用大写字母来输入,而传统上是用小写字母来输入的。如果希望第四码用小写字母,那么可以将 lower_case 选项设置为 true。不过,这样的话,三字词就不能三码起顶屏了,三码时需要空格才能上屏。一般会配合词组过滤选项使用,实现三字词和多字词独立享用不同的编码空间,主要用于多字词的使用比三字词更加频繁的时候。
声笔简整是声笔简码的整句模式。它不需要考虑单字、二字词、三字词和多字词的不同编码规则,只需要知道单字的编码就可以进行中文输入了,比已经非常简单的声笔简码还要简单。但是,它的缺点是用键较多,在输入发生错误后回改的成本高,离散程度高的文本尤其如此。所以,声笔简整仅适合录入简单的连续文本,或者供声笔简码的初学者使用。
声笔简整固定了 21 个最常用的一简字,只需要一码,其它字可以采用二至六码。既可以使用词组,也可以使用短语来输入,但是尽量不要使用长句。这样,编码空间得到了有效的利用,重码也得到了有效的离散,还能减少回改的概率。
问题是,在什么时候用两码,什么时候用三码,什么时候又用四、五、六码呢?什么时候用词组,什么时候又用短语呢?一般来说,越常用的字词,码长可以用得越短;越不常见的字词,码长应当越长。容易发生歧义的地方,就应该常用词组及时上屏,以避免已经输入的正确内容被篡改。如何把握火候,就需要经验的积累了。
声笔简整还提供了快速定位的手段,可以利用数字 1234 将光标一次性地定位到待定的第 1 至 4 个音节之前,用 5 将光标定位到最后,而 TAB 可以快速从当前位置向前逐个音节移动。
下面举例说明一下声笔简整的输入方法。注意您的输入结果很可能是不一样的,因为用户数积累的用户词汇和字词调频会影响转换的结果。
例 1:我们大家都喜欢研究输入法
输入:我们wm_ 大家dj_ 都喜欢deixhao_ 研究yjo_ 输入法srf_
在上例中,我们、大家和输入法都使用了简拼,都喜欢和研究的采用了简拼和声笔的混合编码。当然,以上的输入方式不是唯一的。
例 2:声笔系列码的顶功特色
在例 2 中,由于声笔系列码和顶功这两个短语和词组在系统词库中是不存在的,可以先按每字声母加两个笔画的方式输入,用 12345 进行快速定位回改,待系统造好短语和词组后,再用更简便的方式来输入。这个例子一次输入了十个字,虽然每个字都用了三码,回改的地方还是比较多,回改成本是比较高的,不是推荐的方法,应采用词组或短语为单位来输入,就可以增加确定性,减少回改量。
为了便于用户总结和记忆声笔简码的基本内容,现将其字词的编码格式以浓缩的表达式方式总结如下。
单字:sb^b'b(bb)x,即声母加前三个笔画,可选地加第四、五笔,然后选择重码。
二字词:s1s2b2^'b2(b1b1)x,即两字的声母加第二字的前两个笔画,可选地加首字的第一、二笔,然后选择重码。
三字词:s1s2s3^'b3(b1b1)x,即三字的声母加第三字的首笔,可选地加首字的第一、二笔,然后选择重码。
多字词:s1s2s3^'b0|S0(b1b1)x,即前三字的声母加末字的声母或者首笔,可选地加首字的第一、二笔,然后选择重码。
其中,s 表示声母(大写的 S 则表示要用大写字母),不区分平翘舌,b 表示笔画,x 表示选择重码。b 和 x 用元音 aeuio,s 用剩余的 21 个英文字母,数字表示第几字(其中 0 表示末字),^ 表示起始顶屏码位,’表示起始码长调整位。