我在简书所发《文字的分类简述》一文中介绍过,汉字是世界上仅存的被广泛使用的语素文字,又称为意音文字。而世界上使用最广泛的文字是表音文字,其中又以拼音文字最为普遍,英文作为表音文字,则是使用人数最多、使用范围最广泛的文字。因此,我们将汉语和英语作为语素文字和表音文字的典型代表来进行讨论。
研究表明,人类的文字首先是从图画文字发展为表形文字(象形文字),进而发展为语素文字。历史上具有高度文化的成熟语素文字只有西亚的楔形文字、埃及的圣书字和中国的汉字。随着历史的发展,楔形文字和圣书字都已灭绝了,灭绝的原因有很多,其中一个重要的因素是语言文字的进化使然。根据考古学研究,腓尼基字母被认为是当今所有字母的祖先,而腓尼基字母则是起源于古埃及象形文字的圣书体。毫无疑问,进化的产物是事物发展前进的结果,否则就不能称之为进化。
在世界语言文字史上,汉语言文字也是在不断进化和发展的。不能因为汉语言文字依然属于语素文字,并带有许多古代语言文字的痕迹,便认为汉语言文字就是落后的,是语言的化石。
在近代历史上,由于中国一度沦为贫穷落后的国家,亦有不少人将中国落后的原因之一归咎到汉语言文字上,曾几何时,对汉字改革一度呼声很高,且不乏过激的言论,其中包括一些名流大师。
例如,国学大师钱玄认为,“汉字的罪恶,如难识、难写、妨碍教育的普及、知识的传播……”。因此,他说:“废孔学,不可不先废汉文;欲驱除一般人之幼稚的、野蛮的思想,尤不可不先废汉文。”鲁迅亦曾义愤填膺地说:“所以,汉字也是中国劳苦大众身上的一个结核,病菌都潜伏在里面,倘不首先除去它,结果只有自己死。”并且他也认为“汉字不灭,中国必亡!”
尽管他们是大师,但在特定历史条件下,他们所说的话却是偏激了,是错误的。对于不同的语言文字,我们只能去分析他们各自有什么特点,而不能武断的去说孰难孰易,更不可轻言孰优孰劣。
研究语言文字是一门科学,因此我们必须用科学的态度来对待各种不同的语言文字,这就是要实事求是,言之有理、言之在理,不戴有色眼镜观察事物。
如果我们将汉语与英语做一比较,在未做深入研究之前,确实很快就发现汉字存在四难:难读、难写、难记、难认。下面我们先简略地分析一下这四难。
难读 汉语不是表音文字,因此我们从每一个汉字中是没有什么规则可以将其与读音联系在一起的。虽然在汉语的形声字中,有声旁来规定这个字的发音,但这也要以认识作为声旁的这个字为基础才能确定它的读音。
难写 汉字由横、竖、撇、捺、钩、折、提等8种基本笔画组成,写起来还必须按照一定的笔顺,且保留着由象形文字演化而来的基本特征,结构比较复杂,未经专门训练要想写好汉字是有一定困难的。
难记 汉字存在着许多一音多字、一字多音;一义多字、一字多义等现象,以及有不少组合字,对其中的“半个字”搞不清楚它是作为形旁还是声旁,往往造成很多人望文生义,认字认半边而出现错误。
难认 汉字中有不少字在字形上差异很小,但字义上却毫不相干,一不小心看错便是失之毫厘,谬之千里了。例如“末”和“未”、“土”和“士”只是上下两横长短不同而已,意思截然不同;“日”和“曰”笔画笔顺完全相同,然而一个瘦点一个肥点,便是两个不同的汉字。
相对汉语这四难来说,英语确实有很大的优势。作为拼音文字,英语单词由26个字母和一定的读音规则组成,再大的英语宏篇巨著,都是由这26个字母构成,就算加上这26个字母的大小字之分,也就只需要记住52个字符就可以了。当英国的小朋友学会了26个字母和掌握了读音规则后,书写和朗读的双向转换比中国的小朋友要简单得多了。旧时代中国的私塾先生教小朋友识字,手里拿着戒尺,读错或写错就打手心,以此来加深记忆,这是一个很痛苦的过程。也难怪一百年前不少文化先驱信誓旦旦要消灭汉字,似乎他们要救救中国的孩子。
通过上面的分析,我们是否应当悲观地承认汉字真的落后了,没有优势了呢?下面我们就从汉语和英语这两种文字在字、词层面的特点和差异来进行分析。
在汉语和英语之中,字、词、词汇、词组的概念是不完全相同的。
在任何一种语言当中,“词”是语言里最小的可以独立运用的单位。例如,汉语中“汉语”是一个词,不能再拆分,如果拆分成“汉”或“语”,就不是原来的意思了。而英语中English是一个词,不管拿掉其中哪个字母就都不能成为单词了。
作者在《文字的分类简述》一文中介绍了,汉语的字都是单音节的,因此汉语有三种构词方式:
单音节词:由一个字构成一个词,如,车,马,牛;
双音节词:由两个字构成一个词,如,电脑,黑板,咖啡;
多章节词:由两个以上的字构成一个词,如体育场,幼儿园,大不列颠,百科全书。
汉语中构成词的基本单位是字,有些词可以由一个字组成,而有些词必须由两个或两个以上字组成,于是在汉语中,字和词是不同概念的。
而在英语中,词是字母组成的一个独立的单位,又称为“单词”,如果将单词中的字母拆开,那就不是意思变了这么简单,而是根本连单词都不存在了。因此英语中没有“字”的概念,若将汉语的“字”和“词”译成英语,都是用“word”这个单词来表示。
在汉语中,词和词组的概念是很模糊的。因为汉语中存在大量的单音节词,如果由两个单音节的词组成一个新词,我们一般认为这是一个新词,而不会认为它是一个词组。在英语中情况就不一样了,单词称为word,两个单词组成一个新的词就称为词组(phrase)。
例如在汉语中,牛是一个单音节词,对应的英语单词为cattle;肉也是一个单音节词,对应的英语单词为meat。在汉语中将牛和肉组合在一起成为“牛肉”,自然被视为是一个双音节词,对应的英语单词为beef。将“牛肉”这两个字对调一下,变成“肉牛”,此时在汉语中亦被视为是一个新词而一般人不会将其理解为词组,可“肉牛”对应的英语为beef cattle,在英语当中,这便是一个词组(phrase)而不是单词(word)了。
下面我们以牛、羊、猪、马、鸡、小、公、母、肉、野、这10个汉字为例进行分析。这10个汉字都是单音节词,我们把这10个汉字进行组词,然后我们再来统计一下这些词汇对应多少英语单词,如若对应的是英语词组则不统计在内。例如:“野鸡”对应英语是单词pheasant,则统计在内;而“野猪”对应的英语是词组wild boar,则不统计在内。由此来看一看,中国人只需记住10个字就能解决的问题,英语国家的人要记多少个单词:
小(little)、公(male)、母(female)、肉(meat)、野(wild)、牛(cattle)、小牛(calf)、公牛(bull)、母牛(cow)、小母牛(heifer)、牛肉(beef)、小牛肉(veal)、野牛(Bison)、羊(sheep)、小羊(lamb)、公羊(ram)、母羊(ewe)、羊肉(mutton)、猪(pig)、小猪(piggy)、公猪(boar)、母猪(sow)、猪肉(pork)、马(horse)、小马(pony)、母马(mare)、马肉(horsemeat)、野马(mustang)、鸡(chickens)、小鸡(chick)、公鸡(cock)、母鸡(hen)、鸡肉(chicken)、肉鸡(broiler)、野鸡(pheasant)。
从这个统计可以看出,中国人只需记住10个字的情况下,英语国家的人要记住35个单词。按照数学排列组合的原理,当基数选取越大时,这个差异的比例数就会成几何级数增加。由此可见,相对中国人掌握2500~3500个字的情况下,英语国家的人要掌握5000~100000个单词,这个比例关系是不足为奇的。
中国古代的词汇以单音节为主,而近现代以来逐步转化成了以双音节和多音节为主,这在汉语的发展史上无疑是一个很大的进化,大大的丰富了汉语的词汇量。
汉语的这种组词方式是十分科学的,一两个常用字组合在一起便产生一个新的词,绝大部分词不需要人们望文生义去猜测这个词的意思,而是造词的时候本身就是因文生意而派生出来的词汇。因此,只要认识这些常用字的人,基本都能明了这些派生词的意思,比如:毛衣、毛线、市区、街道等。
汉语的常用字不多,小学毕业要求认识常用汉字为3000个左右,其中2500个左右会写;中学阶段识字已不是学生的主要任务了,到中学毕业要求认识常用汉字3500个左右就满足日常生活的要求,这比小学毕业阶段认字的增长量不大。而进入高等教育阶段后,对于非文科类的学生没有统一增加识字的要求。也就说对于一个受过高等教育的专业人士,只需要掌握中学阶段的3500个汉字以及辅以适当的专业术语,搞专业研究就不会有问题了。
但在英语国家情况就大不相同,要能够满足日常读书读报的要求,应该掌握20000个左右单词。而对于大学毕业能搞专业研究的人士来说,大约需要掌握80000个左右单词。
从上述分析可以给人一个简单的印象:学习汉语是先难后易;而学习英语是先易后难。
最后再再讨论一下不同语言的人机对话。在电脑普及之前,汉语的人机对话是很困难的。过去机械式的英语打字机的键盘比现在电脑用的键盘还简单,打字速度极快。一般人口述以正常人速度说话,话音刚落文本就打好了,这是很容易做到的一件事。而中文打字机则需带着一个几千汉字的检字盘,里面字的排布各不相同,由打字员自己决定,专业的打字员使用别人的打字机都会很不习惯,打字的速度非常慢,用中文打字机来进行速记完全是天方夜谭。
在电脑诞生来的时候,汉字这样的人机对话方式要进行电脑输入是不敢想象的,于是在上世纪八十年代有人曾断言电脑是汉字的坟墓。然而科学技术的发展总是出人意料,各种汉字输入法不断推陈出新,现在在电脑键盘上,不仅可以打汉字,还可以打词组甚至短句,甚至有些汉字输入法比英文打字还快。
每一种语言都是前人智慧的结晶,能流传下来的语言文字都是在长期的历史进程中不断进化而来的,都是值得全为类去传承和珍惜的。