原文链接(首发于十五言社区)
我在知乎上看到过以下一些语言问题:
贴出这些问题并不是针对它们,只是举例。题目里的「一个回答」「可以应对诸多看似不相关的语言问题」,也并不是说我就认为这些问题都是无意义的。
我的意思是:表面上,这些看似不相关的语言问题当然是有不同的回答的;但在更深的层面上,它们可以有同一个回答。
简而言之,这个回答就是:规定。
上面三个例子都是国语级别的语言(日语、西班牙语、法语)。
而我粗浅地学习过几门「小」语言:美国印第安原住民的切罗基语、我国台湾原住民的阿美语,还有我国的藏语。
相比国语级别的语言,「小」语言有一个特点:缺乏规定。如果你完全没学过任何一门「小」语言,那么你很可能就无法感知这一特点。但只要稍微学习一下——不用学得很透彻,不需要精通——很容易就能发现这个问题。
一、切罗基语
一、正字法
我学习切罗基语的书是 Brad Montgomery-Anderson 编写的《Cherokee Reference Grammar》。他的博士论文《A Reference Grammar of Oklahoma Cherokee》便是这本书的雏形。成书时,他是 Northeastern State University 的 Department of Cherokee and Indigenous Studies 的助教,也是切罗基语的专家了。
而我在苹果手机上输入切罗基语时(iOS 系统自带了切罗基语输入法),不时会遇到,同一个词书上的拼写和输入法默认的拼写差一两个字母的情况。
简单说来,这就是正字法不完善造成的。
说得详细一点,切罗基语的文字是类似假名的音节文字,除了 Ꮝ(s)以外全是单个元音或一个辅音加一个元音的结构。音节文字很适合日语这样的封闭音节语言,只从语音上来说,汉字也可以看作音节文字,汉语也是封闭音节语言,汉字和汉语在语音上也是很相配的。但切罗基语却是开放音节语言;切罗基语有时一个词语会以辅音而非元音结尾,但除了 Ꮝ(s)以外,切罗基音节文字并没有表示单个辅音的正字,这时到底用该辅音开头的哪个字母,就有分歧了。
比如书上的一个例句:
ᎦᏥᏃᏍᏓ ᎦᏅᏅ ᎠᎦᏑᏰᏒ.
意思是「我选择了直的路。」
其中的第一个词,即表示「直」的 ᎦᏥᏃᏍᏓ;当我企图在苹果手机上输入它时,系统却提示我应该拼写成 ᎦᏥᏃᏍᏛ。
其中,Ꮣ 是 da,Ꮫ 是 dv(v 在切罗基的拉丁转写中表示鼻化元音 /ə̃/)。但具体到 ᎦᏥᏃᏍᏓ/ᎦᏥᏃᏍᏛ 这个词语里,它们仅仅表示 d(/t/),而后面的元音并不重要——如果切罗基语是某个国家的官方语言,那么这个词就应该有一个唯一正确的拼写;而另一个拼写可以类比汉字的异体字或繁体字,它在日常使用中也可以表示这个意思,但在正式场合就是错误的拼写。
二、部分专有名词
我以前做过一个《部分国家的切罗基语名》的统计;通过这篇文章,大家应该可以发现,有的国家在切罗基语里不止一个专名。正如我在这篇文章开头所说,「切罗基语不是任何国家的国语,客观说来地位较低,在接受外来词方面相对而言缺乏规范」。
二、阿美语
切罗基音节文字可能会让大家看得头大,那么用拉丁字母书写的阿美语应该会友好很多。
阿美语的母语者基本都在我国台湾;但在内地,也有一个阿美语权威学者,并且也是母语者。他就是中央民族大学的田中山副教授 [1],阿美语名 Ci-Tamih。他于 1923 年生于台东县东河乡隆昌村,1946 年来大陆。
对比以田中山先生为奠基人的内地的阿美语资料(以下简称内阿美语)和台湾的阿美语资料(以下简称台阿美语)的拼写,互通是没问题的,但差别也非常明显。
一、字母 u 和 o
阿美语的 /u/ 和 /o/ 是同位异音,因此内阿美语在拼写上只保留了字母 u,而台阿美语则区分 u 和 o 两个字母。例如,内阿美语将「鞋子」拼为 cukap,将「傻瓜」拼为 fula,而台阿美语的「鞋子」拼写也是 cukap,但「傻瓜」却是 fola。
二、字母 ' 和 ^ [2]
这两个字母都是用来表示声门音的。字母 ' 既见于内阿美语,也见于台阿美语;字母 ^ 仅见于台阿美语。因为我学习的教材都是田中山先生的体系,所以我对于台阿美语里字母 ' 和 ^ 到底有什么区别并不了解。从基于台阿美语拼写的《蔡中涵词典》来看,字母 ^ 的其中一个功能可能是和弱元音 e(/ə/)一起出现,强调 e 和其前一个元音在语音上是分开的。例如,内阿美语和台阿美语都把「马」拼为 efa,但在有前缀时,比如表示「有」的 ci-,内阿美语直接拼为 ciefa,而台阿美语则拼为 ci^efa。
三、字母 '
阿美语对于声门音的正字让我感到很随意。有的词语是台阿美语有 ',内阿美语没有 ';有的词语又是反过来的。我实在没找到什么规律。
例如,台阿美语把「(女性)嫁(给男性)」拼成 coo,而内阿美语则拼成 cu'u'——这个短短的词语里涉及了两组字母正字的不同,如果不知道阿美语的不同正字法,谁知道这是同一个词语呢?
相反的是,台阿美语把「全部」拼成 'emin,而内阿美语却拼成 emin。
更有甚者,《蔡中涵词典》同时收录了 iyof 和 'iyof 两个词,这两个词都是「吹风、吹气」的意思。
同为中央民族大学教授的曾思奇编著的《台湾 Amis 语常用词缀与动词词根手册》则是同时收录了表示「开水、茶水、汤药」的 sanga'sif 和 sangasif,但这个词的词根则只有 ngasif 一种拼法,并没有 nga'sif。
四、部分词语有多个或相似或不同的同义拼写
就比如上面刚刚提到过的 iyof(台阿美语拼写),对应的内阿美语拼写是 iyuf,它还有 eyuf、eyup、yup 三个同义词,而台湾的《蔡中涵词典》则没有收录这三个词(的对应拼写)里的任何一个。
再比如,「翠鸟」在阿美语里至少有 alupunay(aloponay)、kadu'engay(kado'engay)、ka'ungtuay(ka'ongtoay)、kada'engay 四个同义的名字,前三个名字里,括号外的是内阿美语拼写,括号内的是台阿美语拼写,第四个名字《蔡中涵词典》没有收录对应词语。而在一个国语级别的语言里(比如汉语),对于某一个科(如 Alcedinidae 翠鸟科),或是某个属(如Alcedo 翠鸟属),或是某个种(如Alcedo atthis普通翠鸟),应该有唯一的正式名。但在阿美语这样的「小」语言里,则不会有这样的规范。
还有像「月亮」这个词,内、台阿美语都拼为 fulad。然而在台湾一个原住民歌手阿洛·卡力亭·巴奇辣(Ado' Kalitaing Pacidal,汉名林佩蓉)的歌词本里,这个词被拼为 fudal——并且这两种拼写其实发音很相似。d 这个音位在阿美语不同方言里变化很大。田中山先生祖籍所在的台东县隆昌村,以及花莲县港口村都把 d 发为 /ɬ/,而离港口村仅仅 15 公里的丰滨村则把 d 发为 /ð/。林佩蓉是港口村人,因而 d 和 l 发音很相近。阿美语的「太阳」是 cidal(巴奇辣 pacidal 就是「晒太阳」的意思),可能是这个词影响了「月亮」的拼写。
此外,和上面提到过的切罗基语类似;阿美语里对很多国名都没有统一、唯一的说法。像日本,我在不同的地方见过 Ripun、Dipun 这两个词。美国呢,不同的地方也有 Amirika、Amilika 这两种说法;甚至还有一个本义是「玉米」的原生词 Padaka,可以泛指外国,也可以特指美国。
三、藏语
一、部分专有名词
我在写《化学元素的藏语名》时发现,有些元素在藏语里有多个名字。在汉语、日语、英语之类的国语级别的语言中,化学元素这样的专有名词是绝对不可能有多个同义名字的。具体情况大家可以查看原文,此处不再赘述。
此外,一些地名在藏语里也有多个对应词语。如「中国」,有时是音译的 ཀྲུང་གོ(krung-go),有时是固有词 རྒྱ་ནག(rgya-nag)。
林芝的巴宜区,有时是固有词 བྲག་ཡིབ།(brag-yib),有时是从固有词音译来的「巴宜」又音译回藏语的 པཱ་ཡི།(p'a-yi)。
玉树的藏语名我看到过更多版本,ཡུལ་ཤུལ།(yul-shul)、ཡུས་ཧྲུའུ།(yus-hru'u)、ཡུལ་ཧྲུའུ།(yul-hru'u)、ཡུལ་ཧྲུས།(yul-hrus),都有。
二、方言
藏语的正字已经一千年没有变过了,一个句子写出来全藏区都能看懂。但藏语方言口语之间互通程度很低,不输汉语方言间的差异。而且不像汉语有普通话,藏语并不存在一个所谓「标准方言」,每个人都认为自己的藏语说得最标准。这种现象在国语级别的语言中是不可想象的。
四、回到文章开头的三个问题
一、关于日语化学元素名:水素、酸素、窒素等。
除了少数在古代就已经被发现的元素——如金、铅、汞之类——之外,大量新发现的元素总得要用新词来命名吧。
1 号元素氢,日语叫「水素」,是因为它的语源,荷兰语的 waterstof 字面意思就是「水素」。它的英语名 hydrogen 其实也是希腊语源的「水素」。「氢气」在汉语里最早叫「轻气」,因为最轻嘛,后来才统一为气字头。
8 号元素氧,日语叫「酸素」,是因为它的语源,荷兰语的 zuurstof 字面意思就是「酸素」。它的英语名 oxygen 其实也是希腊语源的「酸素」。「氧气」在汉语里最早叫「养气」,因为是绝大多数生物必须的气体,后来才改为气字头的「氧」。
7 号元素氮,日语叫「窒素」,是因为它的语源,荷兰语的 stikstof 字面意思就是「窒素」。它的英语名 nitrogen 虽然是希腊语源的「碱素」,但「氮族元素」的英语名还是采用的希腊语源词 pnictogen,字面意思是「窒素」。「氮气」在汉语里最早叫「淡气」,因为很淡(好像是废话),后来才统一为气字头。
H、O、N 的日语名是意译的,但也有不少化学元素的日语名是音译的。比如 2 号元素氦,日语称 ヘリウム,音译自英语 helium。再比如 9 号元素氟,日语以前叫 弗素,「弗」字是音译来的,没有实际含义;而现在,氟在日语里像大多数科学方面的名词一样统一用片假名写为 フッ素。
为什么有的用意译有的用音译?到底是意译有道理还是音译有道理?氧在日语里就不能音译为 オクシジェン 吗?
二、西班牙语的字母 b 和 v 发音一样,为什么正字上还要作区分?
我正好回答过这个问题,并且我自己很满意这个回答。所以我把我的回答稍微删减后贴在这里。
是个好问题。
但没问对地方。
建议去问西班牙皇家学院。
------------------------------------
本来不想抖机灵的,但这个问题所描述的现象真的太没道理可讲了。
下面举几个形式不同但道理类似的例子,这些例子都只考虑西班牙的情况而不考虑其他西语国家。
例一:yacer 的陈述式现在时一人称单数,可以是 yazco,可以是 yazgo,可以是 yago。其中 yazgo 是其本来的形式,yazco 是其他大多数 -cer 结尾的动词采用的形式,算是不规则变位中的规则变位,yago 我不太清楚,猜测可能是受 hacer 的影响。为什么绝大多数动词的一个变位只能有一种形式而 yacer 的陈述式现在时一人称单数能有三种?因为西班牙皇家学院说了,这三种都是正确的。
例二:ch 和 ll 这两个 digraph,以前在西班牙语里是两个二合字母,但现在只是两个普通的字母组合。到底哪种归类更有道理?都有道理。把它们当作二合字母的理由是这两个 digraph(且只有这两个 digraph)所表示的发音不能由其他字母或字母组合表示,这个特点和其他很多西班牙语字母一样(比如除 i 以外的元音字母,d、f、l、m、n、ñ、p、t,r 也算一个吧,因为虽然词首的 r 和词中的 rr 发音相同但 rr 不可能出现在词首,再算上 ch 和 ll,这样的字母有 15 个,超过了一半,这样非常科学)。而把它们当作普通字母组合的理由是前一情况会让西班牙语字母表的顺序很奇怪。那为什么第二种归类是正确的?因为西班牙皇家学院说了,ch 和 ll 就不是二合字母。
例三:rápidamente 的形容词 rápido 可以作副词表示和 rápidamente 相同的意思,solamente 的形容词 solo 本来也可以这样,但因为 solo 不带锐音符,所以可以使用「在本来就是重音的音节上加锐音符以区别原单词」的办法来形成新词 sólo(发音却没有变化),这样就让 solo 不能像 rápido 这样可以作副词了。solo 和 rápido 的这个差别待遇并不是西班牙语本身造成的,而是西班牙语的正字法造成的(有如下几个规定:锐音符在一个单词里最多出现一次;锐音符只能出现在单词的重音上;除了 u 在 güi 或 güe 里可以出现分音符以外,西班牙语不使用锐音符以外的变音符号);假如其正字法允许(除了 u)出现锐音符以外的符号,那么 rápido 就也不能作副词了,它的副词也许会写成 *rápìdo 这样。那西班牙语的正字法是谁在管?当然还是西班牙皇家学院了。
------------------------------------
另外,阿拉贡语的拼写法 Grafía de Uesca 就是按题主的意思来的:既然阿拉贡语的 b 和 v 的发音一样,索性就全部用 b 了。
而西班牙语是否保留 b 和 v 的拼写上的区别,全看西班牙皇家学院衡量词源和现实情况的结果了。
三、法语和西班牙语的字母 h 都不发音,为什么还要保留在正字里?
这个问题其实和上面第二个问题类似,简单说来也是因为词源。我不懂法语,就只拿西班牙语举例。
西班牙语的 h,在拉丁语里大体上有两个来源,一个是 h,一个是 f。
对于前者,古典拉丁语(Classical Latin)里的 h 是要发音的,通俗拉丁语(Vulgar Latin)里的 h 就已经是不发音的了,所以在中世纪西班牙语(Old Spanish)里,这些 h 是被正字法给去掉了的。但到了 16 世纪,西班牙语又开始模仿拉丁语拼写,所以这些 h 又加回去了。Haber、hoy、hombre、hospital 等都是这一情况。
对于后者,直到中世纪西班牙语里这些 f 还尚未变为 h,所以这些 h 也就保留到现在了。Hacer、hijo、hambre、hermoso 等都是这一情况。
除了大多数词是因为词源以外,西班牙语还有少量特殊情况。
例如「蛋」,huevo,它的词源是拉丁语 ovum,重读 o 在西班牙语里变为双元音 ue。但西班牙语正字法规定,ue、ie 这两个拼写组合是不能出现在词首的,所以理论上的 *uevo 不得不拼为 huevo。
相对于法语和西班牙语,意大利语就统统去掉了词首不发音的 h。比如西班牙语里的 hombre、haber、hero、huevo、hoy、hospital,在意大利语里分别是 uomo、avere、eroe、uovo、oggi、ospedale。
法语和西班牙语保留 h 的理由是词源,意大利语去掉 h 的理由是反正它不发音了。它们都有道理,tienen razón.
化学元素的名字总得有个词源。哪怕到后面的以人名、地名来命名的元素,没有像「水素」、「酸素」那么多道理,但也有个纪念意义在。
以此延伸开来:所有词语都得有个词源。哪怕是你自己生造一个词,那「人为生造」也是它的词源。比如爱达荷(Idaho)州的名字,就是 George M. Willing 生造的。
还有很多词,它的词源已经不可考了,但在实际使用中仍然充满生机。比如西班牙语的「狗」,理论上应该是来源于拉丁语 canis 的 can——西班牙的加那利群岛(Islas Canarias)字面意思就是「狗群岛」——法语的 chien,意大利语的 cane,葡萄牙语的 cão,罗马尼亚语的 câine,都是拉丁语 canis 的后裔。但现代西班牙语最常用的表示「狗」的,是一个词源不明的野鸡词 perro,而嫡系的 can 变成了罕用词。
说这些的意思是:1 号元素 H,它到底要叫 waterstuff 还是 lightgas 或是 hydrogen,都有道理,只要有一个官方的明确规定。8 号元素在日语里到底要叫 酸素 还是 オクシジェン,都可以,只要有一个官方的明确规定。Canis lupus familiaris到底要叫 can 还是 perro,都行,只要有一个官方的明确规定。西班牙语和法语到底要不要像意大利语一样去掉不发音的 h,随便,只要有一个官方的明确规定。西班牙语合不合并发音一样的 b 和 v,无所谓,只要有一个官方的明确规定。
很多语言现象都是这样,正反都是对的。只是说,作为官方语言,必须有一个明确的规定。在某个现象已经存在的前提下,我们可以反推出这一现象背后的道理。但这并不是说和这一现象对立的其他现象就是技术上错误的。本文开始的三个问题,以及所有这一类的问题,挖掘到底,本质上都是一样的。
对于语言,只能根据已知去归纳规律,不能使用规律来演绎未知。
注释:
[1] 该说法出自田中山编著的《台湾 Amis 语话语汇编》,我并没有在网上查到此说法。
[2] 我自己写阿美语时使用夏威夷语的「ʻ」(ʻokina),这样辨识度稍微高一点,也便于搜索。但这里专门讲阿美语的正字,所以还是使用普通的「‘」。