「着」变「著」,真不是好事

 中文  Comments Off on 「着」变「著」,真不是好事
Dec 032011
 

刚刚玩The Sims 3的时候,我的模拟人跳出一个愿望:着手写作。我第一眼看下去就晕了,我听过有车手、选手、好手、能手、把手……这些称呼,但「着手」是什么呢?难道写书著作的人可以简称为「着手」?噢,是个新名词啊。后来一想,应该是「着手」的意思吧。

把「着」合并到「著」,即使大陆都不至于会这样,反而台湾这个保持着正体字的地区居然这么做,在我看来真是很难受,而且很害人。(《离奇的「著」与「着」》)

查字符用的工具:BabelMap

 中文  Comments Off on 查字符用的工具:BabelMap
Jun 172011
 

开始前要看清楚了,这个是查字符的工具,而不是查字用的字典。平时如果要找一些符号,比如箭头、星星之类的,可以在Windows自带的Character Map里面找到(即字符映射表)。只要安装了相应的Font,大多数情况下就能查到想要的字符。为什么是大多数情况下?因为有些字符它找不到。

Character Map有个缺点,只能查到U+FFFF之前的字符,后边的就查不出来了,于是EXT-B和EXT-C区的字就无法找到。这个时候就要请出BabelMap这款工具了。BabelMap可以自动为每个区域选择对应的Font,而不是只能查该Font有哪些字符。更为难得的是,它不但可以查字,就连读音都能查,国语、粤语、韩语都能找到对应读音。本来日语也可以的,不过不知道为什么日语那项总是无法选择。

May 122011
 

原本以为大陆的简化字才有多字合一的情况,比如「表」与「表」被合并成「表」,「后」与「后」被合并成「后」。但是现在看台湾的文章多了,就发现原来民国台湾省教育部也在对某些字做类似的事情,目前为止我只发现一个,那就是「著」与「着」。

在大陆,「著」与「着」这两个从永远都不会被混合使用,这真是个奇迹,也算是一个正确的举动。反而台湾的教育部就真是令人费解,大陆的简化字都没合并「著」和「着」,你合并来干嘛。我找了下相关资料,原来他们的理由是,「着」是「著」的某些意义下的分化字,因此将「着」放弃使用。这个理由倒是很像简化字当时的理由啊,比如刚才的例子,「表」与「表」就属于这种情况。但人家作为简化字地区,并未合并「著」与「着」,可见这两个字一旦合并会导致很多麻烦,至少不比别的合并字好到哪里去。

我不清楚台湾人能否正确区分「著」与「着」这两个字,但大陆人和香港人(还有澳门人、新加坡人等等)一定能区分开来。试想下,「着火」被写成「着火」,给人的感觉是「著作、写下一些火」,那不是很怪异吗。又如「著着」,虽然没这个词,不过偶然可以用得到,比如某作者很不耐烦地应付说:「这本书我还在着着呢!」如果同一用「著」呢?就会变成:「这本书我还在着着呢!」简直无法理解!

即使从语音来讲,这两个字读音都完全不同。「著」汉语拼音zhù,注音符号「ㄓㄨˋ」,粤语拼音zyu3;「着」汉语拼音zháo、zhe,注音符号「ㄓㄠˊ」、「ㄓㄜ」,粤语拼音zoek6、zyu6。

所以即使我打字时会用正体字、繁体字,但我在使用文字的时候是有原则的,并非全盘台湾化,而是会参考香港的用法,以及大陆简化字使用前的文字用法,坚持我自己的用字方式。很多中文字爱好者及专业人士(有台湾及香港人)曾经在某个清华的中文字论坛倡议过,要做一份大中华的正体字表(非完全台湾标准),并且还会将香港标准作为参照、对照,他们的观点我大多数都赞同,看似他们的用字程度无论比台湾、大陆都精准,如果他们能早日完成该表,那就真是一件大好事。

更新自2013年8月:如果留意看的话,「着」字在日本汉字中就得到了保留。其实说到俗字、分化字,现时有许许多多的字都来自俗字并在平时使用中最终转化成正字。例如「象」—「像」、「游」—「游」、「说」—「悦」等等,不一而足。如果死守「第一正字」,不但会使日常使用变得不方便,搞不好可能会变得比简化字更偏激(比如《第一批异体字整理表》),这会带来何种破坏,大陆以外的正体字使用者肯定很清楚吧。

适当增加一些分化出来的俗字不是坏事(不要有事没事都分就可以了),对于字义表达更有利。

May 112011
 

有一个事实摆在眼前:香港、台湾、大陆三个地区使用的术语各有不同。大陆人或者平时已经习惯大陆生活的人,如果改用正体字、繁体字的话,用电脑的时候或多或少都会遇这种麻烦问题,会发现很多术语会发生改变。同样,香港人、台湾人也会遇到这种问题。

如果说外国人名翻译、地区地名翻译各有不同的话那还说得过去,大陆与台湾的原因众所周知,而香港则是因为用粤语。但电脑术语翻译就反而说不过去,而造成这种术语区别的很大程度要怪那些IT巨头公司,首先是微软,其次是Google。微软的Windows和DOS原本只有欧洲文字版(英文、法文、德文、西班牙文等等),后来为了中国市场就制作了中文版。令人困惑的是,繁体版和简体版的术语居然差别巨大。在此之前,很多Windows专用名词是无对应的中文翻译,亦就是说,这部分的中文术语完全是微软自行翻译的。而且就算是原本已经有了对应的中文翻译,微软也可以靠自身的垄断地位强行改变固有翻译,就好像大陆的GB18030不得不全盘接受GBK一样。

我看了下大陆与港台对于C:、D:、这样的分区符号的描述,大陆的描述是:

有两个盘,分别是C盘和D盘

或者

有两个盘,分别是C:和D:

专业点的微软认证的专家或工程师则会这么说:

有两个分区,分别是C:和D:

而港台则会是:

有两个分区,分别是C:和D:

跟专业工程师的一致。

还有Memory,大陆翻译成「内存」,港台叫做「记忆体」,于是大陆太多的人连Memory和Hard Disk都分不清——他们凴感觉知道「内存」是电脑内部的存储器,但就以为这存储器是Hard Disk。

然后是Google。Google公司只不过成立了十几年,它自己的专用术语居然就已经很多不同,很显然,本来可以用同一种名称的。比如Search Engine,大陆版叫做「搜索引擎」,台湾版叫做「搜寻引擎」,同一个意思用了两个不同的同义词。再拿AdSense广告格式为例,英文版的Leaderboard,繁体版叫做「首页广告看板」,简体版叫做“页首横幅”。这些新术语本来可以用同一个翻译的,但总是要不一样,这累死人了吧。

接触得越多,就觉得越烦。

还有一些翻译实在令人更烦,三个地方都不同的。比如Blog,大陆叫做「博客」,香港叫做「网志」,台湾叫做「部落格」。如果单就这个Blog来讲,个人觉得「网志」这一词应该比较好,属于意译,另外那两个完全就是音译。不知道这是跟微软有关还是Google有关,或是别的公司弄出来的。

Mar 032011
 

昆仑山是我国大陆地区著名的山脉,「西起帕米尔高原,向东延伸至四川省西北部,介于塔里木盆地、柴达木盆地及藏北高原之间。长约2500公里,海拔高度为5500至6000公尺。」

从名字上看,「昆仑」二字给人一看就明白,这是山,猜也猜得到。即使是初学中文(正体繁体)的外国人也容易从字面上猜得到。简化字不管三七二十一,将这两个字简化成「昆仑」。单从字面上来讲,如果不是事先告知的话,这很容易被人误解为「昆仑」是一个新的东西,而不是山。

提到昆仑山的唐诗:

唐·李贺 日出行
白日下昆仑,发光如舒丝。
徒照葵藿心,不照游子悲。
折折黄河曲,日从中央转。
旸谷耳曾闻,若木眼不见。
奈何铄石,胡为销人。
羿弯弓属矢那不中,足令久不得奔,讵教晨光夕昏。

Feb 132011
 

目前中国的汉语语系有多种语言,官方使用的是国语(普通话),而各个地方均有自己的语言,如粤语、闽南语、吴语等等,这些语言同样需要有一套符号帮助标记发音。用注音符号还是拼音好呢?

我个人对待此有个特别的看法。对于学习现行国语普通话,使用注音符号较好;对于学习地区语言,例如粤语、闽南语等语言,使用对应拼音反而更好。这样做有3个好处,我以粤语为例。

第一,分开使用可以避免混淆。汉语拼音与粤语拼音虽然使用相同的字母,但字母对应的发音并不一致,容易导致学习者混淆。如果国语用注音、粤语用粤拼,就不存在这种问题了。

第二,方便电脑输入。虽然说注音符号可以透过增加符号来帮助标注国语缺少的发音,但这样做有个麻烦,若电脑的输入法就是用注音,由于国语词汇读音与粤语读音不同,使用时需要调整输入法。但若频繁调整输入法以适应两种语言的使用,还不如换输入法更为方便。若国语用注音、粤语用粤拼,各自都方便,还能避免混淆带来的不适应。

第三,地区标注地名、路牌时,地方语言的拼音占优。假如学校教国语时只教注音,其它拼音只有自学,而粤语则教粤拼,那么人们为地名标注时,自然而然地用倾向粤语去标注了,因为粤拼是他们唯一被教过、最为熟悉的拼音系统。用自己最熟悉的方式做事,会比用较陌生的方式来得更顺手。若粤语使用者平时用惯粤拼输入法则更佳。

当然了,这种做法的前提是,广东的学校要增设粤语课程(此时可取消政治洗脑课程)。在这里要说个题外话。现时虽然有好多人都知道粤语的语言优点,亦有好多维护、坚撑粤语的人,但由于省内学校(尤其是广州市、深圳市)通过废粤的方式来推普以获得所谓的「政绩」,甚至有些本土文化认识不深的「文盲」「粤盲」家庭禁止小孩用粤语(这里面居然有广东人),导致小孩的粤语发音越来越不准,错音、懒音、病毒音严重,因此个人觉得学校增设粤语课程非常必要。

而对于那些禁止小孩用粤语的家庭,我想有一个成语可以形容他们:数典忘祖。这些家庭的人若想反驳,我的回答是:请先去了解粤语、广府文化本身。国语普通话的音素缺失严重(居然连入音都缺失),本来仅仅是用来作为交流用的语言,它不能用来传承中华文化。大陆专制政府推行疯癫政策,难道民众自身也要跟着去疯?这种人连独立思考能力都缺失,难怪会去支持那些疯癫政策、以音素缺失严重的国语普通话作为母语。

在此我并非排外,更不是排斥国语普通话,而是不满强权侵略文化(蒙元满清就是如此),以为了避免地方文化的消失。其实不单是粤语、广府文化需要传承保护,即使是闽南、吴等地的语言及文化均需要传承及保护,不能政策疯癫了连民众都跟着疯癫,民间自身可以做些事,尤其是平民百姓更应该要加入来一齐传承。法国人可以保护法语(但他们并非盲目排斥英语),中国各地区的人就同样有保护自身语言的权利。(可惜阻力重重,原因大家都知道——某政府的政策导致的)

汉语拼音与简化字

 中文  Comments Off on 汉语拼音与简化字
Feb 112011
 

现在很多人一看到民国自由地区的注音符号(比如像「ㄓㄨㄤ」这种)就一头雾水,不知所措。这种符号就相当于大陆地区使用的汉语拼音,不过其目的稍有不同。先说汉语拼音。

提到汉语拼音就不能不提简化字。早在三十年代,中共总书记瞿秋白就说:「汉字真正是世界上最龌龊最恶劣最混蛋的中世纪的茅坑」。共产党的文化标兵鲁迅也认为:「汉字是愚民政策的利器」,是「劳苦大众身上的结核」,「倘不先除去它,结果只有自己死」。当时苏联亦积极支持这种做法。1958年,大陆国务院修改通过了《汉语拼音方案》,原本是用来废除汉字的,「走世界共同的拼音化道路」。当时是想先用拼音来注音,帮助识字,一旦时机成熟就废除汉字取而代之,在汉字未被取代之前,先实行汉字简化,并取消异体字,废除正体字。

后来在20世纪70年代,出台二简字草案并将之推行,但因造成大量混乱而不得不废除。二简字至今仍有残留,例如衡量金钱的单位「圆」至今在大陆仍然使用「元」字,表示回答、回应之意的「答复」与「回复」至今仍被写作「答复」「回复」。好在二简字推行失败,若推行成功的话,也许汉字被废除、被汉语拼音完全代替的日子就不远了。

时至今日,汉语拼音已经停留在为文字标记发音的程度。说到标记发音,现在可以看看注音符号了。

注音符号一直都仅仅是作为帮助标记发音的工具使用,并未像汉语拼音那样初衷是为了代替汉字。注音符号有个好处,基本上是一音一符号,即使是韵母也不会超过两个符号,这对于小学生学习汉字而言是很有帮助的。例如「团」的韵母用汉语拼音表示为uan,注音符号仅需两个,即「ㄨㄢ」。声母加韵母最长不会超过3个符号,例如「状」,汉语拼音是zhuang,而注音符号是「ㄓㄨㄤ」。在电脑输入时,注音符号能够比汉语拼音少打很多字母,唯一的麻烦是需要记住注音符号的位置。

那么汉语拼音一无是处吗?那又不是。民国政府就吸收了汉语拼音,为甚么呢?来看看2005年,台北市马市长英九莅微软公司演讲纪录,以下为部份摘录:

也许有人质疑,我们一方面主张将「繁体字」正名为「正体字」,一方面又采用大陆推动的「汉语拼音」,有无双重标准?其实这是截然不同的两件事。「汉语拼音」系统是将国字以罗马字母表示,以方便外国人辨认,主要是以外国人为服务对象的,不是针对本国人。事实上,汉语拼音是针对中文注音符号一对一发展出来的罗马字,其实就是罗马化的注音符号。「汉语拼音」的优点为:以有限的二十六个英文字母要来代表三十七个注音符号,尽量精减使用字母的个数,也减少书写处理时间;而且以汉语拼音系统建立资料,制作检索码时,因各罗马字母项目都有字属之,不会像有的拼音系统偏重于某些字母,有些字母则闲置未善用,是较科学的一种系统。所以,汉语拼音自一九五八年问世以来,已使用四十六年,是一个成熟、全球广泛使用的系统。

目前美国以及世界其他许多地区的图书馆、博物馆,包括美国国会图书馆、哈佛燕京图书馆皆使用汉语拼音,联合国也在一九八六年予以认证。目前全球约有十四亿汉语拼音的使用人口,并且每天都在增加,因此,使用汉语拼音可以促进国际间资讯的沟通与交流,更可便利外籍人士来台投资、求学与旅游以及国人出国旅行、经商,这对于海岛型经济的台湾而言,益显重要。采用汉语拼音也不影响台湾的本土化,故不宜采用汉语以外的其他中文译音版本,否则将使台湾与国际社会接轨更为困难。

我酸主张采用汉语拼音来罗马化汉字,不过,学习国字我们仍主张采用注音符号,不用汉语拼音,因为注音符号有符合中文字型、亲切自然、标注简洁、单一发音等优点。此外,由口语到汉字之学习时,注音符号也是极佳的过渡学习工具。而且注音符号出版品普及率高,有助于提升学童国文水准。至于其他的乡土语言也可以注音符号增补式来表示,闽南语、客家语也只要加上若干符号和声调,即可清楚表示其发音。以罗马字母来表示客家、闽南语拼音,并不是唯一的方式。但是现在有的各种拼音法有其历史渊源,我们均予尊重,但是否一定要小孩子学这些字标,就见仁见智了。因此,目前在台北市小学的乡土语言教学,原则都不教罗马字拼音,以免与英语音标混淆。

这段话说得不错,汉语拼音用来给外国人看还可以,用来给国内人学习就不是很好了。

汉语拼音带来的一个问题是,使得说话时字母化,最明显的字母「z」,我聼过不少人读与此汉语拼音字母相关的字如「滋」「紫」「资」的时候,其发音带有英语字母「z」的特点,舌齿间震动音能够明显听到。更何况,汉语拼音本身不太符合英语读音,会使未经学习的外国人读错。

Nov 262010
 

本站使用了wp-chinese-conversion插件,实现自动转换中文的功能。这样的话,即时我一直都用传统字写文章,访客照样可以用简体中文去阅读。不过这样就出现了一个比较麻烦的问题:搜索引擎都会将繁体中文和简体中文区分对待,在搜素引擎上寻找的时候,我的网站会被“认为”是繁体中文,于是乎,用简体中文的人就不一定找到我的内容了。

我查过wp-chinese-conversion插件的描述,它说对于转换过的内容都会noindex,以免被重复收录。因此就需要对插件做小修改了。

打开plugins/wp-chinese-conversion/wp-chinese-conversion.php,找到这段:

else
    echo '<meta name="robots" content="noindex,follow" />';

把它修改成

else if( $wpcc_target_lang == 'zh-hans' || $wpcc_target_lang == 'zh-cn' )
    return;
else
    echo '<meta name="robots" content="noindex,follow" />';

起判断作用的是
$wpcc_target_lang == 'zh-hans' || $wpcc_target_lang == 'zh-cn'
它用来判断现时页面的语言,若符合就直接return。可以按照实际情况修改,比如祗保留 'zh-cn' 或祗保留 'zh-hans'。
因为我仅用了'zh-hans',所以是否去掉'zh-cn'都无所谓。

这样修改之后,不管是单独搜索繁体还是单独搜索简体,都能找到相同的地方。

BTW:相比其其它翻译插件,wp-chinese-conversion功能更强大,而且速度不错,词汇翻译也比较专业,它能够根据大陆、港澳、台湾的用词不同而作不同的转换。在IT用语方面,我个人采用部份大陆词汇+部份香港词汇混用(广东人一般都明)。