「着」變「著」,真不是好事

 中文  Comments Off on 「着」變「著」,真不是好事
Dec 032011
 

剛剛玩The Sims 3的時候,我的模擬人跳出一個願望:著手寫作。我第一眼看下去就暈了,我聽過有車手、選手、好手、能手、把手……這些稱呼,但「著手」是什麼呢?難道寫書著作的人可以簡稱爲「著手」?噢,是個新名詞啊。後來一想,應該是「着手」的意思吧。

把「着」合併到「著」,即使大陸都不至於會這樣,反而台灣這個保持着正體字的地區居然這麼做,在我看來真是很難受,而且很害人。(《離奇的「著」與「着」》)

查字符用的工具:BabelMap

 中文  Comments Off on 查字符用的工具:BabelMap
Jun 172011
 

開始前要看清楚了,這個是查字符的工具,而不是查字用的字典。平時如果要找一些符號,比如箭頭、星星之類的,可以在Windows自帶的Character Map裏面找到(即字符映射表)。衹要安裝了相應的Font,大多數情況下就能查到想要的字符。爲什麼是大多數情況下?因爲有些字符它找不到。

Character Map有個缺點,衹能查到U+FFFF之前的字符,後邊的就查不出來了,於是EXT-B和EXT-C區的字就無法找到。這個時候就要請出BabelMap這款工具了。BabelMap可以自動為每個區域選擇對應的Font,而不是衹能查該Font有哪些字符。更爲難得的是,它不但可以查字,就連讀音都能查,國語、粵語、韓語都能找到對應讀音。本來日語也可以的,不過不知道爲什麼日語那項總是無法選擇。

May 122011
 

原本以爲大陸的簡化字才有多字合一的情況,比如「表」與「錶」被合並成「表」,「后」與「後」被合並成「后」。但是現在看臺灣的文章多了,就發現原來民國臺灣省教育部也在對某些字做類似的事情,目前爲止我衹發現一個,那就是「著」與「着」。

在大陸,「著」與「着」這兩個從永遠都不會被混合使用,這真是個奇跡,也算是一個正確的舉動。反而臺灣的教育部就真是令人費解,大陸的簡化字都沒合併「著」和「着」,你合併來幹嘛。我找了下相關資料,原來他們的理由是,「着」是「著」的某些意義下的分化字,因此將「着」放棄使用。這個理由倒是很像簡化字當時的理由啊,比如剛才的例子,「表」與「錶」就屬於這種情況。但人家作爲簡化字地區,並未合併「著」與「着」,可見這兩個字一旦合併會導致很多麻煩,至少不比別的合併字好到哪裏去。

我不清楚臺灣人能否正確區分「著」與「着」這兩個字,但大陸人和香港人(還有澳門人、新加坡人等等)一定能區分開來。試想下,「着火」被寫成「著火」,給人的感覺是「著作、寫下一些火」,那不是很怪異嗎。又如「著着」,雖然沒這個詞,不過偶然可以用得到,比如某作者很不耐煩地應付說:「這本書我還在著着呢!」如果同一用「著」呢?就會變成:「這本書我還在著著呢!」簡直無法理解!

即使從語音來講,這兩個字讀音都完全不同。「著」漢語拼音zhù,注音符號「ㄓㄨˋ」,粵語拼音zyu3;「着」漢語拼音zháo、zhe,注音符號「ㄓㄠˊ」、「ㄓㄜ」,粵語拼音zoek6、zyu6。

所以即使我打字時會用正體字、繁體字,但我在使用文字的時候是有原則的,並非全盤臺灣化,而是會參考香港的用法,以及大陸簡化字使用前的文字用法,堅持我自己的用字方式。很多中文字愛好者及專業人士(有臺灣及香港人)曾經在某個清華的中文字論壇倡議過,要做一份大中華的正體字表(非完全臺灣標準),並且還會將香港標準作爲參照、對照,他們的觀點我大多數都贊同,看似他們的用字程度無論比臺灣、大陸都精準,如果他們能早日完成該表,那就真是一件大好事。

更新自2013年8月:如果留意看的話,「着」字在日本漢字中就得到了保留。其實說到俗字、分化字,現時有許許多多的字都來自俗字並在平時使用中最終轉化成正字。例如「象」—「像」、「游」—「遊」、「說」—「悦」等等,不一而足。如果死守「第一正字」,不但會使日常使用變得不方便,搞不好可能會變得比簡化字更偏激(比如《第一批異體字整理表》),這會帶來何種破壞,大陸以外的正體字使用者肯定很清楚吧。

適當增加一些分化出來的俗字不是壞事(不要有事沒事都分就可以了),對於字義表達更有利。

May 112011
 

有一個事實擺在眼前:香港、臺灣、大陸三個地區使用的術語各有不同。大陸人或者平時已經習慣大陸生活的人,如果改用正體字、繁體字的話,用電腦的時候或多或少都會遇這種麻煩問題,會發現很多術語會發生改變。同樣,香港人、台灣人也會遇到這種問題。

如果說外國人名翻譯、地區地名翻譯各有不同的話那還說得過去,大陸與臺灣的原因衆所周知,而香港則是因爲用粵語。但電腦術語翻譯就反而說不過去,而造成這種術語區別的很大程度要怪那些IT巨頭公司,首先是微軟,其次是Google。微軟的Windows和DOS原本衹有歐洲文字版(英文、法文、德文、西班牙文等等),後來爲了中國市場就製作了中文版。令人困惑的是,繁體版和簡體版的術語居然差別巨大。在此之前,很多Windows專用名詞是無對應的中文翻譯,亦就是說,這部分的中文術語完全是微軟自行翻譯的。而且就算是原本已經有了對應的中文翻譯,微軟也可以靠自身的壟斷地位強行改變固有翻譯,就好像大陸的GB18030不得不全盤接受GBK一樣。

我看了下大陸與港臺對於C:、D:、這樣的分區符號的描述,大陸的描述是:

有兩個盤,分別是C盤和D盤

或者

有兩個盤,分別是C:和D:

專業點的微軟認證的專家或工程師則會這麼說:

有兩個分區,分別是C:和D:

而港臺則會是:

有兩個分區,分別是C:和D:

跟專業工程師的一致。

還有Memory,大陸翻譯成「內存」,港臺叫做「記憶體」,於是大陸太多的人連Memory和Hard Disk都分不清——他們凴感覺知道「內存」是電腦內部的存儲器,但就以爲這存儲器是Hard Disk。

然後是Google。Google公司衹不過成立了十幾年,它自己的專用術語居然就已經很多不同,很顯然,本來可以用同一種名稱的。比如Search Engine,大陸版叫做「搜索引擎」,臺灣版叫做「搜尋引擎」,同一個意思用了兩個不同的同義詞。再拿AdSense廣告格式爲例,英文版的Leaderboard,繁體版叫做「首頁廣告看板」,簡體版叫做“页首横幅”。這些新術語本來可以用同一個翻譯的,但總是要不一樣,這累死人了吧。

接觸得越多,就覺得越煩。

還有一些翻譯實在令人更煩,三個地方都不同的。比如Blog,大陸叫做「博客」,香港叫做「網誌」,臺灣叫做「部落格」。如果單就這個Blog來講,個人覺得「網誌」這一詞應該比較好,屬於意譯,另外那兩個完全就是音譯。不知道這是跟微軟有關還是Google有關,或是別的公司弄出來的。

Mar 032011
 

崑崙山是我國大陸地區著名的山脈,「西起帕米爾高原,向東延伸至四川省西北部,介於塔里木盆地、柴達木盆地及藏北高原之間。長約2500公里,海拔高度為5500至6000公尺。」

從名字上看,「崑崙」二字給人一看就明白,這是山,猜也猜得到。即使是初學中文(正體繁體)的外國人也容易從字面上猜得到。簡化字不管三七二十一,將這兩個字簡化成「昆仑」。單從字面上來講,如果不是事先告知的話,這很容易被人誤解爲「昆仑」是一個新的東西,而不是山。

提到崑崙山的唐詩:

唐·李賀 日出行
白日下崑崙,發光如舒絲。
徒照葵藿心,不照遊子悲。
折折黃河曲,日從中央轉。
暘谷耳曾聞,若木眼不見。
奈何鑠石,胡為銷人。
羿彎弓屬矢那不中,足令久不得奔,詎教晨光夕昏。

Feb 132011
 

目前中國的漢語語系有多種語言,官方使用的是國語(普通話),而各個地方均有自己的語言,如粵語、閩南語、吳語等等,這些語言同樣需要有一套符號幫助標記發音。用注音符號還是拼音好呢?

我個人對待此有個特別的看法。對於學習現行國語普通話,使用注音符號較好;對於學習地區語言,例如粵語、閩南語等語言,使用對應拼音反而更好。這樣做有3個好處,我以粵語爲例。

第一,分開使用可以避免混淆。漢語拼音與粵語拼音雖然使用相同的字母,但字母對應的發音並不一致,容易導致學習者混淆。如果國語用注音、粵語用粵拼,就不存在這種問題了。

第二,方便電腦輸入。雖然說注音符號可以透過增加符號來幫助標註國語缺少的發音,但這樣做有個麻煩,若電腦的輸入法就是用注音,由於國語詞彙讀音與粵語讀音不同,使用時需要調整輸入法。但若頻繁調整輸入法以適應兩種語言的使用,還不如換輸入法更爲方便。若國語用注音、粵語用粵拼,各自都方便,還能避免混淆帶來的不适應。

第三,地區標註地名、路牌時,地方語言的拼音佔優。假如學校教國語時衹教注音,其它拼音衹有自學,而粵語則教粵拼,那麼人們爲地名標註時,自然而然地用傾向粵語去標註了,因爲粵拼是他們唯一被教過、最爲熟悉的拼音系統。用自己最熟悉的方式做事,會比用較陌生的方式來得更順手。若粵語使用者平時用慣粵拼輸入法則更佳。

當然了,這種做法的前提是,廣東的學校要增設粵語課程(此時可取消政治洗腦課程)。在這裡要說個題外話。現時雖然有好多人都知道粵語的語言優點,亦有好多維護、堅撐粵語的人,但由於省内學校(尤其是廣州市、深圳市)通過廢粵的方式來推普以獲得所謂的「政績」,甚至有些本土文化認識不深的「文盲」「粵盲」家庭禁止小孩用粵語(這裏面居然有廣東人),導致小孩的粵語發音越來越不準,錯音、懶音、病毒音嚴重,因此個人覺得學校增設粵語課程非常必要。

而對於那些禁止小孩用粵語的家庭,我想有一個成語可以形容他們:數典忘祖。這些家庭的人若想反駁,我的回答是:請先去瞭解粵語、廣府文化本身。國語普通話的音素缺失嚴重(居然連入音都缺失),本來僅僅是用來作爲交流用的語言,它不能用來傳承中華文化。大陸專制政府推行瘋癲政策,難道民衆自身也要跟著去瘋?這種人連獨立思考能力都缺失,難怪會去支持那些瘋癲政策、以音素缺失嚴重的國語普通話作爲母語。

在此我並非排外,更不是排斥國語普通話,而是不滿強權侵略文化(蒙元滿清就是如此),以爲了避免地方文化的消失。其實不單是粵語、廣府文化需要傳承保護,即使是閩南、吳等地的語言及文化均需要傳承及保護,不能政策瘋癲了連民衆都跟著瘋癲,民間自身可以做些事,尤其是平民百姓更應該要加入來一齊傳承。法國人可以保護法語(但他們並非盲目排斥英語),中國各地區的人就同樣有保護自身語言的權利。(可惜阻力重重,原因大家都知道——某政府的政策導致的)

漢語拼音與簡化字

 中文  Comments Off on 漢語拼音與簡化字
Feb 112011
 

現在很多人一看到民國自由地區的注音符號(比如像「ㄓㄨㄤ」這種)就一頭霧水,不知所措。這種符號就相當於大陸地區使用的漢語拼音,不過其目的稍有不同。先說漢語拼音。

提到漢語拼音就不能不提簡化字。早在三十年代,中共總書記瞿秋白就說:「漢字真正是世界上最齷齪最惡劣最混蛋的中世紀的茅坑」。共產黨的文化標兵魯迅也認為:「漢字是愚民政策的利器」,是「勞苦大眾身上的結核」,「倘不先除去它,結果只有自己死」。當時蘇聯亦積極支持這種做法。1958年,大陸國務院修改通過了《漢語拼音方案》,原本是用來廢除漢字的,「走世界共同的拼音化道路」。當時是想先用拼音來注音,幫助識字,一旦時機成熟就廢除漢字取而代之,在漢字未被取代之前,先實行漢字簡化,並取消異體字,廢除正體字。

後來在20世紀70年代,出臺二簡字草案並將之推行,但因造成大量混亂而不得不廢除。二簡字至今仍有殘留,例如衡量金錢的單位「圓」至今在大陸仍然使用「元」字,表示回答、回應之意的「答覆」與「回覆」至今仍被寫作「答复」「回复」。好在二簡字推行失敗,若推行成功的話,也許漢字被廢除、被漢語拼音完全代替的日子就不遠了。

時至今日,漢語拼音已經停留在爲文字標記發音的程度。說到標記發音,現在可以看看注音符號了。

注音符號一直都僅僅是作爲幫助標記發音的工具使用,並未像漢語拼音那樣初衷是爲了代替漢字。注音符號有個好處,基本上是一音一符號,即使是韻母也不會超過兩個符號,這對於小學生學習漢字而言是很有幫助的。例如「團」的韻母用漢語拼音表示爲uan,注音符號僅需兩個,即「ㄨㄢ」。聲母加韻母最長不會超過3個符號,例如「狀」,漢語拼音是zhuang,而注音符號是「ㄓㄨㄤ」。在電腦輸入時,注音符號能夠比漢語拼音少打很多字母,唯一的麻煩是需要記住注音符號的位置。

那麼漢語拼音一無是處嗎?那又不是。民國政府就吸收了漢語拼音,爲甚麼呢?來看看2005年,臺北市馬市長英九蒞微軟公司演講紀錄,以下爲部份摘錄:

也許有人質疑,我們一方面主張將「繁體字」正名為「正體字」,一方面又採用大陸推動的「漢語拼音」,有無雙重標準?其實這是截然不同的兩件事。「漢語拼音」系統是將國字以羅馬字母表示,以方便外國人辨認,主要是以外國人為服務對象的,不是針對本國人。事實上,漢語拼音是針對中文注音符號一對一發展出來的羅馬字,其實就是羅馬化的注音符號。「漢語拼音」的優點為:以有限的二十六個英文字母要來代表三十七個注音符號,儘量精減使用字母的個數,也減少書寫處理時間;而且以漢語拼音系統建立資料,製作檢索碼時,因各羅馬字母項目都有字屬之,不會像有的拼音系統偏重於某些字母,有些字母則閒置未善用,是較科學的一種系統。所以,漢語拼音自一九五八年問世以來,已使用四十六年,是一個成熟、全球廣泛使用的系統。

目前美國以及世界其他許多地區的圖書館、博物館,包括美國國會圖書館、哈佛燕京圖書館皆使用漢語拼音,聯合國也在一九八六年予以認證。目前全球約有十四億漢語拼音的使用人口,並且每天都在增加,因此,使用漢語拼音可以促進國際間資訊的溝通與交流,更可便利外籍人士來臺投資、求學與旅遊以及國人出國旅行、經商,這對於海島型經濟的臺灣而言,益顯重要。採用漢語拼音也不影響臺灣的本土化,故不宜採用漢語以外的其他中文譯音版本,否則將使臺灣與國際社會接軌更為困難。

我酸主張採用漢語拼音來羅馬化漢字,不過,學習國字我們仍主張採用注音符號,不用漢語拼音,因為注音符號有符合中文字型、親切自然、標注簡潔、單一發音等優點。此外,由口語到漢字之學習時,注音符號也是極佳的過渡學習工具。而且注音符號出版品普及率高,有助於提升學童國文水準。至於其他的鄉土語言也可以注音符號增補式來表示,閩南語、客家語也只要加上若干符號和聲調,即可清楚表示其發音。以羅馬字母來表示客家、閩南語拼音,並不是唯一的方式。但是現在有的各種拼音法有其歷史淵源,我們均予尊重,但是否一定要小孩子學這些字標,就見仁見智了。因此,目前在臺北市小學的鄉土語言教學,原則都不教羅馬字拼音,以免與英語音標混淆。

這段話說得不錯,漢語拼音用來給外國人看還可以,用來給國內人學習就不是很好了。

漢語拼音帶來的一個問題是,使得說話時字母化,最明顯的字母「z」,我聼過不少人讀與此漢語拼音字母相關的字如「滋」「紫」「資」的時候,其發音帶有英語字母「z」的特點,舌齒間震動音能夠明顯聽到。更何況,漢語拼音本身不太符合英語讀音,會使未經學習的外國人讀錯。

Nov 262010
 

本站使用了wp-chinese-conversion插件,實現自動轉換中文的功能。這樣的話,即時我一直都用傳統字寫文章,訪客照樣可以用簡體中文去閲讀。不過這樣就出現了一個比較麻煩的問題:搜索引擎都會將繁體中文和簡體中文區分對待,在搜素引擎上尋找的時候,我的網站會被“認爲”是繁體中文,於是乎,用簡体中文的人就不一定找到我的内容了。

我查過wp-chinese-conversion插件的描述,它說對於轉換過的内容都會noindex,以免被重復收錄。因此就需要對插件做小修改了。

打開plugins/wp-chinese-conversion/wp-chinese-conversion.php,找到這段:

else
    echo '<meta name="robots" content="noindex,follow" />';

把它修改成

else if( $wpcc_target_lang == 'zh-hans' || $wpcc_target_lang == 'zh-cn' )
    return;
else
    echo '<meta name="robots" content="noindex,follow" />';

起判斷作用的是
$wpcc_target_lang == 'zh-hans' || $wpcc_target_lang == 'zh-cn'
它用來判斷現時頁面的語言,若符合就直接return。可以按照實際情況修改,比如祗保留 'zh-cn' 或祗保留 'zh-hans'。
因爲我僅用了'zh-hans',所以是否去掉'zh-cn'都無所謂。

這樣修改之後,不管是單獨搜索繁體還是單獨搜索簡體,都能找到相同的地方。

BTW:相比其其它翻譯插件,wp-chinese-conversion功能更強大,而且速度不錯,詞彙翻譯也比較專業,它能夠根據大陸、港澳、臺灣的用詞不同而作不同的轉換。在IT用語方面,我個人採用部份大陸詞彙+部份香港詞彙混用(廣東人一般都明)。

轉載請註明: 轉載自https://www.still-c.com/
本文URL: https://www.still-c.com/archives/50.html