Apr 082011
 

鑒于百度一直聲稱自己最懂中文,那好,今天我就來直接測試傳統中文的識別程度。例如,我要尋找「瞭解」是否爲「了解」的正體字寫法、「游」與「遊」的區別,一般來説我會直接輸入這幾個字詞,並在適當的位置用空格隔開。現在來看看百度和Google的表現。

「瞭解」與「了解」之Google:

看來還不錯,找到了我想要的資料。

再來看看百度:

真是令人無話可説的結果,百度這是怎麼回事,漢字都不會分嗎。

再來看看「游」「遊」兩個字的區別。繼續還是Google為先:

很好,需要找的資料直接出現在第一條。

那麼百度的表現又如何呢?來看看:

結果依然一樣,百度不懂區分。在結果面前無需多說,百度雖然認識漢字,但卻是個半文盲,對於正體字、繁體字一概不懂,查古書資料的話豈不是無法可查了,這還叫「最懂中文」?真是大笑話。

Mar 122011
 

現在很多大陸人在表達「回答、回信」(Reply)等意思時,基本上都是使用「回复、答复」,於是在使用正體字、繁體字時往往變成「回復」、「答復」。但在港澳臺、海外等使用非簡化漢字的地方,都是使用「回覆」、「答覆」。哪個對呢?

來看看《簡化字總表》(1986年版)的說明是怎樣寫的:「原《简化字总表》中的个别字,作了调整。“叠”、“覆”、“像”、“囉”不再作“迭”、“复”、“象”、“罗”的繁体字处理。因此,在第一表中删去“迭〔叠〕”、“象〔像〕”,“复”字字头下删去繁体字〔覆〕。」

答案已經出來了,「回覆」、「答覆」纔是正確的,即使是用簡化字也依然該用「回覆」、「答覆」,不應再用「回复」、「答复」,因此更不應該使用「回復」、「答復」這樣的錯誤用法。

這樣改,很顯然他們已經發現將「覆」合併到「复」帶來了很大麻煩。比如「覆盖」、「复盖」,這兩個詞的意思完全不同。「覆盖」(覆蓋)是將某物放在另一物的上方蓋住;「复盖」(復蓋)即「复建」(復建),是指恢復興建、重新建造。按照第一版《簡化字總表》的話都是「复盖」,很顯然會造成理解錯誤。例句:“该地停工工地的地基即被复盖”,如果按照之前的用法,該句子可以理解爲「該地基將會繼續建設」,以及「該地基將會被其它東西填埋掩蓋」。即使按照現在的簡化字方案,「复」字仍然代表兩種意思:「複」與「復」,因此「复盖」亦可指「複蓋」,即重複建設,雖然很少這樣用,但亦容易引起誤會。

幾十年來,簡化字不斷調整,原先被廢除的字又再重新恢復使用,很顯然是知道了簡化字並不合理,但又不敢恢復正體字,因爲那樣等於自我否定,唯有一小步一小步地有限恢復。


2012年4月4日補充:在粵語中,「復」與「覆」讀音並不一致。「復」爲fuk6, 「覆」 爲fuk1。粵語人士口頭表達Reply之意的時候不會讀 成「回復」,而是 「回覆」。使用國語的時候或多或少會因讀音問題引致混用,但衹要使用粵語一讀,就可以使用法變得清晰。

Mar 032011
 

崑崙山是我國大陸地區著名的山脈,「西起帕米爾高原,向東延伸至四川省西北部,介於塔里木盆地、柴達木盆地及藏北高原之間。長約2500公里,海拔高度為5500至6000公尺。」

從名字上看,「崑崙」二字給人一看就明白,這是山,猜也猜得到。即使是初學中文(正體繁體)的外國人也容易從字面上猜得到。簡化字不管三七二十一,將這兩個字簡化成「昆仑」。單從字面上來講,如果不是事先告知的話,這很容易被人誤解爲「昆仑」是一個新的東西,而不是山。

提到崑崙山的唐詩:

唐·李賀 日出行
白日下崑崙,發光如舒絲。
徒照葵藿心,不照遊子悲。
折折黃河曲,日從中央轉。
暘谷耳曾聞,若木眼不見。
奈何鑠石,胡為銷人。
羿彎弓屬矢那不中,足令久不得奔,詎教晨光夕昏。

Feb 082011
 

一到別人家,一般都會看到兩樣東西:日曆、通勝。當然還有一樣最常見的:利是封。就是這幾樣物品,我發現一些明顯的錯別字。

最明顯的就是「歷」「曆」不分,總是被簡化字“历”影響。由此帶來最常見的錯誤是,將「農曆」「日曆」寫成「農歷」「日歷」,將「歷史」寫成「曆史」,如果真要按照「曆」與「歷」的字意去直接理解的話,會導致意思全變。

還有一個應該屬於受到簡化字印刷標準的影響而印錯字。例如帶「咼」的字,比如「過」「鍋」;帶「骨」的字,比如「體」「髓」,通通有小錯誤。文字描述不容易講清楚,所以直接附圖:

注意看,就會發現一些問題了。

中文簡體字與大陸簡化字的區別與關係

 中文  Comments Off on 中文簡體字與大陸簡化字的區別與關係
Jan 312011
 

可能有人會困惑,簡體字與簡化字不就是同一個東西嗎,爲甚麼會有區別呢。實際上,就連中文系的學生有時也會把簡體字與簡化字說成是同一東西,其實他們自己是知道簡化字與簡體字的關係,不過是說順口一時改不過來而已。本文就來揭示簡化字與簡體字的區別。

近年來由於有政協委員提出要恢復繁體字,結果就有人跳出來寫「國民政府也曾經推行過簡體字」的神話網帖,並引起前幾年大陸網的激烈爭論。那到底是怎麼回事呢,看下去就明白了。

何謂簡體字

簡體字來自民間的俗體字、異體字、草書等文字、寫法中,與正規正體字相比而言筆畫數較少、字形有一定變化的非主流二等漢字。雖然簡體字古已有之,但從來未獲得過正式認可,因此官方的正式文書中都不會出現大量的簡體字。

也就是說,簡體字僅僅是一種爲了快速書寫而私下使用的「懶人字」, 這種簡約寫法後來逐步約定俗成。

何謂簡化字

簡化字是20世紀50年代中後期臨時制定出來的一種特殊文字。在當時的「人民代表大會」討論上已經說得很明白:立刻將漢字轉換成拼音文字,技術上的難點難以克服,人民的反對也比較強烈。所以必須先將漢字簡化掉一部分,然後再根據推行情況而進一步簡化,直至人民適應拼音文字。本來反對者眾多,不過後來都被強力殘忍的手段壓了下去。

由此可見,簡化字不過是漢字拼音化的過渡產物。最有力的證明便是後來還曾經推行過的「二簡字」,好在此時反對者更多,並且民間胡亂私自簡化漢字,最終「二簡字」被廢除。

簡體字與簡化字的區別和關係

簡化字與簡體字的主要區別和關係如下:

1、簡化字發明了一些筆畫和部首。
2、簡化字自創了一些新字。
3、簡化字合併了一些字。

如果想說「簡化字的某某字早已有之」,那麼就屬於這兩種情況:

1、簡化字抄用了部分古字。
2、簡化字照搬部分簡體字。

也就是說,簡化字並非簡體字。簡體字有的,簡化字可能會有;簡化字發明的筆畫、部首、新字,是不會在簡體字中找到的。

我知道有很多人想用「民國推行過簡體字」,或者「平時一直就叫『簡體字』,所以兩者是一樣的」這樣的話來證明立場。現在一一揭開謎團。

大陸的法律與字典中已經明確寫著,那叫「簡化字」、「簡化漢字」,而不叫「簡體字」。如果不信,可以參考這些法律、字典、資料:《新華字典》、《簡化字總表》、《簡化字總表説明》、《漢字使用管理規定》、《中華人民共和國國家通用語言文字法》、《中國文字沿革史》、《現代漢語通用字表》、《語言文字法實行辦法》。 這些資料隨處可找,書店有,網上也有。

我引用一位網民所寫的内容就知道爲何要列出這些資料了:

作爲堂堂一個政權的法律法規體系對各類名詞的概念和定義理所當然是要很清晰的,會盡量避免存在詞義解釋的模棱兩可或一詞多義的情況。如果簡化字就是簡體字,那麼法律條文上一定會很明確地指出和說明,而且會嚴格區分兩個名詞的使用場合。

國民政府的《簡體字表》

當時的簡體字表,僅僅是收集、整理民間流傳的簡體字,並未推廣使用,亦未曾像推廣簡化字那樣去強制使用,甚至連「建議使用」的行爲都無。 這裏我繼續再引用網文:

這個問題分析起來很容易,我只提出幾個問題供大家思考:

1、國民政府的收錄、整理工作是否等於「國民政府發明」?查遍那個神話帖子,裏面沒有提到國民政府發明了簡體字,而只是提到了「推行」。事實上國民政府根本不可能發明簡體字,因爲那是古代就有的東西,怎麼能在20世紀發明呢?

2、「公佈和推行」的詞義也很模糊,到底是公佈自己的發明,還是公佈已經收錄和整理完畢的民間資料呢?簡體字來自異體字、草書、俗體字,長期以來都是比較混亂的,系統化的整理工作當然是正常的。

3、那個帖子中說曾有所謂《各省市教育行政機關推行部頒簡體字辦法》。我想請問,這個《辦法》到底是法律還是行政規定?這個辦法是針對公務機關還是面對全體人民?

4、那個神話帖子最後說不到一年國民政府就撤銷了《簡體字表》。好,這種撤銷行爲説明了甚麼?一條政策錯誤就馬上改正,正説明當時的政府只是抱着試驗的心態來做事的。

5、從現有的史料來看,簡化字粉絲能否拿出國民政府用政府的名義召集了知識分子發明簡體字的證據?而簡化字的發明工作是鐵證如山的,人大的會議記錄和當時的報章和政府的通知都是有據可查的。

把「發明簡化字」這帽子扣到別人頭上,是否說明其實自己也知道簡化字不對?答案不言而喻。

Jan 282011
 

對於將現行國語(普通話,Mandrin)作爲母語的人來説,簡化字雖然也會影響到部分讀音,不過影響不算大。不過對於其他中文語言的使用者而言問題就比較明顯了,例如粵語。

例子一,借、藉

在正統表達方式中,如果要表達「以某事爲理由」(use as an excuse),使用的是「藉口」。而簡化字被改成用「借口」。從國語讀音來看的話,的確是讀成「借口」,但對於粵語來説就不是了。在粵語中,「藉口」不會被讀作「借口」,依然保持「藉」的讀音。

例子二,松、鬆

這兩個字意思不同,但對於國語而言讀音一樣,有可能就是被簡化的原因。不過在粵語中,這兩個字讀音是不同的。粵語中「松」讀音同「蟲」,而「鬆」的讀音與國語一致。「鬆」字被簡化成「松」之後就引發出部分人讀錯音的問題,並導致理解錯誤。比如這句話:

嗰塊木板有啲鬆(那塊木板有點鬆)

「鬆」字被簡化成「松」後,會被一些粵語發音不準的人讀成

嗰塊木板有啲松(那塊木板有點松)

剛才已經說過,粵語中「松」讀音同「蟲」,由此會被聼

嗰塊木板有啲蟲(那塊木板有點蟲)

聽到的人會理解成「木板有蛀蟲」,意思完全變了!

例子三,只、隻、衹

「隻」與「衹」兩個字意思不同,但國語中讀音相近,可能就是被簡化的原因。不過在粵語中,這兩個字讀音依然是不同的。粵語中「衹」讀音同「紙」,而「隻」的讀音[JEK](粵語拼音),聼起來像英文的「Jack」不發「ck」音。由此容易導致朗讀書面語時讀錯字(特別是在換行位置出現該字),以至聼的人無法理解。

寫在結尾

還有很多類似的例子,這裏就不一一列出了。

粵語書面表達古已有之,但因近年來大規模推廣簡化字,導致越來越多人不知道如何用書面語寫粵語,會寫的人用錯字的情況非常普遍,這是因爲簡化字在廢除正體字的時候引致依托正體字而存在的粵語字被同時廢除了。

正是由於簡化字並不適合粵語,而且使用電腦輸入中文時都是一樣快的,我最終放棄使用簡化字,重新使用傳承字。

Jan 062011
 

雖然我的網站開站還不到兩個月,不過從流量統計器來看,已經發現一些很特別的地方。

由於我用的文字是傳統中文(即正體、繁體中文),因此從搜索引擎引導過來的流量全部都是來自Google。既有.com.hk的,亦有.com.tw的,其中.com.tw全部都是正體字搜索,而.com.hk有繁體亦有簡體。總體來講,無論正體抑或簡體,流量基本上對半分。我看過那些引導過來的查詢字詞,在Google的搜索查詢結果中,都是正簡混合的,除非用戶限定只搜索某種中文。看來Google對中文都是一視同仁的。

而看看百度、搜搜等大陸搜索引擎,全部清一色偏向簡體字,對繁體網站一律say no,除非用戶自行選擇語種。

難道說百度不喜歡我的站?那倒似乎不是,流量記錄器告訴我,百度整天來訪讀取内容,而且一次一大堆,有時候甚至對同一頁讀完又讀。不過,據説很多網站都說百度本來就如此,我想我可以叫它做“百度特色”。相比之下,Google和搜搜的流量很穩定,每天都差不多,並且都能做到完整收錄。

這件事透露了一個信息:Google更加公平、公正,技術實力強大;百度等大陸搜索引擎不但技術差,而且戴有色眼鏡。

Nov 262010
 

本站使用了wp-chinese-conversion插件,實現自動轉換中文的功能。這樣的話,即時我一直都用傳統字寫文章,訪客照樣可以用簡體中文去閲讀。不過這樣就出現了一個比較麻煩的問題:搜索引擎都會將繁體中文和簡體中文區分對待,在搜素引擎上尋找的時候,我的網站會被“認爲”是繁體中文,於是乎,用簡体中文的人就不一定找到我的内容了。

我查過wp-chinese-conversion插件的描述,它說對於轉換過的内容都會noindex,以免被重復收錄。因此就需要對插件做小修改了。

打開plugins/wp-chinese-conversion/wp-chinese-conversion.php,找到這段:

else
    echo '<meta name="robots" content="noindex,follow" />';

把它修改成

else if( $wpcc_target_lang == 'zh-hans' || $wpcc_target_lang == 'zh-cn' )
    return;
else
    echo '<meta name="robots" content="noindex,follow" />';

起判斷作用的是
$wpcc_target_lang == 'zh-hans' || $wpcc_target_lang == 'zh-cn'
它用來判斷現時頁面的語言,若符合就直接return。可以按照實際情況修改,比如祗保留 'zh-cn' 或祗保留 'zh-hans'。
因爲我僅用了'zh-hans',所以是否去掉'zh-cn'都無所謂。

這樣修改之後,不管是單獨搜索繁體還是單獨搜索簡體,都能找到相同的地方。

BTW:相比其其它翻譯插件,wp-chinese-conversion功能更強大,而且速度不錯,詞彙翻譯也比較專業,它能夠根據大陸、港澳、臺灣的用詞不同而作不同的轉換。在IT用語方面,我個人採用部份大陸詞彙+部份香港詞彙混用(廣東人一般都明)。

轉載請註明: 轉載自https://www.still-c.com/
本文URL: https://www.still-c.com/archives/50.html