按月存檔:五月 2011

有關AdSense想到的

今天去月光博客看文章,發現了他提到的有些人的AdSense被關停的問題,這讓我想起我的留言板裏面王3峰博客的AdSense賬戶同樣被封。月光的文章說,無論如何,必須都要遵守AdSense的法則,甚至最好設定限定的展示網站。正好最近我正在看《AdSense Secrets第五版》,就發現連Joel Comm都說了,一定要遵守Google的條款,絕對不要作弊。從這本書來看,Joel本人是十分反對垃圾網站的。

這讓我想起了網絡上很多人在做垃圾站,靠濫用SEO牟利,雖然他們很多人都賺了不少錢(真實性有待考證,一切都是傳聞),甚至有很多「資深人士」出來講這講那,又是勸誡又是誘惑,搞得亂七八糟。但真正盈利的,基本上都是正規網站。我見過有些做垃圾網站的站長在自己的Blog隨意炫耀自己的支付單、收入截圖。但Google明確地說了,不允許將自身的收入明細展示出來,否則就是違反條款規定。如果說私底下用文字描述出來那就算了,但如此明目張膽地貼出收入截圖,這真的令人產生懷疑。他的截圖是真的還是假的?是他自己賬戶的截圖嗎?是不是從網絡上隨意搜集然後拼湊的?那麼多作弊賬號需要大量的地址,如何收款?天天到處跑嗎?

由此我覺得,那些炫耀基本上是在說謊。按照中國人做法,假如真的有那麼賺錢的事,是不會隨意公開的,尤其是如此明顯地說自己做垃圾網站賺了多少多少錢,這不等於培養自己的競爭對手嗎,誰那麼笨。因此所謂的垃圾站賺錢,不但已經成為了過去式,並且賺錢的還是極少數人。

網絡上太多的垃圾網站,我有時候找東西時會偶然碰到那麼一兩個。雖然說Google已經在努力着,並且還有舉報機制,不過要站長登入後才能舉報,這一點實在麻煩。否則的話,我真會見一個舉報一個。那些極不正常的網站弄得網絡烏煙瘴氣,連普通用戶都受影響,實在該嚴厲打擊。

好一個Spinning,無人將之翻譯成中文

在維基百科閑逛,無意中發現英文條目Article Spinning,大概看了下內容,原來就是目前全球網絡最敗壞的作風:僞原創。雖然Article Spinning跟僞原創差不多,但又有點差別。說真的,這個差別說大不大,說小不小。兩種方法均有交叉,有時候Article Spinning很像僞原創,僞原創很像Article Spinning。

Article Spinning的方法無外乎這幾種:改寫已有文章或部分內容、替換各種字詞(例如同義詞替換)、用不同的句子重新描述同一件事,甚至可以將一篇文章從A話題改成Z話題。而僞原創的方法就真是無所不用其極,除了Article Spinning的做法之外,還可以用Google翻譯或者Bing翻譯將譯來譯去,比如從英文翻譯成德文再翻譯成法文最後翻譯回英文,甚至混合搭配使用——先用Google翻譯成德文,再用Bing翻譯成法文,然後用Google翻譯成意大利文,最後用Bing翻譯回英文。也可以隨意截取各個文章的不同段落,比如第一段來自A文章,第二段來自B文章,第三段來自C文章。甚至還會將同一篇文章各個不同段落的不同句子順序隨意調換。

僞原創真是無所不用其極啊。問題是,這種文章誰看得懂,可讀性極低。這除了專門針對SEO之外就真的毫無作用。也正是因爲這類做法的存在,導致網絡上大量垃圾站橫行無忌,雖然Google有專門的對策,不過這些全加起來的話實在很浪費資源。

既然Article Spinning與僞原創還是有不同的,那麼它的中文名應該叫什麼呢?維基百科的Article Spinning條目衹有英文版,並無其它語言的版本可以參考。於是我查了下Spinning的意思,結果是「紡紗、紡絲、旋轉」,與SEO毫無關聯。再查,居然找到了SPINNING這個品牌,是一個運動自行車、運動產品之類的公司,與SEO更是相差十萬八千里。去掉ing試下,就一個單詞spin,這回找到spin單詞的詞義的其中幾個:杜撰、分拆。但總不能翻譯成「文章杜撰」,它本身就有正式的用途,這與Article Spinning的還是有很大差別;「文章分拆」?有點接近了。按照Article Spinning的做法,可以說是把文章分拆後重組、改頭換面,但依然能夠讀得懂,內容還是很順暢的。這麼一說,似乎直譯「文章編織」就有點接近,但顯然很怪。

「分拆編織」?「分拆杜撰」?「編織杜撰」?或是其他的?還是等較爲正式的中文翻譯出來好了。

兩種拼音的對比

國語(普通話)的首先是注音符號,然後是拼音,主流拼音是漢語拼音。其實無論拼音還是注音,基本內容都差不多,符號不同而已。注音稍微廣闊點,由於有ㄪ、ㄫ、ㄬ,它可以爲方言注音。不過缺點是不能爲粵語注音,因爲粵語還有-m韻母,這是注音都沒收入的。不過拼音倒是可以做到這幾點,於是粵語就有了自己的拼音方案。衹是粵語拼音方案實在太多,這裏選取已經被實用化的其中一個,它廣泛應用在粵語輸入法當中,那就是香港語言學學會粵語拼音方案,簡稱粵拼

其實真要對比起來的話會涉及到太多的東西,我想那種資料量足夠可以寫一本書了。所以衹能簡單對比一些很明顯的地方。

無論是注音還是拼音,都有一個共同點,那就是標註時用字音,讀出時可能會變音,這就是破音字。比如「水餃」,標註時注音符號ㄕㄨㄟˇ ㄐㄧㄠˇ、漢語拼音shuǐ jiǎo,但實際讀出來卻是注音符號ㄕㄨㄟˊ ㄐㄧㄠˇ、漢語拼音shuí jiǎo。很多人考試時都在這裏摔倒過,我也曾經被陷害不少。

而無論是哪一種粵語拼音,都要按照實際發音標註,並且以標準粵語爲准(但如果拼寫粵語方言時,可以標註當地方言的實際讀音)。這是由於同一個字在粵語中存在文白異讀等各種讀法。例如,「命運」,「命」要文讀,拼音「ming6」;而「攞命」,「命」要白讀,拼音「meng6」。

又如音標,其實粵語拼音是可以有注音音標的,例如廣東話拼音就是如此,但有一個麻煩的地方,粵語總共九聲六調,而國語衹有四調,因此如果採用調號的話雖然看起來規範,但用起來麻煩。比如像這樣:「北京」,廣東話拼音Bäk Gënk,粵拼bak1 ging1。更加麻煩的是,同一個入聲由於跟着的原因不同而會有所改變,比如p t k,跟長元音就會變成b d g。而國語的入聲已經完全消失,雖然不需要拼寫入聲,但就造成大量同音字,煩上加煩。

Mac、Windows還是Linux?

微軟收購Skype這一事件中,不經意地又看到很多Linux fans噴微軟,Mac fans在一旁圍觀。說實在的,個人覺得這種噴真是毫無意義。無論是哪一種OS,我都不會去敵視它(某赤化區域出產的除外),該怎樣競爭、商業該怎麼走,自然都有規則的,反正三十年河東、三十年河西。大前天Apple OS得勢,前天DOS得勢,今天Windows得勢,那麼可能明天Linux得勢,說不定後天又輪到Apple得勢、大後天Windows重新站起來。

穩定性

現時的Linux內核已經相當穩定了,但是各個發行版之間總會有一點點差異,所以穩定性各不相同,總之我的感覺就是「良莠不齊」。Windows的穩定性在Windows 7時代其實已經相當好的了,不再像Win98那樣頻繁給個「臉色」(藍屏),也不再像WinXP那樣什麼軟件在Memory讀寫出錯。至於Mac,一直以來都是封閉式系統,比微軟更加封閉,但反而是最穩定的。但這不能全部稱讚Apple,因爲現今的Mac是建立在開放式Unix(BSD)之上的,而Unix是一直以來最爲穩定的OS之一。

兼容性/相容性

對於Windows而言,基本上前一版Windows可以用的軟件在下一版都能用少數被淘汰的功能除外,比如DOS軟件在Windows NT系列就不太好用。不過由於Windows的軟件太多,誰也無法確保所有軟件在下一版Windows全都能用。Linux由於發行版太多,如果要獲得最好兼容性/相容性,必須使用源碼編譯生成軟件,如果是RPM、DEB、bin之類的如果不匹配,可能會有或多或少的問題。Mac的基本上是沒什麼大問題,但就存在PPC與Intel之間的問題。

安全性

其實安全性是個相對而言的。並不存在絕對安全的系統。Windows和Mac都是封閉式系統,誰都不知道它們的漏洞有多少個,因此衹能發現一個修復一個。Windows使用量最多,因此針對Windows的攻擊也就最多,也就被人研究得最多,於是漏洞被發現得更早。Mac用戶極少,甚至比Linux還少,但其安全性也好不到哪裏去,曾經有Hacker短短幾分鐘就能Hack掉Mac機,可以想像若其取代Windows的地位,那同樣會很危險。Linux的很多漏洞一開始就被消滅在源頭,但不保證不會有漏網之魚,加上其代碼是公開的,Hackers說不定能夠找到些蛛絲馬跡。

性能/效能

這個就真是個有個表現了,各個領域的表現都不一樣。在大型電腦、超級電腦中,更多的是使用Unix/Linux,它們更適合大型計算。而對於遊戲而言,Windows表現會更加好,除了驅動做得好之外,也是因爲Windows也爲此優化過。Mac雖然不錯,但還是差點。

目前各個系統都在各司其職,對於普通使用而言,比如隨便看下網頁、收發電郵、製作報表、文書處理、網上聊天、網站購物,都差不多。但如果要做別的呢?比如編程開發還好些,因爲有跨平台工具可用。而對於大規模計算、Server、網絡服務等,Linux的表現就優於Windows,因爲Linux可以修改源碼自行調整適應某些事情,並且它繼承Unix,Unix生來就是為大型電腦服務的。如果要玩游戱呢,基本上唯有用Windows,目前幾乎所有的大型遊戲都專爲Windows而作,除了Windows有龐大的用戶之外,還有成熟的驅動、API,Windows是花了很多年才優化過來的。若要做設計,那就要見仁見智了,有些人習慣Windows,有些人喜歡Mac,而有些工作室爲了節省成本,會把Photoshop等軟件從Windows轉移到Linux平臺去。

所以,各個系統各司其職就一切安好了,自己愛好哪個就用哪個,不必相互敵視(爲敵視而敵視、爲打鬥而打鬥,做這些毫無意義的這些東西就是共產黨常用招數,個人認爲不可泛濫)。就比如我,我喜歡Windows和Linux,不喜歡Apple,我會批評微軟、Linux、Apple,但就不會惡意去敵對。不過我就感覺有點奇怪,爲什麼可以實現Linux用Wine執行Windows軟件,但就不能開發某個工具執行Mac軟件呢?不會是Mac太封閉了吧。但封閉到這種程度的Apple做得比微軟還有錢,難怪會令Google渾身不舒服。

微軟收購Skype,是災難連連還是獲益匪淺?

幾天前微軟收購了Skype,當時我就感到似乎不太妙。Skype是全球最大的網絡電話公司,基本上以免費電話爲主(Skype軟件之間),雖然付費電話也有(Skype打給普通電話),但就收益很少。之前Google的Voice服務,一直平平淡淡,高不成低不就。微軟收購來做什麼呢,一直沒想明白。有報道說,這是爲了自家的Windows Phone,還能整合進Office商業版以及Xbox游戱機當中。但我想,這些理由實在不夠充分。

Google收購了很多大蛋糕,比如YouTube、Double Click、Blogger,被收購後各自大方光芒。微軟也收購了不少大蛋糕,但都被內部消化了,比如Virtual PC,本來是個很好的虛擬機軟件,在收購之前具備很多VMware不具有的特點功能,但被微軟收購之後,幾乎完全不能安裝Linux,到最近變成了Windows Virtual PC,徹底成爲Windows附庸、附加功能,好好的一個Virtual PC就這樣被消化了。其實Double Click也是被Google內部消化的,現在已經變成了Google AdWords/Asense,僅保留着Double Click的Domain。

由於微軟擁有Windows,這使得Virtual PC被收購之後幾乎衹可以安裝Windows系統,甚至衹能在Windows系統上使用。這一次Skype被收購,難免會對Linux、Mac版本造成不利影響。如果微軟真的敢讓Skype衹保留Windows版本,無異於毀滅Skype。

那麼如果是Google收購了Skype呢?也不見得好到哪裏去。有報道提到,2009年的時候Google Voice經理極力阻撓收購Skype,並遊説了創始人Sergey Brin,雖然另一創始人Larry Page支持收購,但最終還是取消了收購。可以想像,一旦收購,可能會受到Google Voice方面的不滿,或者融合之後有些人會悶悶不樂。對用戶而言也不一定是好事,因爲Google必定會整合Gmail.com郵箱,等於向Gmail用戶傾斜,這對其它非Gmail郵箱的用戶而言並不公平。加上現在的Google Voice效果慘淡,即使收購也可能不會對Skype產生什麼積極的影響。唯一的好處是,Google Voice將會等於Skype,而不會出現Google Voice與Skype競爭的情況。

Skype本身是一個很好的工具,不過受到世界範圍各個ISP的阻撓,其收費電話業務始終好不到哪裏。這一次收購,同樣不會改變ISP的冷遇。

又再次聽見粵語電視臺發音錯誤

近年來的的電視臺太喜歡亂發音了,頻繁出錯。其實一直都有,趁昨天才說完,今天繼續。這次的電視臺繼續是廣州的那幾個粵語電視臺,原因還是一樣,受國語影響以及受各地粵語方言區的影響。

這一次也是很少見但卻會被亂讀的,「煙囪」。「煙囪」的「囪」,粵語的確是讀作cung1。不過,這個是國語詞彙,在用粵語閲讀時是不會按字直接讀的,通常會先轉換成粵語慣用詞彙然後再以粵語語音讀出,比如「煙囪」在用粵語讀出來時,應該要使用粵語詞彙「煙通」,然後以「煙通」粵語發音讀出。

還有一個字「腌」。這一次就是受到了各地粵語使用的影響而亂混雜。「腌」在標準粵語中讀jip3,而其他方言區(比如中山)會講jim1(讀音同「閹」),當該讀音插在標準粵語的時候,一聼就會覺得很怪。

再有一個字,最近因吸毒被熱炒的高曉松,其名字中的「松」在香港媒體沒被讀錯,但在廣州媒體就被錯讀成「鬆」。這一次又是簡化字搞鬼,之前我的文章《我用傳承字(正體字)的原因之一:爲了粵語書面表達》就已經提到過這個字。

還有廣東各地地名,例如廣州市流花路,此時「花」應該讀成「化」(這是最能判斷此人是否爲廣州人的標準之一);「裏水」因受到簡化字影響而被一些人誤讀爲「里水」(lei5水);三元里的「里」應讀作lei2,而不是lei5。當然,有些就不一定了,例如順德大良,「良」在當地讀作loeng1(陰平,調值是53而不是55,聼起來相當於國語的去聲),而在廣州話中讀作loeng4(讀音同「樑」)。

廣州粵語媒體的混亂發音

廣州市作爲大陸的粵語媒體主要城市,本來應該要有很好的示範作用,其粵語節目全部採用標準粵語(廣州話)。不過最近十幾年受香港「『邪』音運動」影響(香港媒體本來也是用標準粵語語音(廣州音)的,受到這個運動影像導致發音一團混亂),再加上有大量使用非標準粵語的「皇親國戚」子女進入媒體行業,導致現在廣州很多媒體所用的粵語混亂不堪,各種粵語方言混雜在同一個電視臺,聼起來令人髮指,有時甚至連佛山媒體所用的粵語都比他們好得到。

懶音問題這裏就不提,因爲早就有大量文章。在廣州,無論是哪個電視臺,其中聼得到最多的錯音就是「撈」字。在標準粵語語音當中,「撈」字有四個讀音,分別是laau4、laau1、lou1、lou4。

  • 讀音laau4最爲常用,例如「打撈」、「捕撈」的「撈」。
  • 讀音lou1亦爲常用,例如「撈麵」、「撈埋」的「撈」。「撈埋」意爲「攪拌到一齊」。此讀音有很多同音字,比如「勞」、「盧」、「澇」、「顱」等。
  • 讀音laau1不常用,就算要用也是帶貶義的,比如「撈頭」,此時「撈」的意思是廣東人概念中的「北方人」,即除了廣東、海南島、廣西、福建、臺灣這幾個地方以外的北邊等省區的人。
  • 讀音lou4幾乎不見使用。

其中,「撈」讀laau1時與國語讀音相同,即漢語拼音lāo、注音符號ㄌㄠ。由於受國語影響,又加之各地粵語片區的讀法差異,導致經常聽到有發音不準的人將「打撈」、「捕撈」的「撈」一律讀成laau1,聽起來就真是令人覺得那個讀錯字的人是個「撈頭」。

除了「撈」之外,「澇」也是會被讀錯的字。「撈」字有兩個讀音,分別是lou4、lou6。

  • 讀音lou4最爲常用,例如「洪澇災害」的「澇」。
  • 讀音lou6幾乎不見使用。

由於各粵語片區的讀音不同,有很多發音不準的人把「澇」讀成laau4。

其他的,比如「擁堵」的「擁」,讀音是jung2。有些人不知道怎麼回事,讀成jung1,發音與國語一樣了,即漢語拼音yōng、注音符號ㄩㄥ。

還有「畢竟」的「畢」,讀音是bat1。可能受到國語影響,有人讀成了bit1(即「必」的讀音),因爲國語裏「畢」與「必」同音。

離奇的「著」與「着」

原本以爲大陸的簡化字才有多字合一的情況,比如「表」與「錶」被合並成「表」,「後」與「後」被合並成「後」。但是現在看臺灣的文章多了,就發現原來民國臺灣省教育部也在對某些字做類似的事情,目前爲止我衹發現一個,那就是「著」與「着」。

在大陸,「著」與「着」這兩個從永遠都不會被混合使用,這真是個奇跡,也算是一個正確的舉動。反而臺灣的教育部就真是令人費解,大陸的簡化字都沒合併「著」和「着」,你合併來幹嘛。我找了下相關資料,原來他們的理由是,「着」是「著」的某些意義下的分化字,因此將「着」放棄使用。這個理由倒是很像簡化字當時的理由啊,比如剛才的例子,「表」與「錶」就屬於這種情況。但人家作爲簡化字地區,並未合併「著」與「着」,可見這兩個字一旦合併會導致很多麻煩,至少不比別的合併字好到哪裏去。

我不清楚臺灣人能否正確區分「著」與「着」這兩個字,但大陸人和香港人(還有澳門人、新加坡人等等)一定能區分開來。試想下,「着火」被寫成「着火」,給人的感覺是「著作、寫下一些火」,那不是很怪異嗎。又如「著着」,雖然沒這個詞,不過偶然可以用得到,比如某作者很不耐煩地應付說:「這本書我還在着着呢!」如果同一用「著」呢?就會變成:「這本書我還在着著呢!」簡直無法理解!

即使從語音來講,這兩個字讀音都完全不同。「著」漢語拼音zhù,注音符號「ㄓㄨˋ」,粵語拼音zyu3;「着」漢語拼音zháo、zhe,注音符號「ㄓㄠˊ」、「ㄓㄜ」,粵語拼音zoek6、zyu6。

所以即使我打字時會用正體字、繁體字,但我在使用文字的時候是有原則的,並非全盤臺灣化,而是會參考香港的用法,以及大陸簡化字使用前的文字用法,堅持我自己的用字方式。很多中文字愛好者及專業人士(有臺灣及香港人)曾經在某個清華的中文字論壇倡議過,要做一份大中華的正體字表(非完全臺灣標準),並且還會將香港標準作爲參照、對照,他們的觀點我大多數都贊同,看似他們的用字程度無論比臺灣、大陸都精準,如果他們能早日完成該表,那就真是一件大好事。

更新自2013年8月:如果留意看的話,「着」字在日本漢字中就得到了保留。其實說到俗字、分化字,現時有許許多多的字都來自俗字並在平時使用中最終轉化成正字。例如「象」—「像」、「游」—「遊」、「說」—「悅」等等,不一而足。如果死守「第一正字」,不但會使日常使用變得不方便,搞不好可能會變得比簡化字更偏激(比如《第一批異體字整理表》),這會帶來何種破壞,大陸以外的正體字使用者肯定很清楚吧。

適當增加一些分化出來的俗字不是壞事(不要有事沒事都分就可以了),對於字義表達更有利。

令人煩惱的三地術語翻譯

有一個事實擺在眼前:香港、臺灣、大陸三個地區使用的術語各有不同。大陸人或者平時已經習慣大陸生活的人,如果改用正體字、繁體字的話,用電腦的時候或多或少都會遇這種麻煩問題,會發現很多術語會發生改變。同樣,香港人、台灣人也會遇到這種問題。

如果說外國人名翻譯、地區地名翻譯各有不同的話那還說得過去,大陸與臺灣的原因衆所周知,而香港則是因爲用粵語。但電腦術語翻譯就反而說不過去,而造成這種術語區別的很大程度要怪那些IT巨頭公司,首先是微軟,其次是Google。微軟的Windows和DOS原本衹有歐洲文字版(英文、法文、德文、西班牙文等等),後來爲了中國市場就製作了中文版。令人困惑的是,繁體版和簡體版的術語居然差別巨大。在此之前,很多Windows專用名詞是無對應的中文翻譯,亦就是說,這部分的中文術語完全是微軟自行翻譯的。而且就算是原本已經有了對應的中文翻譯,微軟也可以靠自身的壟斷地位強行改變固有翻譯,就好像大陸的GB18030不得不全盤接受GBK一樣。

我看了下大陸與港臺對於C:、D:、這樣的分區符號的描述,大陸的描述是:

有兩個盤,分別是C盤和D盤

或者

有兩個盤,分別是C:和D:

專業點的微軟認證的專家或工程師則會這麼說:

有兩個分區,分別是C:和D:

而港臺則會是:

有兩個分區,分別是C:和D:

跟專業工程師的一致。

還有Memory,大陸翻譯成「內存」,港臺叫做「記憶體」,於是大陸太多的人連Memory和Hard Disk都分不清——他們凴感覺知道「內存」是電腦內部的存儲器,但就以爲這存儲器是Hard Disk。

然後是Google。Google公司衹不過成立了十幾年,它自己的專用術語居然就已經很多不同,很顯然,本來可以用同一種名稱的。比如Search Engine,大陸版叫做「搜索引擎」,臺灣版叫做「搜尋引擎」,同一個意思用了兩個不同的同義詞。再拿AdSense廣告格式爲例,英文版的Leaderboard,繁體版叫做「首頁廣告看板」,簡體版叫做「頁首橫幅」。這些新術語本來可以用同一個翻譯的,但總是要不一樣,這累死人了吧。

接觸得越多,就覺得越煩。

還有一些翻譯實在令人更煩,三個地方都不同的。比如Blog,大陸叫做「博客」,香港叫做「網誌」,臺灣叫做「部落格」。如果單就這個Blog來講,個人覺得「網誌」這一詞應該比較好,屬於意譯,另外那兩個完全就是音譯。不知道這是跟微軟有關還是Google有關,或是別的公司弄出來的。

位於廣州嘅石化工廠(黃埔廠區)又起火

半年前我曾經喺《It's done. Game's over.》「預測」過,石化可能又會起火。點知真係畀我講中,尋日中石化又發生爆炸,兼且造成有3名途人受傷,其中有1人重傷。

依間石油吸血公司真係無陰功囉,佢聯同中石油一齊漲價,10年來有升無跌,然之後大肆揮霍,公司內部有人貪污一概象徵性從輕發落。今次起火本來已經好鬼抵死啦,加埋上一次火燭,個個都暗中叫好,點知今次重剌着埋無辜嘅路人,睇幾時兩間油老鼠公司畀人格硬執笠、將啲錢全部沒收,再將啲油價壓翻落來。

將人哋當水魚噉撳,遲早畀人撳返轉頭,而且係一撳就大出血嗰種。