Category: 中文編碼

前幾天同事討論到要將地址資料中的阿拉伯數字都轉成中文大寫(一二三四...),我想起了前些時候看到的Microsoft Visual Studio International Feature Pack 2.0就內建了數字轉中文大寫的功能,試作如下。 程式主要是用Regex去比對出數字(\d+)的...

很久很久以前,我介紹過CSV與Excel的整合應用,當時同事Daniel補充了一點"Excel只接受ANSI/BIG5編碼的CSV,若存成Unicode,Excel就無法正確顯示"。恰巧最近在河道上也看到有人在討論匯出Excel檔時的中文編碼問題,就決定把我後來研究的心得再整...

BIG5字數不足是正體中文環境存在已久的問題,在Unicode尚未普及前,出現過許多各顯神通的解決方案,自行造字、廠商推出的擴充字集(例如: Microsoft CP950、Big5_eten)、BIG5+、BIG5E、CNS11643。(註: 想進一步了解的話有兩篇不錯的文章1、2) 近年來Un...

同事遇到一個問題,User抱怨SSIS由ORACLE轉資料到SQL後,所有的中文字都變成"蕞蕞蕞蕞..."了。 (這個字唸"最",不唸"叢"! 慣用倉頡的我本來是不會去研究讀音的,不過看到個性豪邁的User小姐在信中寫道"不會唸厚,拎北查好了,這二個字叫『最最』不叫『叢叢』…",我想我這輩子都不...

網友Eric問到關於NCR轉換的事,查了一下,發現我過去有介紹過toNCR()的做法,倒沒提到fromNCR(),這裡補上,給有需要的人參考。 程式只有短短幾行,主要靠Regex強大的比對功能解決大部份的難題。一口氣將字串中所有的&#nnnn;抓出來,nnnn轉成整數再轉成char,接著將字...

悶! 抓了好久! 同事設計好頁面樣式,給了我一個HTML跟CSS,讓我套用到ASP.NET網頁上。我在ASPX裡用<link href="site.css" type="text/css" rel="stylesheet" />套用樣式,卻怎麼都無法生效! 最詭異的是,CSS無法生效的...

上回發表中文編碼解析工具 Ver 1.2後,網友Esther建議再加上GBK-Q, GBK-B的編碼解析。 說實在話,我沒聽過這兩個名詞,但Google了一下馬上晃然大悟,原來指的是我們常在Mail Subject或收件寄件人資料上看見的那種編碼。格式像這樣:=?x-gbk?q?=B5=C4=B7=...

有網友建議我的中文編碼解析工具應該要加上UTF-8的URL Encoding,讓我驚覺自己的孤陋寡聞。 當然,背後是有故事的... 前些時候,朋友跟我在討論在T-SQL中實作UrlEncode的方法。UDF寫出來了,卻發現不能用! 最後才搞清楚原來提供Web Interface的廠商,採用的是UTF...