Saturday, April 21, 2007 - Posts

潛盾機-BIG5編碼難字檢查器

網友NOROI提問有沒有將中文難字變成NCR的程式範例? 換句話說,就是程式要識別出字元是否為中文BIG5編碼所不支援的難字,若是,則轉成犇這種NCR格式。

以下是我想到的範例: (偵測難字我用的方法是試著將文字轉成BIG5編碼,如果變成?就視為難字)

   1:  string toNCR(string rawString)
   2:  {
   3:      StringBuilder sb = new StringBuilder();
   4:      Encoding big5 = Encoding.GetEncoding("big5");
   5:      foreach (char c in rawString)
   6:      {
   7:          //強迫轉碼成Big5,看會不會變成問號
   8:          string cInBig5 = big5.GetString(big5.GetBytes(new char[] {c}));
   9:          //原來不是問號,轉碼後變問號,判定為難字
  10:          if (c!='?' && cInBig5=="?")
  11:              sb.AppendFormat("&#{0};", Convert.ToInt32(c));
  12:          else
  13:              sb.Append(c);
  14:      }
  15:      return sb.ToString();
  16:  }

寫這段範例的同時,忽然想到它可以解決我一個多年來的困擾。

有時我在VS 2005/VS.NET 2003存檔時,會出現如下的警告:

有時這的確是因為我在Source Code中輸入Big5難字所引起,但更多時候卻是因為中文輸入時打錯字或選字不當引起,例如: 我就常常把"拋"輸入成"抛"。存檔時VS 2005警告檔案有難字,一臉無辜的我就知道糟了,又打錯字了,可是剛才改了幾十個地方,到底是哪一個字打錯??  明知有錯字卻放著不改,對我來說,就像明知臉上沾著飯粒還要去約會一樣讓人不自在... 可是連哪一個字打錯都不確定,即使VS 2005有強大的Find功能,還是不知從何找起?

有了下面這台潛盾機,把臉擦乾淨就不是什麼困難的事了,YA~~

Search

Go

<April 2007>
SunMonTueWedThuFriSat
25262728293031
1234567
891011121314
15161718192021
22232425262728
293012345
 
RSS
【工商服務】


BlogLook Score and Rank

Syndication