首先了解全形半形的關係:
1.半形字元是從33開始到126結束
2.與半形字元對應的全形字符是從65281開始到65374結束
3.其中半形的空格是32.對應的全形空格是12288
半形和全形的關係很明顯,除空格外的字元偏移量是65248(65281-33 = 65248)
// 第一種轉換方式:
/*** 全形字串轉換半形字串
* * @param fullwidthstr
* 非空的全形字串
* @return 半形字串
*/private static string fullwidth2halfwidth(string fullwidthstr)
char chararray = fullwidthstr.tochararray();
//對全形字符轉換的char陣列遍歷
for (int i = 0; i < chararray.length; ++i) else if (charintvalue == 12288)
}return new string(chararray);
}// 第二種轉換方式
/*** 半形轉全形
* @param input string.
* @return 全形字串.
*/public static string tosbc(string input) else if (c[i] < '\177')
}return new string(c);
}/**
* 全形轉半形
* @param input string.
* @return 半形字串
*/public static string todbc(string input) else if (c[i] > '\uff00' && c[i] < '\uff5f')
}string returnstring = new string(c);
return returnstring;
}
半形全形相互轉換
全形空格為12288,半形空格為32 其他字元半形 33 126 與全形 65281 65374 的對應關係是 均相差65248 code 全形空格為12288,半形空格為32 其他字元半形 33 126 與全形 65281 65374 的對應關係是 均相差65248 半形轉換為全形函式 funct...
半形與全形的相互轉換
1 2 轉全形的函式 sbc case 3 4 任意字串 5 全形字串 6 7 全形空格為12288,半形空格為32 8 其他字元半形 33 126 與全形 65281 65374 的對應關係是 均相差65248 9 10public static string tosbc string input...
python實現全形半形的相互轉換
緣起 在自然語言處理過程中,全形 半形的的不一致會導致資訊抽取不一致,因此需要統一。轉換說明 全形半形轉換說明 有規律 不含空格 全形字符unicode編碼從65281 65374 十六進製制 0xff01 0xff5e 半形字元unicode編碼從33 126 十六進製制 0x21 0x7e 特例...