Láttam, hogy az interneten sok helyen olyan karaktereket használnak, mint például a /u4e2d/u56fd kínai nyelv továbbításakor, amelyek Unicode kódolt karakterek, és szeretném tudni, mi a konkrét tartalom, de nem könnyű látni, ezért szeretném ezt a karakterkészletet normál karakterekre dekódolni. Eleinte átkonvertáltam a kódolási formátumot kódoláson keresztül, és rájöttem, hogy nem működik, és nem tudtam normálisan megoldani, majd kerestem hasonló dekódoló megoldásokat az interneten, amelyek megvalósíthatók voltak, de kicsit problémás volt megírni, és ha Unicode karakterek adag voltak, nem tudtam közvetlenül kiadni őket, aztán utánanéztem és utánanéztem, végül két karakterosztályos módszert találtam: az egyik a char. ConvertFromUtf32, a hozzászólás így szól: Konvertáld a megadott Unicode kódbitet egy UTF-16 kódolt stringre, ez nem csak dekódolás; Egy másik a char. ConvertToUtf32, megjegyzés: Ez a módszer az UTF-16 kódolt karaktereket a stringben meghatározott helyeken Unicode kódpontokká alakítja, haha, valójában a hétköznapi karaktereket Unicode karakterkészletté alakítjuk.
- /// <summary>
- /// 把Unicode解码为普通文字
- /// </summary>
- /// <param name="unicodeString">要解码的Unicode字符集</param>
- /// <returns>解码后的字符串</returns>
- public static string ConvertToGB(string unicodeString)
- {
- string[] strArray = unicodeString.Split(new string[] { @"\u" }, StringSplitOptions.None);
- string result = string.Empty;
- for (int i = 0; i < strArray.Length; i++)
- {
- if (strArray[i].Trim() == "" || strArray[i].Length < 2 || strArray.Length <= 1)
- {
- result += i == 0 ? strArray[i] : @"\u" + strArray[i];
- continue;
- }
- for (int j = strArray[i].Length > 4 ? 4 : strArray[i].Length; j >= 2; j--)
- {
- try
- {
- result += char.ConvertFromUtf32(Convert.ToInt32(strArray[i].Substring(0, j), 16)) + strArray[i].Substring(j);
- break;
- }
- catch
- {
- continue;
- }
- }
- }
- return result;
- }
- /// <summary>
- /// 把汉字字符转码为Unicode字符集
- /// </summary>
- /// <param name="strGB">要转码的字符</param>
- /// <returns>转码后的字符</returns>
- public static string ConvertToUnicode(string strGB)
- {
- char[] chs = strGB.ToCharArray();
- string result = string.Empty;
- foreach (char c in chs)
- {
- result += @"\u" + char.ConvertToUtf32(c.ToString(), 0).ToString("x");
- }
- return result;
- }
Kód másolása
|