Vidim, da veliko mest na internetu uporablja znake, kot so /u4e2d/u56fd pri prenosu kitajščine, ki so znaki kodirani v Unicode, in želim vedeti, kakšna je točno vsebina, vendar ni lahko videti, zato želim ta nabor znakov dekodirati v običajne znake. Sprva sem format kodiranja pretvoril preko kodiranja, a ugotovil, da ne deluje in ga nisem mogel rešiti na normalen način, nato pa sem na internetu iskal podobne rešitve za dekodiranje, ki so bile izvedljive, vendar sem ugotovil, da je pisanje nekoliko težavno, in če sem imel serije Unicode znakov, jih nisem mogel neposredno izpisati, nato sem jih pogledal in pogledal ter končno našel dve metodi razredov likov: ena je char. ConvertFromUtf32, komentar pravi: Pretvorite določen bit Unicode kode v UTF-16 kodiran niz, ali ni to le dekodiranje; Druga je ožganost. ConvertToUtf32, komentar: Ta metoda je pretvorba UTF-16 kodiranih znakov na določenih mestih v nizu v Unicode kodne točke, ha, pravzaprav gre za pretvorbo navadnih znakov v Unicode nabore znakov.
- /// <summary>
- /// 把Unicode解码为普通文字
- /// </summary>
- /// <param name="unicodeString">要解码的Unicode字符集</param>
- /// <returns>解码后的字符串</returns>
- public static string ConvertToGB(string unicodeString)
- {
- string[] strArray = unicodeString.Split(new string[] { @"\u" }, StringSplitOptions.None);
- string result = string.Empty;
- for (int i = 0; i < strArray.Length; i++)
- {
- if (strArray[i].Trim() == "" || strArray[i].Length < 2 || strArray.Length <= 1)
- {
- result += i == 0 ? strArray[i] : @"\u" + strArray[i];
- continue;
- }
- for (int j = strArray[i].Length > 4 ? 4 : strArray[i].Length; j >= 2; j--)
- {
- try
- {
- result += char.ConvertFromUtf32(Convert.ToInt32(strArray[i].Substring(0, j), 16)) + strArray[i].Substring(j);
- break;
- }
- catch
- {
- continue;
- }
- }
- }
- return result;
- }
- /// <summary>
- /// 把汉字字符转码为Unicode字符集
- /// </summary>
- /// <param name="strGB">要转码的字符</param>
- /// <returns>转码后的字符</returns>
- public static string ConvertToUnicode(string strGB)
- {
- char[] chs = strGB.ToCharArray();
- string result = string.Empty;
- foreach (char c in chs)
- {
- result += @"\u" + char.ConvertToUtf32(c.ToString(), 0).ToString("x");
- }
- return result;
- }
Kopiraj kodo
|