Vidím, že na mnohých miestach na internete používajú znaky ako /u4e2d/u56fd pri prenose čínštiny, ktoré sú znaky kódované v Unicode, a chcem vedieť, aký je konkrétny obsah, ale nie je to ľahké vidieť, preto chcem túto znakovú sadu dekódovať na bežné znaky. Najprv som formát kódovania previedol cez Encoding, ale zistil som, že to nefunguje a nedokázal som to vyriešiť normálne, potom som hľadal podobné dekódovacie riešenia na internete, ktoré boli možné, ale zistil som, že je to trochu komplikované na písanie, a ak som mal skupiny Unicode znakov, nemohol som ich priamo vyexportovať, potom som sa na ne pozrel a nakoniec som našiel dve metódy tried znakov: jedna je char. ConvertFromUtf32, komentár hovorí: Konvertujte zadaný bit Unicode kódu na reťazec kódovaný v UTF-16, nie je to len dekódovanie; Ďalším je spálenina. ConvertToUtf32, komentár: Táto metóda spočíva v konverzii UTF-16 kódovaných znakov na určených pozíciách v reťazci na Unicode kódové body, ha, v skutočnosti ide o konverziu bežných znakov na Unicode znakové sady.
- /// <summary>
- /// 把Unicode解码为普通文字
- /// </summary>
- /// <param name="unicodeString">要解码的Unicode字符集</param>
- /// <returns>解码后的字符串</returns>
- public static string ConvertToGB(string unicodeString)
- {
- string[] strArray = unicodeString.Split(new string[] { @"\u" }, StringSplitOptions.None);
- string result = string.Empty;
- for (int i = 0; i < strArray.Length; i++)
- {
- if (strArray[i].Trim() == "" || strArray[i].Length < 2 || strArray.Length <= 1)
- {
- result += i == 0 ? strArray[i] : @"\u" + strArray[i];
- continue;
- }
- for (int j = strArray[i].Length > 4 ? 4 : strArray[i].Length; j >= 2; j--)
- {
- try
- {
- result += char.ConvertFromUtf32(Convert.ToInt32(strArray[i].Substring(0, j), 16)) + strArray[i].Substring(j);
- break;
- }
- catch
- {
- continue;
- }
- }
- }
- return result;
- }
- /// <summary>
- /// 把汉字字符转码为Unicode字符集
- /// </summary>
- /// <param name="strGB">要转码的字符</param>
- /// <returns>转码后的字符</returns>
- public static string ConvertToUnicode(string strGB)
- {
- char[] chs = strGB.ToCharArray();
- string result = string.Empty;
- foreach (char c in chs)
- {
- result += @"\u" + char.ConvertToUtf32(c.ToString(), 0).ToString("x");
- }
- return result;
- }
Kopírovať kód
|