|
|
Opslået på 07/09/2015 10.57.18
|
|
|

Jeg så, at mange steder på internettet bruger tegn som /u4e2d/u56fd, når man transmitterer kinesisk, som er Unicode-kodede tegn, og jeg vil gerne vide, hvad det specifikke indhold er, men det er ikke let at se, så jeg vil gerne afkode dette tegnsæt til normale tegn. Først konverterede jeg kodningsformatet gennem Encoding, og fandt ud af, at det ikke virkede, og jeg kunne ikke løse det normalt, og så søgte jeg efter lignende dekodningsløsninger på internettet, som var mulige, men jeg fandt ud af, at det var lidt besværligt at skrive, og hvis jeg havde batches af Unicode-tegn, kunne jeg ikke outputte dem direkte, og så kiggede jeg og kiggede på dem, og til sidst fandt jeg to metoder til char-klasser: den ene er char. ConvertFromUtf32, siger kommentaren: Konverter den specificerede Unicode-kodebit til en UTF-16-kodet streng, er det ikke bare dekodning; En anden er char. ConvertToUtf32, kommentar: Denne metode er at konvertere UTF-16-kodede tegn på bestemte positioner i strengen til Unicode-kodepunkter, altså er det faktisk for at konvertere almindelige tegn til Unicode-tegnsæt.
- /// <summary>
- /// 把Unicode解码为普通文字
- /// </summary>
- /// <param name="unicodeString">要解码的Unicode字符集</param>
- /// <returns>解码后的字符串</returns>
- public static string ConvertToGB(string unicodeString)
- {
- string[] strArray = unicodeString.Split(new string[] { @"\u" }, StringSplitOptions.None);
- string result = string.Empty;
- for (int i = 0; i < strArray.Length; i++)
- {
- if (strArray[i].Trim() == "" || strArray[i].Length < 2 || strArray.Length <= 1)
- {
- result += i == 0 ? strArray[i] : @"\u" + strArray[i];
- continue;
- }
- for (int j = strArray[i].Length > 4 ? 4 : strArray[i].Length; j >= 2; j--)
- {
- try
- {
- result += char.ConvertFromUtf32(Convert.ToInt32(strArray[i].Substring(0, j), 16)) + strArray[i].Substring(j);
- break;
- }
- catch
- {
- continue;
- }
- }
- }
- return result;
- }
- /// <summary>
- /// 把汉字字符转码为Unicode字符集
- /// </summary>
- /// <param name="strGB">要转码的字符</param>
- /// <returns>转码后的字符</returns>
- public static string ConvertToUnicode(string strGB)
- {
- char[] chs = strGB.ToCharArray();
- string result = string.Empty;
- foreach (char c in chs)
- {
- result += @"\u" + char.ConvertToUtf32(c.ToString(), 0).ToString("x");
- }
- return result;
- }
Kopier kode
|
Tidligere:JS, kinesiske tegn og Unicode-kodning udveksles, Unicode-kryptering, Unicode-dekrypteringNæste:Hvordan laver jeg portmapping på en Cisco-router?
|