Esta mañana un compañero me hizo una pregunta: dije que los parámetros recibidos estaban distorsionados, que me ayudara a resolverlo.
La plataforma de la que es responsable mi compañero está construida Ext.js framework, y el archivo de configuración web.config está configurado con la codificación global "GB2312":
<globalization requestEncoding="gb2312" responseEncoding="gb2312" fileEncoding="gb2312" culture="zh-CN"/>
Cuando el frontend envía el "texto chino", recibe caracteres distorsionados con Request.QueryString["xxx"].
No importa cómo decodifices con System.Web.HttpUtility.UrlDecode("xxx", "encoding type"), no funciona.
Descripción del principio: 1: Lo primero que hay que determinar es que cuando se envían los parámetros de URL del cliente, Ext.js los codificará antes de enviarlos, y la codificación del cliente es por defecto UTF-8
2: Entonces, ¿por qué se distorsiona al recibir parámetros con Request.QueryString["xxx"]?
Invertimos la compilación paso a paso, 2.1: Mira el código de la propiedad QueryString:
- Code highlighting produced by Actipro CodeHighlighter (freeware)http://www.CodeHighlighter.com/-->public NameValueCollection QueryString
- {
- get
- {
- if (this._queryString == null)
- {
- this._queryString = new HttpValueCollection();
- if (this._wr != null)
- {
- this.FillInQueryStringCollection();//重点代码切入点
- }
- this._queryString.MakeReadOnly();
- }
- if (this._flags[1])
- {
- this._flags.Clear(1);
- ValidateNameValueCollection(this._queryString, "Request.QueryString");
- }
- return this._queryString;
- }
- }
Copiar código
2.2: Cortar en el método FillInQueryStringCollection()
- Code highlighting produced by Actipro CodeHighlighter (freeware)http://www.CodeHighlighter.com/-->private void FillInQueryStringCollection()
- {
- byte[] queryStringBytes = this.QueryStringBytes;
- if (queryStringBytes != null)
- {
- if (queryStringBytes.Length != 0)
- {
- this._queryString.FillFromEncodedBytes(queryStringBytes, this.QueryStringEncoding);
- }
- }//上面是对流字节的处理,即文件上传之类的。
- else if (!string.IsNullOrEmpty(this.QueryStringText))
- {
- //下面这句是对普通文件提交的处理:FillFromString是个切入点,编码切入点是:this.QueryStringEncoding
- this._queryString.FillFromString(this.QueryStringText, true, this.QueryStringEncoding);
-
- }
- }
Copiar código
2.3: Corte: QueryStringEncoding
- Code highlighting produced by Actipro CodeHighlighter (freeware)http://www.CodeHighlighter.com/-->internal Encoding QueryStringEncoding
- {
- get
- {
- Encoding contentEncoding = this.ContentEncoding;
- if (!contentEncoding.Equals(Encoding.Unicode))
- {
- return contentEncoding;
- }
- return Encoding.UTF8;
- }
- }
- //点击进入this.ContentEncoding则为:
- public Encoding ContentEncoding
- {
- get
- {
- if (!this._flags[0x20] || (this._encoding == null))
- {
- this._encoding = this.GetEncodingFromHeaders();
- if (this._encoding == null)
- {
- GlobalizationSection globalization = RuntimeConfig.GetLKGConfig(this._context).Globalization;
- this._encoding = globalization.RequestEncoding;
- }
- this._flags.Set(0x20);
- }
- return this._encoding;
- }
- set
- {
- this._encoding = value;
- this._flags.Set(0x20);
- }
- }
Copiar códigoSegún el código QueryStringEncoding, el sistema utiliza por defecto el método de codificación del nodo de configuración de globalización, y si no, el método por defecto es la codificación UTF-8 2.4: Cortar en FillFromString (cadenas s, bool urlencoded, codificación de codificación)
- 代码有点长,就折叠起来了
- Code highlighting produced by Actipro CodeHighlighter (freeware)http://www.CodeHighlighter.com/-->internal void FillFromString(string s, bool urlencoded, Encoding encoding)
- {
- int num = (s != null) ? s.Length : 0;
- for (int i = 0; i < num; i++)
- {
- int startIndex = i;
- int num4 = -1;
- while (i < num)
- {
- char ch = s[i];
- if (ch == '=')
- {
- if (num4 < 0)
- {
- num4 = i;
- }
- }
- else if (ch == '&')
- {
- break;
- }
- i++;
- }
- string str = null;
- string str2 = null;
- if (num4 >= 0)
- {
- str = s.Substring(startIndex, num4 - startIndex);
- str2 = s.Substring(num4 + 1, (i - num4) - 1);
- }
- else
- {
- str2 = s.Substring(startIndex, i - startIndex);
- }
- if (urlencoded)//外面的传值默认是true,所以会执行以下语句
- {
- base.Add(HttpUtility.UrlDecode(str, encoding), HttpUtility.UrlDecode(str2, encoding));
- }
- else
- {
- base.Add(str, str2);
- }
- if ((i == (num - 1)) && (s[i] == '&'))
- {
- base.Add(null, string.Empty);
- }
- }
- }
Copiar códigoA partir de este punto vemos que todas las entradas de parámetros se llaman una vez: HttpUtility.UrlDecode(str2, codificación);
Cuando el js del cliente envía chino al servidor en codificación utf-8, al recibirlo con Request.QueryString, primero lo decodifica una vez con gb2312 configurado por globalización, resultando en caracteres distorsionados.
1: El método de codificación JS es URT-8
2: El lado servidor ha configurado el predeterminado en GB2312
3: Request.QueryString llamará por defecto a HttpUtility.UrlDecode para decodificar los parámetros recibidos mediante la codificación de configuración del sistema.
1: El sistema selecciona la codificación predeterminada en el siguiente orden: cabecera de solicitud http - nodo de configuración >globalización - UTF-8 por defecto
2: Al introducir la URL directamente en chino, diferentes navegadores pueden manejarla de forma distinta, por ejemplo: IE no codifica y se envía directamente, Firefox envía la URL después de la codificación GB2312.
3: Para "caracteres chinos" no codificados, tras usar la llamada interna Request.QueryString HttpUtility.UrlDecode, por gb2312->utf-8,
Si no se encuentra el carácter chino, se convertirá por defecto en "%ufffd", resultando en caracteres distorsionados irreversibles.
4: El camino hacia la resolución Conociendo el principio, hay muchas formas de solucionarlo: 1: La unificación global es la codificación UTF-8, que ahorra problemas y preocupaciones.
2: Cuando GB2312 está especificado globalmente, la URL es china y JS debe codificarse, como ext.js framework.
De este modo, solo puedes manejarlo de forma especial, especificando la codificación y decodificación en el lado del servidor. Porque el sistema por defecto llama a HttpUtility.UrlDecode("xxx", la codificación de la configuración del sistema) una vez, Así que llamas de nuevo a HttpUtility.UrlEncode("xxx", la codificación configurada por el sistema) para volver al parámetro original de codificación urt-8
Luego usa HttpUtility.UrlDecode("xxx", utf-8) para decodificarlo. cadena AAA = solicitud. Request.QueryString["admin"]; Propietario cadena a1 = HttpUtility.UrlEncode(aaa, System.Text.Encoding.GetEncoding("GB2312")); cadena a2 = HttpUtility.UrlDecode(a1,System.Text.Encoding.UTF8);
|