POST发布编码解码问题汇总之编码分析技巧
通常,中文网站的编码只需要测试这4中,“gbk、utf8、gb2312转utf8”,部分是\u9a8c是这样的,需要用编码“usc2”;如果还是不行,那查看一下协议头中是否有编码设置,如果有也设置一下。
常用编码1: gbk 如:%C9%F1%C6%F7 或 中文 (包含gb2312)
常用编码2: utf8 如:%E7%A5%9E%E5%99%A8
常用编码3:gb2312转utf8如:绁炲櫒,鎺ㄥ?瀛愭墜娉昦sa (这是不常见字或符号,在某些抓包工具里面,可能会显示乱码,只需要复制到任意的文本编辑器中,即可显示为文本,如下图。转为这种编码后,文本编辑器中,显示为“乱码”,所以很多时候,是不能转回去的,因为文本编辑器丢失了部分数据。通常,我们提交给服务器的时候,才需要转为utf8,平时乱码显示出来我们也没任何用处。)
[比如下面这个截图,很明显编码是gb2312转utf8]
复制到文本编辑器后显示为:
另外还有以下不常见的编码方式:
big5 如:繁體臺灣論壇 (繁体台湾论坛)
utf8_25 如:%25E7%25A5%259E%25E5%2599%25A8
url_gbk 如:http%3A%2F%2F
url_utf8 如:http%3A%2F%2F
[如果以上几个编码发布后,文章依旧乱码,那么可以考虑不设置编码,如 帝国gbk版就不需要设置编码。]
usc2
例1:%u9A8C%u8BC1%u7801%u9519%u8BEF%2C%u4EE3%u7801%3A%28abc123%29
(转为%u开头,转换 { }[ ]( ):,"等括号)
例2:\u9A8C\u8BC1\u7801\u9519\u8BEF%2C\u4EE3\u7801%3A%28abc123%29
(转为\u开头,转换 { }[ ]( ) :," 等括号)
usc2_c 或usc2_5C
如:%5C9A8C%5C8BC1%5C7801%5C9519%5C8BEF%2C%5C4EE3%5C7801%3A%28abc123%29
(转为%5C开头,转换 { }[ ]( ) :," 等括号)
另一种特殊情况编码问题就是协议头里面含有编码的,那么协议头也得加上,否则编码就会不正确。
不错不错,楼主您辛苦了。。。 楼主发贴辛苦了,谢谢楼主分享! 路过,学习下 支持一下:lol 找到好贴不容易,我顶你了,谢了
页:
[1]