人亦已歌 发表于 2020-10-1 11:07:06

POST发布编码解码问题汇总之编码分析技巧

通常,中文网站的编码只需要测试这4中,“gbk、utf8、gb2312转utf8”,部分是\u9a8c是这样的,需要用编码“usc2”;
如果还是不行,那查看一下协议头中是否有编码设置,如果有也设置一下。

常用编码1: gbk                如:%C9%F1%C6%F7 或 中文 (包含gb2312)

常用编码2: utf8               如:%E7%A5%9E%E5%99%A8

常用编码3:gb2312转utf8如:绁炲櫒,鎺ㄥ?瀛愭墜娉昦sa (这是不常见字或符号,在某些抓包工具里面,可能会显示乱码,只需要复制到任意的文本编辑器中,即可显示为文本,如下图。转为这种编码后,文本编辑器中,显示为“乱码”,所以很多时候,是不能转回去的,因为文本编辑器丢失了部分数据。通常,我们提交给服务器的时候,才需要转为utf8,平时乱码显示出来我们也没任何用处。)

[比如下面这个截图,很明显编码是gb2312转utf8]

复制到文本编辑器后显示为:


另外还有以下不常见的编码方式:
big5               如:繁體臺灣論壇 (繁体台湾论坛)
utf8_25          如:%25E7%25A5%259E%25E5%2599%25A8
url_gbk          如:http%3A%2F%2F
url_utf8         如:http%3A%2F%2F

[如果以上几个编码发布后,文章依旧乱码,那么可以考虑不设置编码,如 帝国gbk版就不需要设置编码。]

usc2         
例1:%u9A8C%u8BC1%u7801%u9519%u8BEF%2C%u4EE3%u7801%3A%28abc123%29
(转为%u开头,转换 { }[ ]( ):,"等括号)

例2:\u9A8C\u8BC1\u7801\u9519\u8BEF%2C\u4EE3\u7801%3A%28abc123%29
(转为\u开头,转换 { }[ ]( ) :," 等括号)

usc2_c 或usc2_5C
如:%5C9A8C%5C8BC1%5C7801%5C9519%5C8BEF%2C%5C4EE3%5C7801%3A%28abc123%29
(转为%5C开头,转换 { }[ ]( ) :," 等括号)


另一种特殊情况编码问题就是协议头里面含有编码的,那么协议头也得加上,否则编码就会不正确。






thxz 发表于 2021-10-5 07:00:45

不错不错,楼主您辛苦了。。。

木柴。 发表于 2021-11-23 07:04:37

楼主发贴辛苦了,谢谢楼主分享!

钟馗 发表于 2021-12-28 17:00:05

路过,学习下

E_Messenger 发表于 2022-1-17 17:00:48

支持一下:lol

laiwu1989 发表于 2022-2-25 17:01:59

找到好贴不容易,我顶你了,谢了

0 发表于 2022-3-27 07:00:03

页: [1]
查看完整版本: POST发布编码解码问题汇总之编码分析技巧