JS encodeURIComponent 编码两次的场景及原因分析

xiaoxiao2021-03-25 358

encodeURIComponent 会将URL中的中文转换为UTF-8格式的字符串，以%XY格式呈现。

request.getParameter会调用URLDecoder.decode(url, charset)对URL进行解码。

这里的charset可以通过request.setCharacterEncoding来设定。（通常情况下，编码设定会放置在Filter中）

问题来了，如果request.setCharacterEncoding设置的编码格式不是UTF-8，比如是GB2312，request.getParameter的结果就会是乱码。

解决这种情况下的乱码就需要用JS encodeURIComponent 执行两次编码。

例：

H766-5807-04-A01（7700-10035 24位无软垫）.dwg

第一次编码将中文转换为UTF-8格式：H766-5807-04-A01（7700-10035 24位无软垫）.dwg

第二次编码将%符号转换为%

H766-5807-04-A01%EF%BC%887700-10035%2024%E4%BD%8D%20%E6%97%A0%E8%BD%AF%E5%9E%AB%EF%BC%89.dwg

在服务器端

调用request.getParameter时，执行URLDecoder.decode将URL中的%转换为%

开发人员这个时候会得到utf-8格式的字符串，需要手工调用URLDecoder.decode(request.getParameter(), "UTF-8"）来获得正确的内容。

在WEB应用中，如果将编码设置为UTF-8,基本上不会遇到各种各样的编码问题

转载请注明原文地址: https://ju.6miu.com/read-280.html

技术

最新回复(0)