JS encodeURIComponent 编码两次的场景及原因分析

    xiaoxiao2021-03-25  212

    encodeURIComponent 会将URL中的中文转换为UTF-8格式的字符串,以%XY格式呈现。

    request.getParameter会调用URLDecoder.decode(url, charset)对URL进行解码。

    这里的charset可以通过request.setCharacterEncoding来设定。(通常情况下,编码设定会放置在Filter中)

    问题来了,如果request.setCharacterEncoding设置的编码格式不是UTF-8,比如是GB2312,request.getParameter的结果就会是乱码。

    解决这种情况下的乱码就需要用JS encodeURIComponent 执行两次编码。

    例:

    H766-5807-04-A01(7700-10035 24位 无软垫).dwg

    第一次编码将中文转换为UTF-8格式:H766-5807-04-A01(7700-10035 24位 无软垫).dwg

    第二次编码将%符号转换为%

    H766-5807-04-A01%EF%BC%887700-10035%2024%E4%BD%8D%20%E6%97%A0%E8%BD%AF%E5%9E%AB%EF%BC%89.dwg

    在服务器端

    调用request.getParameter时,执行URLDecoder.decode将URL中的%转换为%

    开发人员这个时候会得到utf-8格式的字符串,需要手工调用URLDecoder.decode(request.getParameter(), "UTF-8")来获得正确的内容。

    在WEB应用中,如果将编码设置为UTF-8,基本上不会遇到各种各样的编码问题

    转载请注明原文地址: https://ju.6miu.com/read-280.html

    最新回复(0)