最近遇到一个头疼的问题,用socket接收到一个字符串,格式如下:
{“trade_status”: {“desc”: “\u30106\u3011 - \u8d22\u52a1\u7ed3\u7b97\u5df2\u5b8c\u6210 “}}/end/
其中含有一段含有\u的编码字串,怎么将其转化为汉字。
decode().encode(‘utf-8’) 不行,decode、encode半天搞不定,后来偶然发现,在decode时可以选则unicode-escape,代码如下:
# -*- coding: utf-8 -*- import socket if __name__ == '__main__': sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM) sock.connect(('192.168.6.63', 10001)) sock.send('[{"action": "trade_status"}]') rec = sock.recv(1024) print rec print rec.decode('unicode-escape').encode('utf-8') print rec.decode('raw_unicode-escape').encode('utf-8') sock.close()输出结果:
{"trade_status": {"desc": "\u30101\u3011 - \u4ea4\u6613\u4e2d "}}/**end**/ {"trade_status": {"desc": "【1】 - 交易中 "}}/**end**/ {"trade_status": {"desc": "【1】 - 交易中 "}}/**end**/