Python 處理帶有 \u 的字符串操作
最近遇到一個頭疼的問題,用socket接收到一個字符串
格式如下:
{“trade_status”: {“desc”: “\u30106\u3011 – \u8d22\u52a1\u7ed3\u7b97\u5df2\u5b8c\u6210 “}}/end/
其中含有一段含有\u的編碼字串,怎麼將其轉化為漢字。
decode().encode(‘utf-8′) 不行,decode、encode半天搞不定,後來偶然發現,在decode時可以選則unicode-escape
代碼如下:
# -*- coding: utf-8 -*- import socket if __name__ == '__main__': sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM) sock.connect(('192.168.6.63', 10001)) sock.send('[{"action": "trade_status"}]') rec = sock.recv(1024) print rec print rec.decode('unicode-escape').encode('utf-8') print rec.decode('raw_unicode-escape').encode('utf-8') sock.close()
輸出結果:
{"trade_status": {"desc": "\u30101\u3011 - \u4ea4\u6613\u4e2d "}}/**end**/ {"trade_status": {"desc": "【1】 - 交易中 "}}/**end**/ {"trade_status": {"desc": "【1】 - 交易中 "}}/**end**/
補充:Python3解析【\u】和【\\u】字符
【\u】字符示例
a = '\u5317\u4eac\u5e02' print(a)
北京市
b = '\\u5317\\u4eac\\u5e02' print(b)
\u5317\u4eac\u5e02
json.loads解析
import json a = '\\u5317\\u4eac\\u5e02' b = '"%s"' % a c = json.loads(b) print(a, b, c, sep='\n')
\u5317\u4eac\u5e02
“\u5317\u4eac\u5e02”
北京市
讀取文件中\u字符
demjson
from demjson import decode # pip install demjson
以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。如有錯誤或未考慮完全的地方,望不吝賜教。
推薦閱讀:
- Python對象與json數據的轉換問題實例詳解
- Python 基於TCP 傳輸協議的網絡通信實現方法
- Python有關Unicode UTF-8 GBK編碼問題詳解
- Python之string編碼問題
- Python實現UDP與TCP通信的示例詳解