Python 處理帶有 \u 的字符串操作

Posted on 2021-03-13 by WalkonNet

最近遇到一個頭疼的問題，用socket接收到一個字符串

格式如下：

{“trade_status”: {“desc”: “\u30106\u3011 – \u8d22\u52a1\u7ed3\u7b97\u5df2\u5b8c\u6210 “}}/end/

其中含有一段含有\u的編碼字串，怎麼將其轉化為漢字。

decode().encode(‘utf-8′) 不行，decode、encode半天搞不定，後來偶然發現，在decode時可以選則unicode-escape

代碼如下：

# -*- coding: utf-8 -*-
import socket
if __name__ == '__main__':
 sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
 sock.connect(('192.168.6.63', 10001))
 sock.send('[{"action": "trade_status"}]')
 rec = sock.recv(1024)
 print rec
 print rec.decode('unicode-escape').encode('utf-8')
 print rec.decode('raw_unicode-escape').encode('utf-8')
 sock.close()

輸出結果：

{"trade_status": {"desc": "\u30101\u3011 - \u4ea4\u6613\u4e2d "}}/**end**/
{"trade_status": {"desc": "【1】 - 交易中 "}}/**end**/
{"trade_status": {"desc": "【1】 - 交易中 "}}/**end**/

補充：Python3解析【\u】和【\\u】字符

【\u】字符示例

a = '\u5317\u4eac\u5e02'
print(a)

北京市

b = '\\u5317\\u4eac\\u5e02'
print(b)

\u5317\u4eac\u5e02

json.loads解析

import json
a = '\\u5317\\u4eac\\u5e02'
b = '"%s"' % a
c = json.loads(b)
print(a, b, c, sep='\n')

\u5317\u4eac\u5e02

“\u5317\u4eac\u5e02”

北京市

讀取文件中\u字符

demjson

from demjson import decode # pip install demjson

以上為個人經驗，希望能給大傢一個參考，也希望大傢多多支持WalkonNet。如有錯誤或未考慮完全的地方，望不吝賜教。

Python 處理帶有 \u 的字符串操作

格式如下：

代碼如下：

輸出結果：

【\u】字符示例

json.loads解析

讀取文件中\u字符

demjson

推薦閱讀：

發佈留言取消回覆

近期文章

格式如下：

代碼如下：

輸出結果：

【\u】字符示例

json.loads解析

讀取文件中\u字符

demjson

推薦閱讀：

發佈留言 取消回覆

近期文章

標籤

發佈留言取消回覆