# @version:python2.7
# usc2轉ansi
乙個帶有中文字串s,json.loads (s)
之後
對其進行列印,中文被轉換成了形如\u5e73\u5b9a
的形式。
使用編碼工具中的編碼助手對其進行解碼得知,從\u5e73\u5b9a
到中文'平定'
的轉換為usc2轉ansi。
既然知道了兩種字元的編碼格式,剩下的就只剩如何解決了。
這兒有乙個類似的問題,
有乙個字串, usc2內容是:一樓v2ex@cute給出的答案是:%u5728%u5e94%u7b54%u4e4b%u524d%u53d1%u9001%u8baf%u606f%u6210%u529f%uff0c%u8bf7%u7b49%u5f85%u7b54%u590d…
對應的ansi的內容是: 在應答之前傳送訊息成功,請等待答覆…
在python2如何進行互相轉換?
s = '%u5728%u5e94%u7b54%u4e4b%u524d%u53d1%u9001%u8baf%u606f%u6210%u529f%uff0c%u8bf7%u7b49%u5f85%u7b54%u590d'
print s.replace('%u','\\u').decode('raw_unicode_escape').encode('gbk')
我測試了一下結果輸出是亂碼,於是對以上的解決方法進行了修改。
s.replace('%u','\\u').decode('raw_unicode_escape').encode('utf-8')
即可正常輸出中文:
在應答之前傳送訊息成功,請等待答覆實際上我的需求跟上面的例子正好相反,我需要將中文轉換成為形如
\u5e73\u5b9a
的格式。
在以上的解決方案中逆向走就ok了,比如:
print
'平定'.decode('utf-8').encode('raw_unicode_escape')
# 輸出為:\u5e73\u5b9a
print
'北京'.decode('utf-8').encode('raw_unicode_escape')
# 輸出為:\u5317\u4eac
v2ex-python2 如何將usc2與ansi互相進行編碼轉換?
精易論壇-\u5927 這種是啥編碼誒,怎麼轉成漢字
Python輸出 u編碼將其轉換成中文
整個 demo coding utf 8 小豬短租爬取 import requests from bs4 import beautifulsoup import json defget xinxi i url i html requests.get url soup beautifulsoup ht...
Python輸出 u編碼將其轉換成中文的例項
了下。python2.7在window上的編碼確實是個坑 解決如下 如果是個字典的話要先將其轉成字串 匯入json庫 然後 這麼輸出 json.dumps data decode unicode escape 整個 demo coding utf 8 小豬短租爬取 import requests f...
常見編碼格式(中文編碼)
中文編碼主要有以下四種 gb2312簡體中文編碼,乙個漢字占用2個位元組,在大陸是主要的編碼方式。當文章 網頁中包含正體中文 日文 韓文等時,這些內容可能無法被正確編碼。big5正體中文編碼,主要在台灣地區使用。gbk支援簡體及正體中文,但對他國非拉丁字母語言還是有問題。utf 8 unicode編...