有時候利用python爬蟲獲得的檔案是unicode的編碼格式。輸出大概是:
,類似這種。
根據不同的編碼,讀取檔案輸出的時候,加上對應的解碼方式就行了。如:
with open("mingyan.json",'r',encoding='unicode_escape')as file:encoding = 『編碼方式』message = file.read()
print(message)
print(type(message))
編碼方式其實有很多。一般檔案上面有個
# test for with.py
# -*- coding: utf-8 -*-
# __author__ = 'carina'
這就是指出了編碼方式。方便以後的該檔案的處理操作 Python關於list裡面的unicode編碼
利用python2.7結巴分詞對文字分詞之後存進list列表裡面 import jieba seg list jieba.cut 網路,讓我們之間的距離變的如此之近,也如此遙遠。a i for i in seg list a str a replace u s a.decode unicode es...
python輸出到檔案裡
傻乎乎寫了各種print,掛到伺服器上,用screen切視窗,一下子就給刷沒了,所以想著重定向到檔案裡。遇到幾個 坑 這裡當做給自己記錄 1 我想要既能重定向到檔案裡,又能輸出到螢幕上。使用了tee工具,但是沒法反應。原因是 python 中如何乙個 print 語句同時輸出到螢幕且記錄到檔案裡 p...
Python檔案輸入輸出
本文以.txt檔案為例,說明python從.txt檔案中讀取內容和向.txt檔案寫入內容的方法。a.txt檔案內容 犬吠水聲中,桃花帶雨濃。樹深時見鹿,溪午不聞鐘。野竹分青靄,飛泉掛碧峰。無人知所去,愁倚兩三松。讀取檔案 open filename,mode open返回乙個檔案物件。第乙個引數是乙...