知道問題所在,還是沒有解決,又苦苦搜尋,終於在 stackoverflow 上找到靈感,可以把 open 的方式變為 二進位制,也就是下面**裡的 open(filename,』rb』), 這下好了,至少後面的read() 可以通過。
再之後就產生了以下**,發現問題的路真心不好走,在此mark 下。
# _*_coding:utf-8_*_
import
refilename =
'section5'
fp = open(filename,
'rb'
)content = fp.read().decode(
'utf-8'
)reg =
r''#print(content)
result = re.findall(reg,content)fp.close()fp = open(filename+
'.txt'
,'bw'
)for
r in
result: r = r.encode(
'utf-8'
) fp.write(r) fp.write(
'\n'
.encode(
'utf-8'
))fp.close()
Linux檢視檔案編碼格式及檔案編碼格式轉換
如果你需要在linux 中操作windows下的檔案,那麼你可能會經常遇到檔案編碼轉換的問題。windows中預設的檔案格式是gbk gb2312 而linux一般都是utf 8。下面介紹一下,在linux中如何檢視檔案的編碼及如何進行對檔案進行編碼轉換。檢視檔案編碼 在linux中檢視檔案編碼可以...
Linux檢視檔案編碼格式及檔案編碼
如果你需要在 linux 中操作windows下的檔案,那麼你可能會經常遇到檔案編碼轉換的問題。windows中預設的檔案格式是gbk gb2312 而linux一般都是utf 8。下面介紹一下,在linux中如何檢視檔案的編碼及如何進行對檔案進行編碼轉換。檢視檔案編碼 在linux中檢視檔案編碼可...
Linux檢視檔案編碼格式及檔案編碼轉換
如果你需要在linux 中操作windows下的檔案 那麼你可能會經常遇到檔案 編碼 轉換的問題。windows中預設的檔案 格式是gbk gb2312 而linux 一般都是utf 8。下面介紹一下,在linux 中如何檢視 檔案 的編碼 及如何進行對檔案 進行編碼 轉換。檢視 檔案 編碼 在li...