方法一:使用codecs
importcodecs
f = codecs.open('nlpir/readme.txt','r','gbk')line = f.readline()
whileline:
printline,
line = f.readline()
f.close()
上面的方法很慢,可以直接讀取整個檔案
codecs.open('nlpir/readme.txt','r','gbk').read()
還有這樣讀的readlines()
方法二:
#讀取文件
def read_file():
path1='k:\\sogouc.reduced\\reduced\\c000008\\10.txt'
f = open(path1,'r+')
file_list = f.read().decode("gbk")
print file_list
f.close()
#逐行讀取文件
def read_file_line():
path1='k:\\sogouc.reduced\\reduced\\c000008\\10.txt'
f = open(path1,'r+')
line = f.readline()
while line:
print line.decode('gbk')
line = f.readline()
f.close()
帶bom頭
def readweibo():
f = codecs.open(u'h:/資料/weibo/weibo.txt','r','utf-8')
line = f.readline()
if line[:3] == codecs.bom_utf8:
line = line[3:]#去除bom頭
i=0while line:
print line,
line = f.readline()
if i>10:
break
f.close()
return
readweibo()
顯示行數的讀取
def test_read():
file_path = u"d:/dev_data/idf_data/weibo/weibo_text.txt"
f = open(file_path, "r")
for i,line in enumerate(f):
print i,line,
if i>10:
break;
f.close()
python 讀取檔案亂碼問題
一 問題 python讀取檔案時會遇到亂碼的問題 二 解決方法 1 已utf 8格式開啟文件 f open r e python liaotian.txt r encoding utf 8 f.seek 0,0 for each line in f print each line f.close 2...
python讀取檔案亂碼問題
今天突然想做乙個實時讀取 日誌檔案的程式,然後用python爬蟲直接爬取檔案,用唯讀的方式開啟避免對 系統 寫入日誌 造成影響。上 usr bin env python coding utf 8 import subprocess import time import chardet p 0 wit...
Python中讀取檔案亂碼
python中讀取目標檔案後,控制台出現亂碼,解決方案 file path r f wechat wechat files filename.txt with open file path,rb as file object contents file object.read print conte...