csv檔案中關於null byte的處理

2021-08-09 20:22:07 字數 923 閱讀 1730

在生成csv2標準的csv檔案時,預設的分割符是英文中的「 , 」或者指定的其它單個(無法多個)分隔符,那麼當csv檔案中的某個字段包含分隔符時,該字段的兩邊都會用乙個null byte加以區別改欄位。

在上述情況下csv檔案處理會報 contains null byte errror,解決方式是,自己寫乙個分割處理函式,單獨讀出每一行的每乙個字段。

利用codecs函式:

**塊語法遵循標準markdown**,例如:

import codecs

with codecs.open('formohtml.txt', "rb") as f:

i = 0

for line in f.readlines():

i += 1

print line

pos = line.find('\x00') # null byte定位

sub1 = ''

sub2 = ''

if pos != -1: # null byte 不存在

sub1 = line[:pos-1]

print sub1

houxu = line[pos:]

houxu = houxu.replace('\x00','')

sub2 = houxu[:len(houxu)-1]

print sub2

else: # null byte 存在

poscomma = line.find(',')

sub1 = line[:poscomma]

sub3 = line[poscomma+1:]

sub2 = sub3[:len(sub3)-1]

————————-end line——————————-

python中利用CSV庫讀寫csv檔案

csv檔案 逗號分隔值 comma separated values,csv,有時也稱為字元分隔值,因為分隔字元也可以不是逗號 其檔案以純文字形式儲存 資料 數字和文字 首先我們先 看一下資料 我們建立了兩個csv檔案,乙個是英文的,乙個是帶有中文的 需要加上,encoding utf 8 不然會有...

python中csv檔案處理 讀寫csv檔案

1.讀取csv檔案 import csv with open stock.csv r as fp reader csv.reader fp reader是乙個迭代器,可以進行遍歷 titles next reader for x in reader print x 0 print x 1 print...

python中CSV檔案的介紹

csv檔案 csv檔案簡介 逗號分隔符comma separated values 手動生成csv檔案 csv模組 reader csvfile,dialect excel fmtparams 返回reader物件,是乙個行迭代器 預設使用excel方言,如下 quoting指定雙引號的規則 csv...