import csv
from pdfminer.converter import pdfpageaggregator
from pdfminer.layout import laparams
from pdfminer.pdfparser import pdfparser, pdfdocument
from pdfminer.pdfinterp import pdfresourcemanager, pdfpageinterpreter
class dealfile(object):
"""讀取csv檔案
@:param path: 檔案路徑
@:return result: 以列表形式將檔案內容返回
"""@staticmethod
def read_csv(path):
result =
with open(path, 'r') as f:
reader = csv.reader(f)
for row in reader:
return result
"""向csv檔案中寫入內容
@:param path: 檔案路徑
@:param data: 以列表形式將內容傳入
"""@staticmethod
def write_csv(path, data):
with open(path, 'w') as f:
writer = csv.writer(f)
for row_data in data:
writer.writerow(row_data)
"""讀取pdf檔案
@:param path: 檔案路徑
@:return result: 以列表形式將檔案內容返回
"""@staticmethod
def read_pdf(path):
result =
# 建立文件物件
fp = open(path, "rb")
# 建立乙個與文件關聯的直譯器
parser = pdfparser(fp)
# 建立乙個pdf的文件物件
doc = pdfdocument()
# 連線直譯器和文件物件
parser.set_document(doc)
doc.set_parser(parser)
# 初始化文件
doc.initialize("")
# 建立pdf資源管理器
resource = pdfresourcemanager()
# 引數分析器
laparam = laparams()
# 聚合器
device = pdfpageaggregator(resource, laparams=laparam)
# 頁面直譯器
interpreter = pdfpageinterpreter(resource, device)
# 使用文件物件得到頁面的集合
for page in doc.get_pages():
# 使用頁面直譯器來讀取
interpreter.process_page(page)
# 使用聚合器獲得內容
layout = device.get_result()
for out in layout:
if hasattr(out, "get_text"):
return result
python 操作檔案 檔案讀寫
python進行檔案讀寫的函式是open或file file handler open filename,mode table mode 模式 描述 r以讀方式開啟檔案,可讀取檔案資訊。w以寫方式開啟檔案,可向檔案寫入資訊。如檔案存在,則清空該檔案,再寫入新內容 a以追加模式開啟檔案 即一開啟檔案,...
Python操作檔案的讀寫
使用 with open 方法,使用此方法不需要關閉檔案,with open 結束自動關閉 with open 路徑 讀寫方式 編碼方式 錯誤處理方式 as 檔案物件 讀寫檔案的 塊 例如 with open path,r encoding utf 8 errors ignore as file o...
檔案操作 檔案讀寫
檔案讀寫實質也是呼叫api函式,微軟給我們提供了強大的檔案讀寫程式設計介面。讀寫的一般步驟是 1.呼叫createfile函式開啟或者建立檔案,返回檔案控制代碼 2.利用檔案控制代碼呼叫writefile或readfile函式寫入或讀取檔案 3.呼叫closehandle函式關閉開啟的檔案控制代碼 ...