我的環境,windows10,python3.6.3
查詢了很多有關資料,發現都是python2版本操作word檔案的,所以就寫了這篇短小的文章。
一、安裝 docx
pip install docx
完了之後,匯入:import docx
發現報錯:modulenotfounderror: no module named 『exceptions』
說沒有 exceptions 這個模組,由於python3已經取消了這個模組,而 pendingdeprecationwarning 是內建
可以直接使用的,所以我們直接進入檔案(這個要看你報錯顯示的路徑):
d:\programfiles\anaconda3\lib\site-packages\docx.py
把 from exceptions import pendingdeprecationwarning 注釋掉即可
示例**:
import docx
def get_docx(file_name):
d = docx.opendocx(file_name)
doc = docx.getdocumenttext(d)
return doc
doc = get_docx('tt.docx')
print(doc) # 輸出行數:1075
for d in doc[:5]:
print(d) # 列印前5行
'''輸出:
一、補益之劑
1.四君子湯
四君子湯中和義,參朮茯苓甘草比
益以夏陳名六君,祛痰補氣陽虛餌
除卻半夏名異功,或加香砂胃寒使
'''
python 3讀取檔案 Python3 檔案讀寫
python open 方法用於開啟乙個檔案,並返回檔案物件,在對檔案進行處理過程都需要使用到這個函式 1.讀取檔案 with open test json dumps.txt mode r encoding utf 8 as f seek 移動游標至指定位置 f.seek 0 read 讀取整個檔...
Python3讀取HTML檔案
在學習 designing machine learning systems with python 中文名 機器學習系統設計 python語言實現 一書中,在第三章第二節第五小節 p68 讀取html文件資料的 中。我發現有些不太懂,就把學習過程記錄下來。首先,如果你在python3.6環境中照搬...
Python3 讀取大檔案
1 方法一 將檔案切分成小段,每次處理完小段內容後,釋放記憶體 這裡會使用yield生成自定義可迭代物件,即generator,每乙個帶有yield的函式就是乙個generator。def read in block file path block size 1024 with open file ...