Python3 讀取Word檔案

2021-08-21 16:29:09 字數 873 閱讀 7474

我的環境,windows10,python3.6.3

查詢了很多有關資料,發現都是python2版本操作word檔案的,所以就寫了這篇短小的文章。

一、安裝 docx

pip install docx

完了之後,匯入:import docx

發現報錯:modulenotfounderror: no module named 『exceptions』

說沒有 exceptions 這個模組,由於python3已經取消了這個模組,而 pendingdeprecationwarning 是內建

可以直接使用的,所以我們直接進入檔案(這個要看你報錯顯示的路徑):

d:\programfiles\anaconda3\lib\site-packages\docx.py

把 from exceptions import pendingdeprecationwarning 注釋掉即可

示例**:

import docx

def get_docx(file_name):

d = docx.opendocx(file_name)

doc = docx.getdocumenttext(d)

return doc

doc = get_docx('tt.docx')

print(doc) # 輸出行數:1075

for d in doc[:5]:

print(d) # 列印前5行

'''輸出:

一、補益之劑

1.四君子湯

四君子湯中和義,參朮茯苓甘草比

益以夏陳名六君,祛痰補氣陽虛餌

除卻半夏名異功,或加香砂胃寒使

'''

python 3讀取檔案 Python3 檔案讀寫

python open 方法用於開啟乙個檔案,並返回檔案物件,在對檔案進行處理過程都需要使用到這個函式 1.讀取檔案 with open test json dumps.txt mode r encoding utf 8 as f seek 移動游標至指定位置 f.seek 0 read 讀取整個檔...

Python3讀取HTML檔案

在學習 designing machine learning systems with python 中文名 機器學習系統設計 python語言實現 一書中,在第三章第二節第五小節 p68 讀取html文件資料的 中。我發現有些不太懂,就把學習過程記錄下來。首先,如果你在python3.6環境中照搬...

Python3 讀取大檔案

1 方法一 將檔案切分成小段,每次處理完小段內容後,釋放記憶體 這裡會使用yield生成自定義可迭代物件,即generator,每乙個帶有yield的函式就是乙個generator。def read in block file path block size 1024 with open file ...