Python DOCX檔案操作 docx2txt

2021-08-23 12:01:06 字數 813 閱讀 2760

github鏈結

ladies and gentlemen, please allow me to present, the fabulously handy, ****** yet elegant, pure utility tool for extracting text from a docx file… the docx2txt for python.

將docx檔案轉換為txt格式的模組

能夠直接讀取docx文件並將其中的文字部分剝離出來的簡單工具

pip install docx2txt
a. 使用命令列

# extract text

docx2txt file.docx

# extract text and images

docx2txt -i /tmp/img_dir file.docx

b. python呼叫

import docx2txt

# extract text

text = docx2txt.process("file.docx")

# extract text and write images in /tmp/img_dir

text = docx2txt.process("file.docx", "/tmp/img_dir")

還有乙個月就要遠行,再拼乙個10年。

離開安逸,離開軟弱,這令我恐懼,但不會讓我麻痺。

從現在就開始離開安逸,離開軟弱吧,不在這麼幾天。

簽證下來就辭職(・ω<)

D23 檔案操作

define crt secure no warnings include include 1.向檔案讀寫字元 fgetc fp 從fp指向的檔案讀入乙個字元,成功帶回所讀字串,失敗返回eof 即 1 fputc ch,fp 把字元ch寫到檔案指標變數fp所指向的檔案中,成功返回值是輸出的字元,失敗...

Unity3d讀寫檔案操作

路徑 檔名 檔案內容 path.name.void deletefile string path,string name 讀取檔案內容 僅讀取第一行 path.name.private string loadfile string path,string name streamreader sr n...

D3D基本框架 即D3D標頭檔案分類

了dxut的結構 後,發現微軟程式設計師的編碼風格太深奧了。各種巨集定義 預編譯跳得頭暈,由於對於window api的不精通,導致寫出符合dxut風格的框架以現在的水平來看是不可能的。既然沒有弄通dxut,我也暫時不想套用了,那麼還是先自己用自己的框架來寫把。框架如下 雖然沒學會dxut,但是微軟...