Linux下讀取doc,docx檔案

2021-08-28 21:22:10 字數 792 閱讀 5925

docx檔案

利用python-docx包

test.py

# -*- coding:utf-8 -*-

import sys

import docx

path = sys.argv[1]

file = docx.document(path)

for para in file.paragraphs:

print(para.text)

使用命令列傳引數

python test.py filename
例子

doc檔案

python-docx不支援doc檔案的使用su,輸入密碼,然後設定環境變數

path=$path: bin path(輸入上面pwd出現的路徑)
echo $path檢視path是否成功匯入。

成功匯入後,我們就可以在任何的shell和路徑使用antiword了。

C 程式設計讀取文件Doc Docx及Pdf內容的方法

doc文件 microsoft word 14.0 object library www.cppcns.com gac物件,呼叫前需要安裝word。安裝的word版本不同,com的版本號也會不同 docx文件 microsoft word 14.0 object library gac物件,呼叫前需...

Linux下讀取預設MAC位址

mac media access control,介質訪問控制 計算機通過它來定義並識別網路裝置的位置。在嵌入式linux學習中不可避免也會遇到mac,本文主要描述了如何通過操作otp來讀取嵌入式linux裝置網絡卡中的mac位址!一 適用範圍 這裡主要介紹讀取網絡卡mac位址的方法,適用於easy...

linux下c語言 讀取檔案

linux讀取檔案要用到stdio.h檔案,在 usr include下包含大部分的c標頭檔案,sys types.h也位於其中,usr src linu 版本號 存放有你的核心源 在linux下讀檔案也是fopen 檔名 方式 方式有r,w等,下面為一段讀檔案的 cat 7 3.c 1 inclu...