Python處理pdf檔案的包

2021-06-09 04:28:54 字數 323 閱讀 3580

分類: python

2012-06-08 12:09

33人閱讀收藏

舉報 reportlab

強大的生成pdf檔案的庫。

主頁:主要功能:

pdfminer

主要用於分析pdf文字內容的工具。

主頁:主要功能:

簡單講,如果只折騰現成的pdf檔案,用pypdf,如果要生成新內容的pdf檔案用reportlab,如果要分析現有pdf檔案的內容,用pdfminer。

不過,生成pdf方面,我更願意使用latex系列的工具,這樣質量***,亂碼之類的問題比較少。

引自:

Python處理PDF檔案的合併與分離

胡兄今天早上突然問我會不會把pdf拆開和合併,原來是ren老師要提交文獻列表之類的東西 我本著偷懶便捷的辦法開啟了搜尋引擎,了解了一下相關軟體,emmmmmmmmm,結果不是讓付費就是2m以上檔案不讓開啟,反正就是辣雞的不行。早就知道python有個庫pypdf2可以簡單處理這些了 那就pip一下給...

python讀取pdf檔案獲取pdf的文字內容

python處理pdf檔案的所有庫 import pypdf2 from urllib.request import urlopen file open d ltn20190716133.pdf rb filereader pypdf2.pdffilereader file pdf page num...

python讀取pdf檔案

pdfplumber是乙個可以處理pdf格式資訊的庫。可以查詢關於每個文字字元 矩陣 和行的詳細資訊,也可以對 進行提取並進行視覺化除錯。文件參考 安裝直接採用pip即可。命令列中輸入 pip install pdfplumber import pdfplumber with pdfplumber....