當乙個pdf檔案有多page的時候,它將出來見你!
方法是取直接修改那個檔案generic.py
(1)pypdf
路徑大約在這裡:
/usr/lib/python2.7/site-packages/pypdf/generic.py
if data.has_key(key):
# multiple definitions of key not permitted
raise utils.pdfreaderror, "multiple definitions in dictionary"
data[key] = value
大約在532--536行
將它修改為:
if not data.get(key):
data[key] = value
(2)pypdf2
路徑大約在:
/usr/lib/python2.7/site-packages/pypdf2/generic.py
if not data.get(key):
data[key] = value
elif pdf.strict:
# multiple definitions of key not permitted
raise utils.pdfreaderror("multiple definitions in dictionary at byte %s for key %s" \
% (utils.hexstr(stream.tell()), key))
修改為:
if not data.get(key):
data[key] = value
PyPDF2中文配置
pypdf2 預設是 latin 1 編碼的,當處理中文文件的時候就會報錯。本文內容 linux 與 windows 通用 已測試 將utils.py內大概240行左右的內容 r s.encode latin 1 if len s 2 bc s r return r修改為 r s.encode ut...
Python利用PyPDF2庫獲取PDF檔案總頁碼
python中可以利用pypdf2庫來獲取該pdf檔案的總頁碼,可以根據下面的方法一步步進行下去 1 首先,要安裝pypdf2庫,利用以下命令即可 pip install pypdf22 接著,就是直接編寫 了,其中我新建了乙個py檔案,名為file utils.py,如下 from pypdf2 ...
Python中用PyPDF2拆分pdf提取頁面
有時候我們只需要pdf中的幾頁,或許還想把這幾頁內容整合成新的pdf,那該怎麼做呢?準備工作 安裝擴充套件庫pypdf2,參考命令 pip install pypdf2 如下 from pypdf2 import pdffilereader,pdffilewriter defsplit pdf fi...