pyPdf和pyPdf2在合併pdf時的那個異常

2021-07-10 13:31:38 字數 940 閱讀 8167

當乙個pdf檔案有多page的時候,它將出來見你!

方法是取直接修改那個檔案generic.py

(1)pypdf

路徑大約在這裡:

/usr/lib/python2.7/site-packages/pypdf/generic.py

if data.has_key(key):

# multiple definitions of key not permitted

raise utils.pdfreaderror, "multiple definitions in dictionary"

data[key] = value

大約在532--536行

將它修改為:

if not data.get(key):

data[key] = value

(2)pypdf2

路徑大約在:

/usr/lib/python2.7/site-packages/pypdf2/generic.py

if not data.get(key):

data[key] = value

elif pdf.strict:

# multiple definitions of key not permitted

raise utils.pdfreaderror("multiple definitions in dictionary at byte %s for key %s" \

% (utils.hexstr(stream.tell()), key))

修改為:

if not data.get(key):

data[key] = value

PyPDF2中文配置

pypdf2 預設是 latin 1 編碼的,當處理中文文件的時候就會報錯。本文內容 linux 與 windows 通用 已測試 將utils.py內大概240行左右的內容 r s.encode latin 1 if len s 2 bc s r return r修改為 r s.encode ut...

Python利用PyPDF2庫獲取PDF檔案總頁碼

python中可以利用pypdf2庫來獲取該pdf檔案的總頁碼,可以根據下面的方法一步步進行下去 1 首先,要安裝pypdf2庫,利用以下命令即可 pip install pypdf22 接著,就是直接編寫 了,其中我新建了乙個py檔案,名為file utils.py,如下 from pypdf2 ...

Python中用PyPDF2拆分pdf提取頁面

有時候我們只需要pdf中的幾頁,或許還想把這幾頁內容整合成新的pdf,那該怎麼做呢?準備工作 安裝擴充套件庫pypdf2,參考命令 pip install pypdf2 如下 from pypdf2 import pdffilereader,pdffilewriter defsplit pdf fi...