2.解壓pdfbox,專案中新增存在解壓後bin目錄下的dll檔案:ikvm.gnu.classpath.dll、ikvm.runtime.dll、fontbox-0.1.0-dev.dll、pdfbox-0.7.3.dll
3.檔案中引入2個命名空間:using org.pdfbox.pdmodel、using org.pdfbox.util
4.如下**變可以讀取pdf文件:
void readpdf(fileinfo pdffile)
pddocument doc = pddocument.load(pdffile.fullname);
pdftextstripper pdfstripper = new pdftextstripper();
string text = pdfstripper.gettext(doc);
此時pdf文件的內容就被讀取到字串text中。
讀取PDF文件
coding utf 8 匯入開發包 frompdfminer.pdfparserimportpdfparser,pdfdocument frompdfminer.pdfinterpimportpdfresourcemanager,pdfpageinterpreter frompdfminer.pd...
python讀取pdf文件 實戰
coding utf 8 讀取pdf文件 from pdfminer.converter import pdfpageaggregator from pdfminer.layout import laparams from pdfminer.pdfparser import pdfparser,pd...
用python讀取pdf文件
首先要安裝庫 pdfminer3k from pdfminer.converter import pdfpageaggregator from pdfminer.layout import laparams from pdfminer.pdfparser import pdfparser,pdfdo...