想必小夥伴都經歷過,當你想要把pdf轉為word時,頁面上就會出現四個字甩在你眼前:
不充錢就想白嫖??想得美~不能這樣說,咱們是資源合理利用,今天用python寫乙個pdf轉word的小工具(基於某**介面)。
通過抓包分析,知道這是乙個post請求,接下來用requests庫模擬即可。
需要注意的是,這個介面僅用於測試,所以可供轉換的頁面等都有所限制,如需更完整的功能還請支援原版。
定義pdf2word類:
class pdf2word():
def __init__(self):
self.machineid = 'ccc052ee5200088b92342303c4ea9399'
self.token = ''
self.guid = ''
self.keytag = ''
def producetoken(self):
headers =
res = requests.post(url,headers=headers,data=data)
res_json = res.json()
if res_json['code'] == 10000:
self.token = res_json['token']
self.guid = res_json['guid']
print('成功獲取token')
return true
else:
return false
def uploadpdf(self,filepath):
filename = filepath.split('/')[-1]
files =
headers =
res= requests.post(url,headers=headers,data=data)
res_json = res.json()
if res_json['message'] == '處理成功':
print('pdf處理完成')
return true
else:
print('pdf處理中')
return false
def downloadword(self,output):
res = requests.get(url)
with open(output,'wb') as f:
f.write(res.content)
def convertpdf(self,filepath,outpath):
filename = filepath.split('/')[-1]
filename = filename.split('.')[0]+'.docx'
self.producetoken()
self.uploadpdf(filepath)
while true:
res = self.progress()
if res == true:
break
time.sleep(1)
self.downloadword(outpath+filename)
執行主函式:
if __name__=='__main__':
pdf2word = pdf2word()
pdf2word.convertpdf('001.pdf','')
注意:convertpdf函式有兩個引數,第乙個為需要轉換的pdf,第二個引數為轉換後的目錄。
run一下,一鍵入魂,".docx"檔案已經躺在了我的目錄中,舒服了~
國內軟體開發商的通病
最近為了我公司的乙個專案同國內的軟體 商合作。發現這些國內的軟體 商有一些問題。現在來談談。1.資料庫開發總是以為可以有dba許可權。他們開發就從來都是用具有dba許可權的使用者帳號開發.程式動態建立表,檢視等.2.產品提交沒有乙個統一的版本 提交了一些模組,忘記某些模組.3.字符集用簡體中文,不用...
德國SAP收購美國軟體開發商Qualtrics
騰訊科技訊,11 月 12 日,據外媒報道,就在調查軟體公司 qualtrics 計畫 ipo 前,全球知名的企業應用軟體解決方案 商 sap 公司決定斥資 80 億美元收購它。sap 公司在上週日發布的一項宣告中稱,此次收購活動將全部以現金進行交易,而且已得到這兩家公司董事會以及 qualtric...
筆記一 軟體測試之軟體開發模型
軟體開發模型 用於指導軟體開發過程的流程 特點 線性模型 階段界定清晰 文件驅動型模型 即每個階段都有文件產出 優點 階段界定清晰 提高大型軟體開發的效率和質量 缺點 不適應需求更改 風險後延,失去早糾錯機會 錯誤傳遞和漫延 特點 快速構造原型 支援使用者參與 適應需求變化 優點 減少因需求不明確帶...