看**有很多生詞不會,這時候就需要谷歌翻譯查詞,查完詞又懶得記,一開始想爬取谷歌翻譯的歷史記錄,但是使用爬蟲開啟網頁後沒有任何歷史記錄,所以歷史記錄是留在本地的,無法爬取,只能手動複製網頁**進行處理。
首先開啟谷歌的歷史記錄頁面,並在開發者模式中找到如圖,複製途中class="tlid-history-entry-list entry-list"項,儲存在txt檔案中。
然後使用python處理資料,將其中的單詞和對應的解釋處理。
with open(u'c:/users/wu/desktop/翻譯歷史記錄.txt', 'r',encoding="utf-8") as f:
pattern1 = re.compile(r'tl-input">([a-z]+)
([\u4e00-\u9fa5]+)')
pattern2 = re.compile(r'tl-input">([a-z]+) ([a-z]+)
([\u4e00-\u9fa5]+)')#匹配中文
str = f.read()
m1 = pattern1.findall(str)
m2 = pattern2.findall(str)
m1 = list(set(m1))
m2 = list(set(m2))
# print(m1)
# print(m2)
with open(u'c:/users/wu/desktop/**單詞1.txt','a',encoding='utf-8') as f:
for var in m1:
# print(var)
f.write(var[0]+" "*(40-len(var[0]))+var[1]+"\n")
for var in m2:
f.write(var[0]+" "+var[1]+" "*(40-len(var[0])-len(var[1]))+var[2]+"\n")
**會自動生成乙個名為**單詞1的txt,其中就是單詞和對應的翻譯,這裡**只能處理乙個單詞或者兩個單詞中間為空格的情況,其他情況可以自己新增。
python 呼叫谷歌翻譯
coding utf 8 import requests import json from fake useragent import useragent from bs4 import beautifulsoup import execjs 必須,需要先用pip 安裝,用來執行js指令碼 clas...
python使用谷歌翻譯
俺寫指令碼向來喜歡直接copy然後修改,看網上使用谷歌翻譯api還要自己去破解的,這不是直接造輪子麼。所以我選擇安裝googletrans 模組。直接 pip install googletrans 就完事了。實際操作發現不用 不行,我想應該是host問題,看了原始碼之後發現加引數service u...
python3實現谷歌翻譯
quad 中文轉英文的翻譯 from googletrans import translator def trans text translator translator return translator.translate text,dest en text if name main res t...