爬蟲模擬有道字典進行翻譯,還發現了一條好玩的js

2022-01-12 21:01:45 字數 767 閱讀 6908

import requests

from lxml.html import etree

# headers=

# 本來以為有道可能會有點反爬措施,結果發現並沒有...

a = input('請輸入你翻譯的內容')

rp = requests.get(f'') # 這個url是fiddler獲得的

# 他翻譯的內容可能會出現在兩個xpath中

data_xpath_1 = '//*[@id="phrslisttab"]/div/ul/li/text()'

html = etree.html(rp.text)

data = html.xpath(data_xpath_1)

if not data:

data_xpath_2 = '//*[@id="phrslisttab"]/div/ul/p/span[2]/a/text()'

data = html.xpath(data_xpath_2)

#一長串東西翻譯

if not data:

data_xpath_3 = '//*[@id="fanyitoggle"]/div/p[2]/text()'

data = html.xpath(data_xpath_3)

#單純的為了列印好看

count = 1

for english in data:

print(f'翻譯:')

count += 1

我還發現了一條好玩的js

爬蟲 有道翻譯

import time import requests import hashlib class youdaofanyi def get cookie self url ret requests.get url url return ret.headers.get set cookie def tr...

有道翻譯 爬蟲

目標 user agent身份驗證 請求頭設定 請求體資料 傳送請求並接收響應 接收資料簡單處理 在抓包工具中找到目標 或者在瀏覽器開發者工具中找到 不要找錯了 user agent身份資訊,這個比較簡單請求頭內容用抓包工具可以獲得抓包工具中的body表單 一般都是json格式的資料pycharm中...

爬蟲 有道翻譯

author blues date 2020.9.8 python import hashlib import time import random import requests headers def func word r str int time.time 1000 1599574041 t...