python3爬蟲攻略(4) 簡單的翻譯程式

2021-08-09 22:26:46 字數 1678 閱讀 8008

jsonpath的簡單使用

首先要將json物件轉化為python物件

使用json.loads()

然後要取得拿破崙的翻譯結果只需要找到根節點下面的data節點下面的dst節點就可以了

$..data..dst(這是這樣就可以啦!)

import json

import jsonpath

#把json物件轉換成python物件

jsonobj=json.loads(html)

#從根節點開始匹配,分別匹配到data和dst節點

data=jsonpath.jsonpath(jsonobj,"$..data..dst")

嗯!沒錯就是這麼簡單,這裡只是簡單的介紹一下,具體可以看看官方文件:

然後貼上所有的**:

# -*- coding:utf-8 -*-

from urllib import request,parse

import json

import jsonpath

''' query:準備查詢的句子

from1:句子是中文還是英文

to:準備翻譯成中文還是英文

'''query=input("請輸入想要翻譯的句子或單詞:")

''' 通過ord判斷輸入的句子的第乙個字元是否是英文

如果輸入的是中文,那麼則是中文轉英文

如果輸入的是英文,那麼則是英文轉中文

'''if ord(query[0]) not

in range(97,123) and ord(query[0]) not

in range(65,91):

from1="zh"

to="en"

else:

from1="en"

to="zh"

#提交post表單的位址,從fiddler中得到的

url=""

#表單資料

data=

#處理成url編碼

data = parse.urlencode(data).encode('utf-8')

req = request.request(url, headers=headers, data=data)

html = request.urlopen(req).read().decode("utf-8")

#把json物件轉換成python物件

jsonobj=json.loads(html)

#從根節點開始匹配,分別匹配到data和dst節點

data=jsonpath.jsonpath(jsonobj,"$..data..dst")

print("翻譯結果:%s"%data[0])

執行效果圖:

程式完美執行,不過這好像與爬蟲無關,但是這又有什麼關係呢?

人生苦短,我用python!

python3爬蟲快速入門攻略

複製過來的內容 一 什麼是網路爬蟲?1 定義 網路爬蟲 web spider 又被稱為網頁蜘蛛,是一種按照一定的規則,自動地抓取 資訊的程式或者指令碼。2 簡介 網路蜘蛛是乙個很形象的名字。如果把網際網路比喻成乙個蜘蛛網,那麼spider就是在網上爬來爬去的蜘蛛。網路蜘蛛是通過網頁的鏈結位址來尋找網...

Python 3 爬蟲(一) 簡單的爬蟲

url 組成部分 protocol hostname port path protocol 協議 hostname port 主機名,埠名為可選引數 path 主機資源的具體位置網域名稱和伺服器名e.g.www.baidu.com baidu.com 網域名稱 www 伺服器名官方文件 urllib...

python3爬蟲實戰(3)

今天心血來潮去爬取了一下招聘 的實時招聘資訊。是 選的條件是北京,實習生,計算機軟體。分析 之後發現還是很容易的,不過過程中出了不少小問題,在這裡分享一下。想要爬取的是類似的表單內容。是在ul的li裡。用beautifulsoup解析之後,tem ul bsoj.find ul 存下整個ul元素。對...