jsonpath的簡單使用
首先要將json物件轉化為python物件
使用json.loads()
然後要取得拿破崙的翻譯結果只需要找到根節點下面的data節點下面的dst節點就可以了
$..data..dst(這是這樣就可以啦!)
import json
import jsonpath
#把json物件轉換成python物件
jsonobj=json.loads(html)
#從根節點開始匹配,分別匹配到data和dst節點
data=jsonpath.jsonpath(jsonobj,"$..data..dst")
嗯!沒錯就是這麼簡單,這裡只是簡單的介紹一下,具體可以看看官方文件:
然後貼上所有的**:
# -*- coding:utf-8 -*-
from urllib import request,parse
import json
import jsonpath
''' query:準備查詢的句子
from1:句子是中文還是英文
to:準備翻譯成中文還是英文
'''query=input("請輸入想要翻譯的句子或單詞:")
''' 通過ord判斷輸入的句子的第乙個字元是否是英文
如果輸入的是中文,那麼則是中文轉英文
如果輸入的是英文,那麼則是英文轉中文
'''if ord(query[0]) not
in range(97,123) and ord(query[0]) not
in range(65,91):
from1="zh"
to="en"
else:
from1="en"
to="zh"
#提交post表單的位址,從fiddler中得到的
url=""
#表單資料
data=
#處理成url編碼
data = parse.urlencode(data).encode('utf-8')
req = request.request(url, headers=headers, data=data)
html = request.urlopen(req).read().decode("utf-8")
#把json物件轉換成python物件
jsonobj=json.loads(html)
#從根節點開始匹配,分別匹配到data和dst節點
data=jsonpath.jsonpath(jsonobj,"$..data..dst")
print("翻譯結果:%s"%data[0])
執行效果圖:
程式完美執行,不過這好像與爬蟲無關,但是這又有什麼關係呢?
人生苦短,我用python!
python3爬蟲快速入門攻略
複製過來的內容 一 什麼是網路爬蟲?1 定義 網路爬蟲 web spider 又被稱為網頁蜘蛛,是一種按照一定的規則,自動地抓取 資訊的程式或者指令碼。2 簡介 網路蜘蛛是乙個很形象的名字。如果把網際網路比喻成乙個蜘蛛網,那麼spider就是在網上爬來爬去的蜘蛛。網路蜘蛛是通過網頁的鏈結位址來尋找網...
Python 3 爬蟲(一) 簡單的爬蟲
url 組成部分 protocol hostname port path protocol 協議 hostname port 主機名,埠名為可選引數 path 主機資源的具體位置網域名稱和伺服器名e.g.www.baidu.com baidu.com 網域名稱 www 伺服器名官方文件 urllib...
python3爬蟲實戰(3)
今天心血來潮去爬取了一下招聘 的實時招聘資訊。是 選的條件是北京,實習生,計算機軟體。分析 之後發現還是很容易的,不過過程中出了不少小問題,在這裡分享一下。想要爬取的是類似的表單內容。是在ul的li裡。用beautifulsoup解析之後,tem ul bsoj.find ul 存下整個ul元素。對...