17track包裹單個物流軌跡抓取(一)

2021-08-21 07:14:39 字數 1176 閱讀 1276

近期正在學習python ,結合自己過往的工作,所以閒來無事,試下爬17track 的軌跡。

爬取途徑是:利用靜態頁面爬取,需要了解前端網頁知識。

三方包:pyquery

話不多說,看**吧:

return l

return s

def main():

d = pq(filename="18.html")

d1 = d(".ori-block")#查詢類是ori-block的html模組

d2 = d('.text-uppercase').text()獲取類是text-uppercase的文字內容

print (type(d2))#測試返回的資料型別,為str

i=0while i < len(get_time(d1)):

print(d2+"/"+get_time(d1)[i]+"/"+get_message(d1)[i])

i += 1

main()

抓取結果如下:

1z3y18900337899118/2018-07-05/las vegas, nv, us, delivered

1z3y18900337899118/2018-07-05/las vegas, nv, united states, destination scan

1z3y18900337899118/2018-07-04/las vegas, nv, united states, arrival scan

1z3y18900337899118/2018-07-04/departure scan

1z3y18900337899118/2018-07-04/arrival scan

1z3y18900337899118/2018-07-04/ontario, ca, united states, departure scan

1z3y18900337899118/2018-07-04/origin scan

1z3y18900337899118/2018-06-30/united states, order processed: ready for ups

ps:難點在於如何破解guid 的值。

從頁面的js**中有一串關於guid生成的位置:

this.defaults.nownums = a (這個字典裡面有個guid)

js好的童鞋可以去嘗試破解下。

GIT 忽略已經track的檔案

git忽略並刪除已經提交到git上的檔案 刪除本地快取中的檔案 git rm r cached 檔名 複製 將刪除的檔案新增到本地暫存區 git add 複製 將本地變更資訊提交到本地倉庫 git commit am 變更資訊 複製 推送到遠端倉庫 git push orgin 分支名 複製 git...

英語核心詞track2

track2 light n.光 光明 領悟 v.點燃 照亮 a.明亮的 輕的 limit n.限制 極點 界限,範圍 v.限制,限定 maintain v.維持,保持 供養 維修,保養,堅持,主張 nature n.大自然,自然界 性質 天性 opportunity n.時機,機會 range n...

給自己建乙個track

最近不太經常登入csdn了,經常混跡在cnblogs上面,cnblogs上的更新很快,經常看到不錯的文章,所以很少來csdn了。看到別人寫了那麼多好文章,不管是自己的作品,還是實驗性的探索,還是關於某類問題的總結,都寫出來,覺得這樣做非常好,不管是對別人,對自己,都是一種提高。開始我也經常會把工作中...