12306就算了,爬一**灣的高鐵試試:
首先到台灣高鐵查一**北到桃園站的地鐵。
開啟瀏覽器開發者模式,找到表單資料,把表單用字典按鍵值對方式的方式存入變數payload
用post方法把**和表單資料發出。
**:
import requests
from bs4 import beautifulsoup
payload =
res = requests.post("",data = payload)
soup = beautifulsoup(res.text)
for item in soup.select('.column1'):
print(item.text)
for item in soup.select('.column2'):
print(item.text)
for item in soup.select('.column3'):
print(item.text)
for item in soup.select('.column4'):
print(item.text)
得到的結果:
車次0645
0833
0651
0837
0657
0841
0661
0663
0845
0667
行車時間00:22
00:21
00:22
00:21
00:22
00:21
00:20
00:22
00:21
00:20
出發時間13:46
14:11
14:46
15:11
15:46
16:11
16:21
16:46
17:11
17:21
抵達時間14:08
14:32
15:08
15:32
16:08
16:32
16:41
17:08
17:32
17:41
2,簡單的Python爬蟲
前言 環境 作業系統 windows10 ide pycharm2018.1 直譯器 python3.6 1,只需短短4行 或許python爬蟲給大家的感覺就是比較高階,比較牛逼的一項技術,而其實呢,它的核心 就只有以下幾行!至少對於初學者來說,只需要知道它如何使用 1 import request...
Python簡單爬蟲(爬取天氣資訊)
初學python,學到python爬蟲時在網上找資料,發現找到的大部分都是前部分內容對運作方式介紹,然後就直接上 了,這樣對像我一樣的小白來說比較困難,的注釋較少,部分 塊沒有詳細說明運作方式和具體作用,所以寫此筆記方便別人和自己以後進行學習檢視。作業系統window python2.7.10 wi...
Python網路爬蟲與資訊提取(2) 爬蟲協議
上一節學習了requests庫,這一節學習robots協議 宣告robots協議,一般放在 的根目錄下,robots.txt檔案 京東robots鏈結 user agent disallow disallow pop html disallow pinpai html?user agent etao...