簡單爬蟲(2) 火車資訊

2021-08-11 13:07:35 字數 1313 閱讀 4170

12306就算了,爬一**灣的高鐵試試:

首先到台灣高鐵查一**北到桃園站的地鐵。

開啟瀏覽器開發者模式,找到表單資料,把表單用字典按鍵值對方式的方式存入變數payload

用post方法把**和表單資料發出。

**:

import requests  

from bs4 import beautifulsoup

payload =

res = requests.post("",data = payload)

soup = beautifulsoup(res.text)

for item in soup.select('.column1'):

print(item.text)

for item in soup.select('.column2'):

print(item.text)

for item in soup.select('.column3'):

print(item.text)

for item in soup.select('.column4'):

print(item.text)

得到的結果:

車次

0645

0833

0651

0837

0657

0841

0661

0663

0845

0667

行車時間

00:22

00:21

00:22

00:21

00:22

00:21

00:20

00:22

00:21

00:20

出發時間

13:46

14:11

14:46

15:11

15:46

16:11

16:21

16:46

17:11

17:21

抵達時間

14:08

14:32

15:08

15:32

16:08

16:32

16:41

17:08

17:32

17:41

2,簡單的Python爬蟲

前言 環境 作業系統 windows10 ide pycharm2018.1 直譯器 python3.6 1,只需短短4行 或許python爬蟲給大家的感覺就是比較高階,比較牛逼的一項技術,而其實呢,它的核心 就只有以下幾行!至少對於初學者來說,只需要知道它如何使用 1 import request...

Python簡單爬蟲(爬取天氣資訊)

初學python,學到python爬蟲時在網上找資料,發現找到的大部分都是前部分內容對運作方式介紹,然後就直接上 了,這樣對像我一樣的小白來說比較困難,的注釋較少,部分 塊沒有詳細說明運作方式和具體作用,所以寫此筆記方便別人和自己以後進行學習檢視。作業系統window python2.7.10 wi...

Python網路爬蟲與資訊提取(2) 爬蟲協議

上一節學習了requests庫,這一節學習robots協議 宣告robots協議,一般放在 的根目錄下,robots.txt檔案 京東robots鏈結 user agent disallow disallow pop html disallow pinpai html?user agent etao...