博主作為爬蟲初學者,本次使用了requests和beautifulsoup庫進行資料的爬取
爬取**: —500彩票網
(分析後發現**源**並非是通過頁面跳轉來查詢不同的資料,故可通過f12查詢network欄找到真正儲存所有歷史開獎結果的網頁)
如圖:
爬蟲部分:
from bs4 import beautifulsoup #引用beautifulsoup庫
import requests #引用requests
import os #os
import pandas as pd
import csv
import codecs
lst=
url=
''r = requests.
get(url)
r.encoding=
'utf-8'
text=r.text
soup =
beautifulsoup
(text,
"html.parser"
)tbody=soup.
find
('tbody'
,id=
"tdata"
)tr=tbody.
find_all
('tr'
)td=tr[0]
.find_all
('td'
)for page in
range(0
,14016):
td=tr[page]
.find_all
('td'
)
lst.
([td[0]
.text,td[1]
.text,td[2]
.text,td[3]
.text,td[4]
.text,td[5]
.text,td[6]
.text,td[7]
.text]
)with
open
("lottery_data.csv"
,'w'
)as csvfile:
writer = csv.
writer
(csvfile)
writer.
writerow([
'期號'
,'號碼1'
,'號碼2'
,'號碼3'
,'號碼4'
,'號碼5'
,'號碼6'
,'號碼7'])
writer.
writerows
(lst)
csvfile.
close
()
資料分析:首先展示所有的彩票期號以及相應的中獎數字
python 爬取大樂透開獎結果
coding utf 8 下面中文注釋不支援 所以開頭加 coding utf 8 獲取近期大樂透開獎結果,並給出自己猜中的個數 import requests 這個api能夠免費得到近期開獎結果,url裡的 20代表獲取近20期的開獎資訊 url req requests.get url ret ...
python動態爬取知乎 python爬取微博動態
在初學爬蟲的過程中,我們會發現很多 都使用ajax技術動態載入資料,和常規的 不一樣,資料是動態載入的,如果我們使用常規的方法爬取網頁,得到的只是一堆html 沒有任何的資料。比如微博就是如此,我們可以通過下滑來獲取更多的動態。對於這樣的網頁該如何抓取呢?我們以微博使用者動態為例,抓取某名使用者的文...
超級簡單的爬蟲,看Python如何爬取小說
爬蟲軟體 從筆趣閣獲取 的內容,將內容寫到txt文件中 開啟筆趣閣的 開啟對應 的主頁,將 複製到python中即可 import re import os import requests url txt requests.get url content.decode utf 8 urlarray ...