python爬取分析超級大樂透歷史開獎資料

2021-10-19 18:56:39 字數 1625 閱讀 8538

博主作為爬蟲初學者,本次使用了requests和beautifulsoup庫進行資料的爬取

爬取**: —500彩票網

(分析後發現**源**並非是通過頁面跳轉來查詢不同的資料,故可通過f12查詢network欄找到真正儲存所有歷史開獎結果的網頁)

如圖:

爬蟲部分

from bs4 import beautifulsoup   #引用beautifulsoup庫

import requests #引用requests

import os #os

import pandas as pd

import csv

import codecs

lst=

url=

''r = requests.

get(url)

r.encoding=

'utf-8'

text=r.text

soup =

beautifulsoup

(text,

"html.parser"

)tbody=soup.

find

('tbody'

,id=

"tdata"

)tr=tbody.

find_all

('tr'

)td=tr[0]

.find_all

('td'

)for page in

range(0

,14016):

td=tr[page]

.find_all

('td'

)

lst.

([td[0]

.text,td[1]

.text,td[2]

.text,td[3]

.text,td[4]

.text,td[5]

.text,td[6]

.text,td[7]

.text]

)with

open

("lottery_data.csv"

,'w'

)as csvfile:

writer = csv.

writer

(csvfile)

writer.

writerow([

'期號'

,'號碼1'

,'號碼2'

,'號碼3'

,'號碼4'

,'號碼5'

,'號碼6'

,'號碼7'])

writer.

writerows

(lst)

csvfile.

close

()

資料分析:首先展示所有的彩票期號以及相應的中獎數字

python 爬取大樂透開獎結果

coding utf 8 下面中文注釋不支援 所以開頭加 coding utf 8 獲取近期大樂透開獎結果,並給出自己猜中的個數 import requests 這個api能夠免費得到近期開獎結果,url裡的 20代表獲取近20期的開獎資訊 url req requests.get url ret ...

python動態爬取知乎 python爬取微博動態

在初學爬蟲的過程中,我們會發現很多 都使用ajax技術動態載入資料,和常規的 不一樣,資料是動態載入的,如果我們使用常規的方法爬取網頁,得到的只是一堆html 沒有任何的資料。比如微博就是如此,我們可以通過下滑來獲取更多的動態。對於這樣的網頁該如何抓取呢?我們以微博使用者動態為例,抓取某名使用者的文...

超級簡單的爬蟲,看Python如何爬取小說

爬蟲軟體 從筆趣閣獲取 的內容,將內容寫到txt文件中 開啟筆趣閣的 開啟對應 的主頁,將 複製到python中即可 import re import os import requests url txt requests.get url content.decode utf 8 urlarray ...