最近在研究爬蟲相關的內容,作為記錄方便使用是查閱。
本文爬取的**是長沙市統計局望城區2023年國民經濟和社會發展統計公報
step1: 匯入需要用到的庫包
import requests #爬取網頁的庫
from bs4 import beautifulsoup #用於解析網頁的庫
headers =
# 構造請求頭
url =
''response = requests.request(
"get"
, url, headers=headers)
# 獲取網頁資料
soup = beautifulsoup(response.text,
'html.parser'
)bf = soup.find(
'div'
, class_=
'view trs_ueditor trs_*****_default trs_web'
)
部分結果展示如下:
注:後續會把標題加上在補充上
Python 爬取網頁
先謝郭嘉 以鏈家二手房為例 1.爬取網頁所必須的庫 import urllib.request import ssl 2.獲取預爬網頁資訊 1 網頁url 3.下面就可以爬取網頁了 以鏈家二手房為例 1.爬取網頁所必須的庫 import urllib.request import ssl 2.獲取預...
python爬取網頁資料
import refrom urllib.request import urlopen 爬取網頁資料資訊 def getpage url response urlopen url return response.read decode utf 8 defparsepage s ret re.find...
python簡單爬取網頁文字操作體會
簡單的實現爬蟲爬取網頁文字和 以python3為背景,這裡還是先定義乙個讀取html頁面資訊的函式 import urllib.request defgethtml url page urllib.request.urlopen url 開啟url位址 html page.read decode u...