例項1 urllib3獲取簡書首頁

2022-08-11 15:42:15 字數 589 閱讀 7410

模組:re 、urllib.request

最基本的爬蟲程式,因為前端存在ajax,所以如果需要全部資料還需模擬ajax,具體詳見例項2

#!/usr/bin/env python

# encoding: utf-8

import re

from urllib import request

# 構建基本因素:url user-agent

url = ''

# 發起請求

req = request.request(url, headers=headers)

resp = request.urlopen(req)

# print(resp.read().decode())

# 解析資料

result = re.findall(r'(.*?).*?(.*?)

', resp.read().decode(), re.s)

for title, abstract in result:

print(title)

print(abstract)

urllib2基本使用例項

示例一 urllib2 基本使用1 import urllib2 req urllib2.request response urllib2.urlopen req html response.read 1 urllib2.request 的功能是構造乙個請求資訊,返回的 req就是乙個構造好的請求。...

python中urllib模組用法例項詳解

一 問題 近期公司專案的需求是根據客戶提供的api,我們定時去獲取資料,之前的方案是用php收集任務存入到redis佇列,然後在linux下做乙個常駐程序跑某乙個p程式設計客棧hp檔案,該php檔案就乙個無限迴圈,判斷redis佇列,有就執行,沒有就break.二 解決方法 最近剛好學了一下pyth...

Python爬蟲入門1之urllib庫的使用

這是我第一次認真的寫部落格,真正的記錄下我的學習過程。學習爬蟲之前,應該有html的基礎,python語言的基本用法,再入門爬蟲,隨著爬蟲的深入,再學習python的正規表示式等,本人小白一枚,我的爬蟲之路開始啦 urrlib是python中自帶的一種簡單易用的模組,使用它我們可以獲取一些簡單的網頁...