python爬網頁小案例

普通人：計畫失敗 -> 沮喪 -> 罵自己一頓 -> 制訂新計畫 -> 繼續失敗

學霸：計畫失敗 -> 沮喪 -> 罵自己一頓 -> 深度思考計畫為啥失敗 -> 改善問題 -> 制訂

新計畫

案例:

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
import urllib.request  
import sys
import io  
print(sys.getdefaultencoding())
print('a'=='\u2022')  
#**  
url = ""  
#請求  
request = urllib.request.request(url)  
#爬取結果  
response = urllib.request.urlopen(request)  
data = response.read()  
#設定解碼方式  
data = data.decode('utf-8')  
#列印結果  
print(data)  
#列印爬取網頁的各類資訊  
print(type(response))  
print(response.geturl())  
print(response.info())  
print(response.getcode())

有興趣的童鞋，可以**交流交流:

python爬網頁亂碼

最近搞爬蟲網頁經常亂碼，查了很多終於整出來了。關於解碼編碼decode和encode 首先要搞清楚，字串在python內部的表示是unicode編碼，因此，在做編碼轉換時，通常需要以unicode作為中間編碼，即先將其他編碼的字串解碼 decode 成unicode，再從unicode編碼 enco...

Python 爬取網頁

先謝郭嘉以鏈家二手房為例 1.爬取網頁所必須的庫 import urllib.request import ssl 2.獲取預爬網頁資訊 1 網頁url 3.下面就可以爬取網頁了以鏈家二手房為例 1.爬取網頁所必須的庫 import urllib.request import ssl 2.獲取預...

python爬拉鉤案例爬蟲

直接上這裡拉勾網做了cookie的反扒機制，所以用 requests.utils.dict from cookiejar這個方法去獲取cookie然後賦值import requests url headers 或者response從而獲取cookie response requests.get h...

python爬網頁小案例

python爬網頁亂碼

Python 爬取網頁

python爬拉鉤案例 爬蟲

相關推薦

python爬拉鉤案例爬蟲