針對爬取豆瓣top250電影失敗的問題

一開始的**是

import requests
url =
""r = requests.get(url)
r.status_code

顯示的是418，這爬取失敗；200才是爬取成功

這裡我們先看一下我們的headers

r.request.headers 顯示如下：

這裡我的user-agent是python-requests/2.25.1，所以很可能是被**檢測headers中user-agent後發現是不是瀏覽器的user-agent給拒絕了

所以我們可以改一下user-agent

import requests
url =
""kv =
#因為很多瀏覽器的user-agent都是mozilla/5.0，所以就用它
r = requests.get(url,headers = kv)
r.status_code

改了之後顯示 200，說明爬取成功

爬取豆瓣電影TOP250

利用css選擇器對電影的資訊進行爬取 import requests import parsel import csv import time import re class cssspider def init self self.headers defget dp self,url respon...

豆瓣Top250電影爬取

from bs4 import beautifulsoup 網頁解析，獲取資料 import re 正規表示式，進行文字匹配 import urllib.request,urllib.error 制定url，獲取網頁資料 import xlwt 進行excel操作 import sqlite3 進行...

python爬取豆瓣電影top250

簡要介紹爬取豆瓣電影top250上相關電影的資訊，包括影片鏈結影片名稱上映時間排名豆瓣評分導演劇情簡介。使用 requests etree xpath 1 檢視網頁資訊，確定爬取的內容，建立資料庫 class spiderdata peewee.model url peewee.cha...

針對爬取豆瓣top250電影失敗的問題

爬取豆瓣電影TOP250

豆瓣Top250電影爬取

python爬取豆瓣電影top250

相關推薦