附件:非同步請求返回的品牌導航欄html
環境:python3.6
scrapy1.5.1
採用scrapy建立專案,ide為pycharm
1、進入主頁、測試待爬取內容是否為動態載入
通過爬取產品庫首頁品牌列表爬取汽車品牌鏈結,產品庫**,通過scrapy shell測試內容是否是動態載入的,動態載入的爬取不到
scrapy shell ""
2、找到動態請求
shell訪問後發現頁面元素取不到,證明是動態載入,於是開啟f12檢視重新整理頁面,檢視所有請求,挨個找到載入品牌列表的鏈結,發現是乙個.net請求的品牌列表,返回html
asleftmenu/as_leftlistnew.ashx?typeid=1%20&brandid=0%20&fctid=0%20&seriesid=0
3、shell測試請求
再次通過shell檢視是否可以獲取內容
scrapy shell "asleftmenu/as_leftlistnew.ashx?typeid=1%20&brandid=0%20&fctid=0%20&seriesid=0"
in [2]: response.xpath("//h3")
out[2]:
[a b
c d
f g
h i
j k
l m
n o
p q
r s
t w
x y
z
Python爬蟲入門實戰一
最近學習了點python爬蟲,現在寫乙個實戰演示記錄一下學習歷程!我開發python用的ide是jetbrains公司的pycharm,該ide非常方便實用。第一步 直接複製想要爬取的網頁的源 下來放到python的工程目錄下的source.ext檔案。第二步 分析所要爬取得內容 由於想要爬取得內容...
python爬蟲實戰
python python基礎 python快速教程 python學習路線圖 python大資料學習之路 python爬蟲實戰 python pandas技巧系 量化小講堂 python機器學習入門資料梳理 學習群 大資料 python資料探勘2 323876621 r r語言知識體系 怎樣學習r ...
python爬蟲實戰 爬取汽車之家上車型價格
import pymysql import pymysql.cursors from bs4 import beautifulsoup import requests import random import time from selenium import webdriver from sele...