簡單實現自動化模擬人爬取京東,當然這爬不了**,**有自動化爬取監測
import timefrom selenium import webdriver
from lxml import html
etree = html.etree
# 建立物件
browner = webdriver.chrome()
browner.get('')
# 輸入搜尋內容
kw = browner.find_element_by_id("key")
kw.send_keys('華為手機')
# 點選
iconfont =browner.find_element_by_class_name('button')
iconfont.click()
# 滑動至瀏覽器下端
browner.execute_script("window.scrollto(0, document.body.scrollheight);")
time.sleep(4)
# 獲取網頁原始碼
html = browner.page_source
# 解析獲取資料
h = etree.html(html)
l = h.xpath('//ul[@class="gl-warp clearfix"]/li')
# 迴圈獲取各個物件的資料
for k in l:
price = k.xpath('./div/div[@class="p-price"]//i/text()')
name = k.xpath('./div/div[@class="p-name p-name-type-2"]/a/@title')
#獲取到的名字和**,列印出來
print(name,price)
原文:
selenium爬取京東商品
from selenium import webdriver import time import pandas as pd url browser webdriver.chrome browser.get url 找到頁面中的搜尋框,然後輸入想找的商品 browser.find element b...
商品名稱 map
輸入商品名稱和 然後按商品名稱的字典順序,輸出各商品的 輸入資料第一行乙個數字n,表示商品個數,以下n行,每行乙個字串和乙個整數,分別表示商品名稱和該商品 輸入樣例input 5 ranran 23 linlin 43 yuanyuan 59 qianqian 88 linlin 5 輸出樣例out...
爬取京東商品
一 進入京東主頁 二 進入商品詳情頁 2 商品名稱 3 商品 from selenium import webdriver 用來驅動瀏覽器的 相當於模擬人的點選事件來連續的訪問瀏覽器 from selenium.webdriver import actionchains 破解滑動驗證碼的時候用的 可...