商城商品爬取

2021-10-04 08:34:05 字數 1887 閱讀 1428

from

selenium

import

webdriver

import

time

import

csv#

接受使用者輸入

,訪問京東

pro=

input

("請輸入要爬取的商品:"

)driver

=webdriver

.chrome()

driver

.get

("")i

=1#傳送文字到搜尋框

,text

=driver

.find_element_by_class_name

("text"

)text

.send_keys

(pro

)button

=driver

.find_element_by_class_name

("button"

)button

.click()

time

.sleep(1

)while

true:

#動態載入--

>

全部載入

#執行指令碼

,進度條拉到底部

driver

.execute_script('

window

.scrollto(0

,\document

.body

.scrollheight)'

)time

.sleep(2

)#正常解析爬取

r_list

=driver

.find_elements_by_xpath\(

'//div[@id="j_goodslist"]//li')#

r為每乙個商品的節點物件

forr

inr_list:m=

r.text

.split

('\n')#

["¥52.80"

,"python..."

,"200+",]

ifm[1

]!="拍拍"

:price=m

[0]name=m

[1]commit=m

[2]market=m

[3]else:

price=m

[0]name=m

[2]commit=m

[3]market

="拍拍"

with

open

("商品.csv"

,"a"

,newline=""

,encoding

="gb18030")as

f:writer

=csv

.writer(f

)l=[

name.strip(),price.strip(),

commit.strip(),market.strip()

] writer

.writerow(l

)print

("第%d頁爬取成功"%i

)i+=

1#ifdriver

.page_source

.find

("pn-next disabled")=

=-1:

driver

.find_element_by_class_name

("pn-next").

click()

time

.sleep(1

)else:

print

("抓取結束,共抓取%d頁"%i

)break

爬取京東商城商品資訊

from selenium import webdriver from selenium.webdriver import actionchains 獲取屬性 from selenium.webdriver.common.keys import keys from selenium.webdrive...

selenium 爬蟲爬取京東商城商品資訊

看完用selenium爬取 商品資訊的網課,於是乎想著自己也整乙個selenium程式來爬取京東以作鞏固。寫了幾個小時的 通過不斷除錯,學到了很多細節上的處理,完整 在下方,使用時修改搜尋的引數就可以開始爬取了,事先要安裝goole chrome的驅動。最終爬取的結果儲存在了products陣列中,...

爬取京東商品

一 進入京東主頁 二 進入商品詳情頁 2 商品名稱 3 商品 from selenium import webdriver 用來驅動瀏覽器的 相當於模擬人的點選事件來連續的訪問瀏覽器 from selenium.webdriver import actionchains 破解滑動驗證碼的時候用的 可...