Python爬英雄聯盟lol全英雄面板

2021-10-01 17:29:21 字數 1603 閱讀 2332

# 1.匯入所需模組

import requests

import os

# 建立lol資料夾

os.mkdir("lol")

# 2.讀取js檔案,獲取英雄id(hero_id)

url = ''

response = requests.get(url, headers=headers)

json_list= response.json()

hero_list=json_list['hero']

print("英雄總數:",len(hero_list))

try:

# 3.根據hero_id拼接url獲取該英雄**位址

for m in range(len(hero_list)):

# 英雄編號

hero_id = hero_list[m]['heroid']

print(hero_id)

# 英雄名稱

hero_name = hero_list[m]['name']

print(hero_name)

url2= ''+hero_id+'.js'

response2 = requests.get(url2, headers=headers)

json_list2 = response2.json()

img_list = json_list2['skins']

print(hero_name+"**數量:",len(img_list))

for n in range(len(img_list)):

imgpath = img_list[n]['mainimg']

if(imgpath ==""):

continue

skin_name = img_list[n]['name'].replace("/"," ")

picture = requests.get(imgpath).content

# 列印**

print('程式執行完畢!')

主要是兩個url,可以直接瀏覽器訪問,借助json格式化工具檢視

1.下面的鏈結獲取全英雄的hero_id

2.根據hero_id拼接url獲取對應英雄的**位址(mainimg的位址是大圖)

2、安妮的的**:1.js

python爬蟲 爬取英雄聯盟全英雄面板

import requests import re 1 分析目標網頁,確定爬取的url路徑,headers引數 base url headers 2 傳送請求 response requests.get base url,headers headers base data response.json...

Python爬取LOL英雄面板

python 爬蟲在官網上找到英雄 的真實鏈結,檢視多個後發現字首相同,後面對應為英雄的id和 的id,的id從00開始順序遞增,而英雄id跟網頁中的順序無關,需要找到英雄id。並沒有在 頁面和英雄頁面的元素中找到有關英雄id的內容,所以想到有可能是通過js檔案載入進來的。通過chrome工具找到跟...

LOL全英雄面板爬蟲

coding utf 8 import requests import re import os class lolspider def init self 定義乙個user agent,偽裝成瀏覽器 self.headers defgetresponse self,url 傳送請求,獲取響應 ur...