# 1.匯入所需模組
import requests
import os
# 建立lol資料夾
os.mkdir("lol")
# 2.讀取js檔案,獲取英雄id(hero_id)
url = ''
response = requests.get(url, headers=headers)
json_list= response.json()
hero_list=json_list['hero']
print("英雄總數:",len(hero_list))
try:
# 3.根據hero_id拼接url獲取該英雄**位址
for m in range(len(hero_list)):
# 英雄編號
hero_id = hero_list[m]['heroid']
print(hero_id)
# 英雄名稱
hero_name = hero_list[m]['name']
print(hero_name)
url2= ''+hero_id+'.js'
response2 = requests.get(url2, headers=headers)
json_list2 = response2.json()
img_list = json_list2['skins']
print(hero_name+"**數量:",len(img_list))
for n in range(len(img_list)):
imgpath = img_list[n]['mainimg']
if(imgpath ==""):
continue
skin_name = img_list[n]['name'].replace("/"," ")
picture = requests.get(imgpath).content
# 列印**
print('程式執行完畢!')
主要是兩個url,可以直接瀏覽器訪問,借助json格式化工具檢視
1.下面的鏈結獲取全英雄的hero_id
2.根據hero_id拼接url獲取對應英雄的**位址(mainimg的位址是大圖)
2、安妮的的**:1.js
python爬蟲 爬取英雄聯盟全英雄面板
import requests import re 1 分析目標網頁,確定爬取的url路徑,headers引數 base url headers 2 傳送請求 response requests.get base url,headers headers base data response.json...
Python爬取LOL英雄面板
python 爬蟲在官網上找到英雄 的真實鏈結,檢視多個後發現字首相同,後面對應為英雄的id和 的id,的id從00開始順序遞增,而英雄id跟網頁中的順序無關,需要找到英雄id。並沒有在 頁面和英雄頁面的元素中找到有關英雄id的內容,所以想到有可能是通過js檔案載入進來的。通過chrome工具找到跟...
LOL全英雄面板爬蟲
coding utf 8 import requests import re import os class lolspider def init self 定義乙個user agent,偽裝成瀏覽器 self.headers defgetresponse self,url 傳送請求,獲取響應 ur...