1.目標站點分析:
進入**經過f12分析,url都儲存在
2.選擇爬取工具,這裡網頁比較簡單,就採用requests庫和正則.
importrequests
import
osimport
reimport
time
#主頁**
main_urls = '
';headers =
ifnot os.path.exists("
./images
"): #
如果不存在則在當前目錄下建立檔案images用來存放
os.mkdir("
./images")
#乙個以上的字元 非貪婪匹配
#imgs_url =
for i in range(1, 5):
time.sleep(1)
if i == 1:#第一頁的位址中不帶不是index1.html,要進行處理
main_url = '
'else
: main_url =main_urls.format(i)
print(main_url + "
載入中。。。")
response = requests.get(main_url, headers=headers)
#print(response.request.headers)
html =response.text#獲取到網頁**
#進行正則匹配,(.*?)進行分組獲取, .任意字元 *任意多個字元(>=0) ? 取消貪婪模式
img_urls = re.findall(r'
', html)
#print(img_urls)
for url in
img_urls:
img_name = url.split('
/')[-1] #
檔名 ,對url進行裁剪獲取做後的名字,用到負索引,這裡表示取最後乙個'/'後面的字串
#訪問所在的url
response = requests.get(url, headers=headers)
with open(
"./images/{}
".format(img_name), "wb"
) as file:
file.write(response.content)
#儲存
Python 爬取高畫質桌面桌布
今天寫了乙個指令碼用來爬取zol桌面桌布 的高畫質 如下 coding utf 8 import urllib import re import time class spider baseurl pic index 0 itemgrouppic def init self,page count t...
爬蟲爬取桌面桌布
import requests from bs4 import beautifulsoup import os import time import random import useragent interval 3 爬取的間隔時間 firstdir d netbian 總路徑 classific...
框架 MFC 修改桌面 桌布
功 能 使用 iactivedesktop 介面獲取 設定和重新整理桌面背景 桌布 開發環境 vc vs2005 vs2008 vs2010 vs2012 vs2013 新建專案 mfc應用程式 基於對話方塊 include include shlobj.h shlwapi.h 包含了對檔案判別的a...