** 樓主也才學習python半年,寫下在這個部落格算是對自己成長的記錄和提高吧,歡迎小夥伴們一起**,共同提高。**
** 話不多說,這個爬蟲的目的是將某桌布**上的爬取下來,並儲存在本地。所以我們需要beautifulsoup庫和os庫,以及requests庫**
首先桌布**url = 『
url = ''
urls = [url+str(x)+'.html'for x in range(7)]
root = 'd://pics//自然風光//'
hrefs =
for url in urls:
r = requests.get(url)
r.raise_for_status()
html = r.text
#利用beautifulsoup庫解析頁面
soup = beautifulsoup(html,'html.parser')
#找到div class=main-wrap標籤
im = soup.find('div',attrs=)
#在div class=main-wrap標籤找到img標籤
imgs = im.find('img')
#把新增進hrefs列表
for href in hrefs:
path = root+href.split('/')[-1]
try:
if not os.path.exists(root):
os.makedirs(root)
if not os.path.exists(path):
r = requests.get(href)
with open(path,'wb')as f:
f.write(r.content)
f.close()
print('done')
else:
print('already got')
except:
print('error')
python抓取zol付費桌布
僅限技術交流,禁止任何商業用途 學習了jack cui的爬蟲文章,頗有收穫。拿來練練手。點開第一張桌布 用到的兩個重要庫 selenium 和beautifulsoup,對庫不熟悉的,建議看學習一下。當乙個圖集結束時,再點下一張是會異常的,因為此時,控制項是不可見狀態的。這時候,繼續分析網頁 可以發...
python 爬蟲 基本抓取
首先,python中自帶urllib及urllib2這兩個模組,基本上能滿足一般的頁面抓取,另外,requests 也是非常有用的。對於帶有查詢欄位的url,get請求一般會將來請求的資料附在url之後,以?分割url和傳輸資料,多個引數用 連線。data requests data為dict,js...
python 爬蟲,抓取小說
coding utf 8 from bs4 import beautifulsoup from urllib import request import re import os,time 訪問url,返回html頁面 defget html url req request.request url ...