嗯,今天說說爬蟲

2021-09-27 08:59:39 字數 846 閱讀 3258

首先,匯入requests庫,注意,時requests,有s啊,兄弟萌,然後需要建立乙個目錄來接收你爬取下來的,所以要引入os庫,接下來,就可以爬取了,這裡呢,我們定義乙個變數,來接收url,然後呢,建立乙個根目錄,把爬取下來的放在這個根目錄下面,這裡以windows為例,畢竟窮逼測試買不起mac,然後呢,就可以把爬取下來的的絕對路徑確定了,這裡用path來表示,其實就是根目錄下的檔名,像我想要爬取的的url呢,不是.jpg結尾的,怎麼辦呢,切割一下唄,可以先以/切割,然後再用@切割,這樣,檔名就出來了。剩下的就沒啥了,爬取成功,在這記一下。寫try:except:只是為了保證**的強壯,畢竟菜雞測試,比較愛挑刺兒,不能自己寫的連自己這裡都過不去。。that』s all.

import requests

import os

url = ''

root = 'd://pic//'

path =root + url.split('/')[-1].split('@')[0]

try:

if not os.path.exists(root):

os.mkdir(root)

if not os.path.exists(path):

res = requests.get(url)

with open (path,'wb') as file:

file.write(res.content)

file.close()

print('success')

else:

print(' already exist')

except:

print('errrrrrrrrr')

今天說說String相關知識點

如何實現以及特性 string類被final修飾,所以string不可被繼承,integer等等的包裝類都不可以被繼承。jdk1.8中,string底層使用final修飾的char陣列來儲存字串 private final char value jdk1.9之後,底層使用final修飾的byte陣列...

一顆不甘的心 今天,說說自己

已是夜晚,白天的忙碌總會在夜晚感覺惆悵和迷茫。不禁想點根菸,左手不知什麼時候已拿著火機。85後的我,即將奔三。奔三 對於現在的我,是個沉重的話題。作為過來人有個感觸,26歲似乎是乙個分水嶺。26歲以前內心底都會認為自己20出頭 26歲以後突然就有 奔三 的感覺。這種急劇的轉變讓我猝不及防。而立之年,...

今天說一下Top

top這個關鍵字,大家都不陌生 尤其是很多時候開啟ssms的時候右鍵表名,選擇前1000行的時候,就可以見到編譯出來的語句 select top 1000 from 好 我們先看看top 的語法 top expression percent with ties top 關鍵字支援實際行數 top 5...