記爬取某乙個小說

2021-10-02 18:49:33 字數 2193 閱讀 2303

咳,寒假無聊看起**,收費章節,日常盜版。。。

然後一搜一堆廣告看著就煩人噢

py爬蟲系列

import requests

import time

from bs4 import beautifulsoup

header=

defgethtmltext

(url)

:#照抄就完事了

try:

r = requests.get(url=url, timeout=30)

r.raise_for_status(

)# 產生異常資訊

return r.text

except

:print

("網頁爬取失敗"

)return

""def

getstochlist

(lst,stockurl)

: html=gethtmltext(stockurl)

#得到原始碼

#print(html)

soup=beautifulsoup(html,

'html.parser'

)#解析

# a = soup.select('a[class="js-photo-link photo-item__link"')

a=soup.find(id=

'content'

).text.replace(

" "

,"\n"

)#找到**div

b="\n"

+str

(soup.title)[7

:-12]

+"\n"

#print(str(b)[7:-12])

#print(a)

return

""def

getstochinfo

(lst, path)

:with

open

(path,

'a',encoding=

"utf-8"

)as f:

f.write(lst[1]

) f.write(lst[0]

)return

""def

getnextchapter

(url)

:list=[

] html = gethtmltext(url)

# 得到原始碼

# print(html)

soup = beautifulsoup(html,

'html.parser'

)# 解析

a=soup.find_all(

'a')

for i in a:

b=i.attrs[

'href']if

'.html'

in b:

list

"/")[-

1])return

list[-

1]defmain

(url,path)

: list =

getstochlist(list, url)

# 解析網頁

214#爬取頁數 就一頁

path=

'd://deskpe//**//我的細胞監獄.txt'

#儲存路徑

for i in

range

(depth)

:try

: a=main(url+a,path)

print

('\r當前速度:%'

.format

((i/depth)

*100

), end='')

time.sleep(3)

except arithmeticerror:

print

("出錯了"

)

python爬取某一小說

經過幾天的學習簡單寫乙個爬取 的 試試結果,可惜爬取得有些慢,下面是 coding utf 8 import urllib2,urllib import re import sys from bs4 import beautifulsoup import random reload sys sys....

新增某乙個圓角,和某乙個邊框

為所有uiview的繼承類,切割圓角,新增任意邊框 因為這兩個功能未必要同時使用,所以是分開的兩個檔案 圓角 需要 import uiview gfcorner.h 使用 如下 img cornerwithradius 10 direction cornerdirectiontypebottom c...

使用git合併某乙個版本的某乙個分支

使用命名 使用場景 我們有個穩定版本的分支,叫v2.0,另外還有個開發版本的分支v3.0,我們不能直接把兩個分支合併,這樣會導致穩定版本混亂,但是又想增加乙個v3.0中的功能到v2.0中,這裡就可以使用cherry pick了,其實也就是對已經存在的commit 進行再次提交.使用說明 git ch...