Python程式設計爬小說《星辰變》

看的第一本** 懷舊一下 hhhhh

**如下 ( 使用正規表示式進行匹配 )

#**爬蟲 《星辰變》
import re 
import requests
url=""     #**目錄
txt=requests.get(url).content.decode("utf-8")
j=re.compile(r"(.+?)
") #匹配正則
ml=j.findall(txt)
mlist=[(i[1],url+i[0]) for i in ml]    #將章節和**儲存成列表mlist ， 
#print(mlist)
with  open("11.txt","w",encoding="utf-8") as f:
for i in mlist:
t1=requests.get(i[1]).content.decode("utf-8",errors="ignore")   #忽略錯誤
zw1=re.compile(r'tent">(.+?)')            #正則匹配正文部分
zw=zw1.findall(t1)[0]
zw=zw.replace(" ","")    #因為解碼格式不同 將亂碼替換掉
zw=zw.replace("
","")
zw=zw.replace("","")
zw=zw.replace("readx();","")
f.write(i[0]+"\n\n\n")
f.write(zw+"\n\n\n")

Python爬取小說

感覺這個夠蛋疼的，因為你如果正常寫的話，前幾次執行沒問題，之後你連都沒改，再執行就出錯了。其實這可能是網路請求失敗，或者有反爬蟲的東西吧。但這就會讓你寫的時候非常苦惱，所以這這東西，健壯性及其重要！import requests from bs4 import beautifulsoup impo...

python 爬取小說

前些天突然想看一些可能是因為壓力大，所以就要有補償機制吧。為了節省流量，就想著把內容爬下來，然後就可以在路上看了。於是有了下面的指令碼。usr bin env python coding utf 8 import requests from lxml import etree 為了解決unicod...

python爬取小說

一準備安裝 requests pyquery庫二使用定義了search類初始化時傳入第一章url 和名即可再呼叫all content方法即可 coding utf8 import re import requests from requests.exceptions import...

Python程式設計 爬小說《星辰變》

Python爬取小說

python 爬取小說

python爬取小說

相關推薦

Python程式設計爬小說《星辰變》