爬取少年的你的豆瓣短評

首先這是目標網頁，然後為了簡單決定用最快的提取辦法，我一直覺得爬蟲不一定需要多複雜，往往簡單的幾行**就能完成我們的需求。

決定用requests爬取10頁，然後正則提取，資料存到csv中。

直接上**

import requests
import pandas as pd
import re
defget_content
(url)
:    headers =
response=requests.get(url,headers=headers)
response.encoding =
'utf-8'
html=response.text
content=re.findall(r"(.*?)"
,html)
name=re.findall(
"(.*?)"
,html)
return content,name
defmain()
:    name=
content=
for i in
range(10
):url =
''.format
(i*20
)        i,j=get_content(url)
for x in
range
(len
(i)):)
)    data=pd.dataframe(
)    data.to_csv(
,encoding=
'utf-8'
)if __name__ ==
'__main__'
:    main(
)

python爬取豆瓣網頁短評實戰！

首先我們開啟我的父親母親的網頁介面鏈結可以觀察到如下介面以及讀者對本書的評價接下來我們直接附上書名我的父親母親出版社南海出版公司原作名 alfred and emily 譯者匡詠梅出版年 2013 1 頁數 238 定價 29.50元裝幀精裝叢書新經典文庫萊辛作品 is...

爬取《小王子》豆瓣短評前5頁的短評資料

思考一下，以下還有什麼更加簡潔的寫法？import requests from lxml import etree import pandas as pd urls format str i for i in range 1,6 通過觀察的url翻頁規律，使用for迴圈得到5個鏈結，儲存到urls...

爬取豆瓣讀書的書籍（一）

環境準備 python3 pycharm 2018.3.4 x64 google chrome瀏覽器爬取豆瓣讀書書籍的基本步驟 1 在pycharm中匯入urllib模組的request 2 獲取豆瓣讀書網的url資訊和user agent 3 用urlopen開啟並傳送請求 4 用urlret...

爬取少年的你的豆瓣短評

python爬取豆瓣網頁短評實戰！

爬取《小王子》豆瓣短評前5頁的短評資料

爬取豆瓣讀書的書籍（一）

相關推薦