實驗的**
import requests
from lxml import etree
headers =
url =
''response = requests.get(url, headers=headers)
text = response.text
film_lists =
# 對資料進行抓取
defimformation()
: html = etree.html(text)
ul = html.xpath(
"//ul[@class='lists']")[
1]lis = ul.xpath(
'./li'
)for li in lis:
title = li.xpath(
'./@data-title'
) duration = li.xpath(
'./@data-duration'
) region = li.xpath(
'./@data-region'
) actors = li.xpath(
'./@data-actors'
) dicts =
# 展示資料
defshow_date()
:for i in film_lists:
for k, v in i.items():
print
(k, v)
print
('---------------------'
)if __name__ ==
'__main__'
: imformation(
) show_date(
)
實驗成果截圖
結語能新學到很多東西我很開心,希望在以後的學習生活裡能更進一步,爭取早日實現爬取更多更好的資源,能夠自己完成聚焦爬蟲的編寫!
豆瓣讀書 豆瓣電影
1.獲取豆瓣讀書頁資訊,為 如下 coding utf 8 import requests from lxml import etree 1.獲取豆瓣讀書網頁內容 headers url response requests.get url,headers headers text response....
python豆瓣影評 python 豆瓣電影爬蟲
因為 的緣故,在家甚是無聊,想著可能會做乙個和資料分析相關的畢業設計,不如就提前準備一下資料。眼光一掃,就是你了,豆瓣!說起來很有意思,我最開始寫爬蟲就是從豆瓣開始的,現在又回來了。豆瓣,這世間所有的相逢都是久別重逢。好了,不皮了,開始正題。寫爬蟲之前,首先要明確乙個問題你需要什麼資料。先有目標,再...
python爬蟲 豆瓣電影
最近學習python 順便寫下爬蟲練手 爬的是豆瓣電影排行榜 python版本2.7.6 安裝 beautiful soup sudo apt get install python bs4 安裝 requests sudo apt get install python requests下面是py a...