python簡單爬蟲(pycharm)(二)
我們來把他的文字,也就是
標籤下的東西給爬出來。
比如這一段,注意那句:
這裡選用beautifulsoup包。
首先開啟cmd,進入安裝python的資料夾下的script資料夾:
然後正常的安裝:
pip install beautifulsoup4
裝完長這樣:
url = '' #這裡的url就是通過開發者工具找到的網頁的請求資訊裡的request url
res = requests.get(url) #requests後面的方法要根據網頁的請求資訊來判斷
res.encoding='utf-8' #可加可不加,爬蟲結果亂碼,可以用這個**更正
soup = beautifulsoup(res.text) #利用beautifulsoup對爬到的資料進行分析
for item in soup.select('p'): #選出所有標籤
try:
print(item) #列印所有標籤
except oserror:
pass
continu
執行結果:
注意那句:
「to build gem5,we will use scons.」
乙個小的python爬蟲就做好了。
python爬蟲簡單 python爬蟲 簡單版
學過python的帥哥都知道,爬蟲是python的非常好玩的東西,而且python自帶urllib urllib2 requests等的庫,為爬蟲的開發提供大大的方便。這次我要用urllib2,爬一堆風景。先上重點 1 response urllib2.urlopen url read 2 soup...
簡單python爬蟲
一段簡單的 python 爬蟲程式,用來練習挺不錯的。讀出乙個url下的a標籤裡href位址為.html的所有位址 一段簡單的 python 爬蟲程式,用來練習挺不錯的。讀出乙個url下的a標籤裡href位址為.html的所有位址 usr bin python filename test.py im...
Python簡單爬蟲
一.獲取整個頁面的資料 coding utf 8 import urllib defgethtml url page urllib.urlopen url html page.read return html html gethtml print html 二.篩選需要的資料 利用正規表示式來獲取想...