總結本人使用的是wing python ide **會放在下面
**如下(示例):
import bs4
from bs4 import beautifulsoup
import urllib.request
from urllib.request import urlopen,request
import requests
import re
**如下(示例):
#用牛肉來比喻資料處理過程
defget_html
(《牛》):
get1 = requests.session(
)#請求
html = get1.get(
《分割牛》
) soup = beautifulsoup(html.text,
'lxml'
)return soup
defget_data
(《切割過的生肉》):
#re模組洗資料
res=re.
compile
("[^(a-za-z<>= \")+]+"
)#有更好的解法
#自己按需選擇要洗的資料
re.findall(res,
《切割過的生肉》
)#輸出
print
(《熟肉》
)def
main()
: ht1 =
("") ht2 =
input()
ht1+ht2#獲得**《牛》
soup=get_html(
)#洗資料
#生肉一塊
soup.find_all(
"span",}
)#re模組再洗一次
#強行轉資料型別
str(
《未切割的生肉》
)
get_data(
《切割過的生肉》
)
main(
)
以上就是今天要講的內容
爬蟲新手心得
這兩天開始了解和學習爬蟲,在學習過程中,有以下幾個細節需要記錄 urllib這個模組的使用。在python2中,urllib分為urllib和urllib2兩個版本,我們在轉碼過程中,使用的是urllib這個,其語法為 kw urllib.urlencode 注意,urllib所接收的物件應該是字典...
python新手專案 新手練習Python專案
python毫無疑問是一門很偉大的語言,最近幾年,很多人都在python的世界裡轉悠。也有很多對程式設計有著濃厚的興趣但是不是相關專業的朋友開始學習python,這固然是好事情。但是很多時候,你只是看到了一棵樹,你以為你看到的是整個森林,尤其對於非專業的朋友來說。因此,做一些練手的專案就顯得尤為重要...
scrapy爬蟲練習
這是一篇學習的練習 1.建立工程 scrapy startproject movie2.建立爬蟲 cd movie scrapy genspider meiju meijutt.com3.自動建立目錄 4.設定資料儲存模板 items.py import scrapy class movieitem...