新手爬蟲練習

2021-10-11 01:27:19 字數 1082 閱讀 3001

總結本人使用的是wing python ide **會放在下面

**如下(示例):

import bs4

from bs4 import beautifulsoup

import urllib.request

from urllib.request import urlopen,request

import requests

import re

**如下(示例):

#用牛肉來比喻資料處理過程

defget_html

(《牛》):

get1 = requests.session(

)#請求

html = get1.get(

《分割牛》

) soup = beautifulsoup(html.text,

'lxml'

)return soup

defget_data

(《切割過的生肉》):

#re模組洗資料

res=re.

compile

("[^(a-za-z<>= \")+]+"

)#有更好的解法

#自己按需選擇要洗的資料

re.findall(res,

《切割過的生肉》

)#輸出

print

(《熟肉》

)def

main()

: ht1 =

("") ht2 =

input()

ht1+ht2#獲得**《牛》

soup=get_html(

)#洗資料

#生肉一塊

soup.find_all(

"span",}

)#re模組再洗一次

#強行轉資料型別

str(

《未切割的生肉》

)

get_data(

《切割過的生肉》

)

main(

)

以上就是今天要講的內容

爬蟲新手心得

這兩天開始了解和學習爬蟲,在學習過程中,有以下幾個細節需要記錄 urllib這個模組的使用。在python2中,urllib分為urllib和urllib2兩個版本,我們在轉碼過程中,使用的是urllib這個,其語法為 kw urllib.urlencode 注意,urllib所接收的物件應該是字典...

python新手專案 新手練習Python專案

python毫無疑問是一門很偉大的語言,最近幾年,很多人都在python的世界裡轉悠。也有很多對程式設計有著濃厚的興趣但是不是相關專業的朋友開始學習python,這固然是好事情。但是很多時候,你只是看到了一棵樹,你以為你看到的是整個森林,尤其對於非專業的朋友來說。因此,做一些練手的專案就顯得尤為重要...

scrapy爬蟲練習

這是一篇學習的練習 1.建立工程 scrapy startproject movie2.建立爬蟲 cd movie scrapy genspider meiju meijutt.com3.自動建立目錄 4.設定資料儲存模板 items.py import scrapy class movieitem...