小豬短租住房資訊爬取

2021-10-03 12:51:54 字數 1686 閱讀 4977

爬蟲練習:

對小豬短租的住房資訊爬取

import requests                              #小豬短租住房詳情爬取

from bs4 import beautifulsoup

url=requests.get(

'')soup = beautifulsoup(url.text,

'lxml'

)titles = soup.select(

'div.wrap.clearfix.con_bg > div.con_l > div.pho_info > h4 > em')[

0].text

address= soup.select(

'div.wrap.clearfix.con_bg > div.con_l > div.pho_info > p > span')[

0].text

prices = soup.select(

'div.day_l > span')[

0].text

host_imgs = soup.select(

'div.js_box.clearfix > div.member_pic > a > img')[

0].get(

'src'

)***s = soup.select(

'div.js_box.clearfix > div.w_240 > h6 > span')[

0].get(

'class'

)names = soup.select(

'#floatrightbox > div.js_box.clearfix > div.w_240 > h6 > a')[

0].text

print

(titles)

print

(address)

print

(prices)

print

(host_imgs)

print

(***s)

print

(names)

defhost_xb

(class_name)

:if class_name ==

'member_boy_ico'

:return

'男'else

:return

'女'dict1=

page_link=

# 每個詳情頁的鏈結都存在這裡,解析詳情的時候就遍歷這個列表然後訪問就好啦~

defget_page_link

(page_number)

:#輸入需要爬取的頁碼後,得到每頁下每個商品詳情

for each_number in

range(1

,page_number)

:#頁碼迴圈

full_link =

''.format

(each_number)

get_link = requests.get(full_link)

soup = beautifulsoup(get_link.text,

'lxml'

)for each_url in soup.select(

'span.result_img > a'):

'href'

))

爬小豬短租發布的房子資訊

通過輸入國內,國外,城市名只能抓取13頁的資訊。木鳥短租可以嘗試抓取,主要裡面有文章 import requests,re,time from lxml import etree 城市列表 獲取每個城市的url url 獲取城市名稱的鏈結 ser input 輸入你要查詢的地區 1 國內 2 海外 ...

爬蟲專案1 爬取小豬短租資料

看了這個大神的部落格 爬蟲專案合集,自己也動手實踐一下 請求 requests 解析 xpath 非常簡單,直接放 import requests from lxml import etree source url 以北京地區為例 headers 請求頭比較簡單,如果被識別可以換為更複雜的 多加幾個...

Python爬蟲入門 5 爬取小豬短租租房資訊

小豬短租是乙個租房 上面有很多優質的民宿出租資訊,下面我們以成都地區的租房資訊為例,來嘗試爬取這些資料。小豬短租 成都 頁面 按照慣例,先來爬下標題試試水,找到標題,複製xpath。多複製幾個房屋的標題 xpath 進行對比 id page list ul li 1 div 2 div a span...