小豬短租住房資訊爬取

爬蟲練習：

對小豬短租的住房資訊爬取

import requests                              #小豬短租住房詳情爬取
from bs4 import beautifulsoup
url=requests.get(
'')soup = beautifulsoup(url.text,
'lxml'
)titles = soup.select(
'div.wrap.clearfix.con_bg > div.con_l > div.pho_info > h4 > em')[
0].text
address= soup.select(
'div.wrap.clearfix.con_bg > div.con_l > div.pho_info > p > span')[
0].text
prices = soup.select(
'div.day_l > span')[
0].text
host_imgs  = soup.select(
'div.js_box.clearfix > div.member_pic > a > img')[
0].get(
'src'
)***s = soup.select(
'div.js_box.clearfix > div.w_240 > h6 > span')[
0].get(
'class'
)names = soup.select(
'#floatrightbox > div.js_box.clearfix > div.w_240 > h6 > a')[
0].text
print
(titles)
print
(address)
print
(prices)
print
(host_imgs)
print
(***s)
print
(names)
defhost_xb
(class_name)
:if class_name ==
'member_boy_ico'
:return
'男'else
:return
'女'dict1=
page_link=
# 每個詳情頁的鏈結都存在這裡，解析詳情的時候就遍歷這個列表然後訪問就好啦~
defget_page_link
(page_number)
:#輸入需要爬取的頁碼後，得到每頁下每個商品詳情
for each_number in
range(1
,page_number)
:#頁碼迴圈
full_link =
''.format
(each_number)       
get_link = requests.get(full_link)
soup = beautifulsoup(get_link.text,
'lxml'
)for each_url in soup.select(
'span.result_img > a'):
'href'
))

爬小豬短租發布的房子資訊

通過輸入國內，國外，城市名只能抓取13頁的資訊。木鳥短租可以嘗試抓取，主要裡面有文章 import requests,re,time from lxml import etree 城市列表獲取每個城市的url url 獲取城市名稱的鏈結 ser input 輸入你要查詢的地區 1 國內 2 海外 ...

爬蟲專案1 爬取小豬短租資料

看了這個大神的部落格爬蟲專案合集,自己也動手實踐一下請求 requests 解析 xpath 非常簡單,直接放 import requests from lxml import etree source url 以北京地區為例 headers 請求頭比較簡單,如果被識別可以換為更複雜的多加幾個...

Python爬蟲入門 5 爬取小豬短租租房資訊

小豬短租是乙個租房上面有很多優質的民宿出租資訊，下面我們以成都地區的租房資訊為例，來嘗試爬取這些資料。小豬短租成都頁面按照慣例，先來爬下標題試試水，找到標題，複製xpath。多複製幾個房屋的標題 xpath 進行對比 id page list ul li 1 div 2 div a span...

小豬短租住房資訊爬取

爬小豬短租發布的房子資訊

爬蟲專案1 爬取小豬短租資料

Python爬蟲入門 5 爬取小豬短租租房資訊

相關推薦