Python爬蟲系列 51job爬蟲(二)

2021-08-17 05:18:06 字數 988 閱讀 9875

利用for迴圈爬取多頁資料並匯出到excel**。

#匯入一些工具包

import requests

from lxml import etree

from pandas import dataframe

import pandas as pd

jobinfoall=dataframe()

for i in range(1,6):

url=""+str(i)+".html"

res=requests.get(url)

res.encoding='gbk'

#定義乙個節點樹的根

root=etree.html(res.text)

#利用xpath查詢網頁資訊

position=root.xpath('//div[@class="el"]/p/span/a/@title')

company=root.xpath('//div[@class="el"]/span/a/@title')

place=root.xpath('//div[@class="el"]/span[@class="t3"]/text()')

salary=root.xpath('//div[@class="el"]/span[@class="t4"]/text()')

#把取出的資訊放到資料框

jobinfo=dataframe([position,company,place,salary]).t

jobinfo.columns=['職位名','公司名','地點','薪資']

Python爬蟲之51job招聘資料資訊爬取實戰

資料爬蟲對於資料分析從業者來說是必不可少的一項基礎能力,學習python的首選我也是從編寫乙個合格的爬蟲開始的,實際的工作中經常也會遇到需要從網路上採集資料進行分析的需求,這時候就需要自己動手編寫爬蟲了。在我之前的文章 boss直聘資料採集 解析處理 分析與視覺化實戰 中,詳細地講解了基於boss直...

python爬蟲 爬取51job網招聘資訊

專案概覽 在搜尋頁中,所有符合條件的職位資訊以列表的形式排序設有分頁顯示。每條職位資訊是乙個url 位址,通過url 位址可以進入該職位的詳情頁。職位詳情頁也是資料爬取的頁面,爬取的資料資訊有 職位名稱 企業名稱 待遇 福利以及職位要求等等。專案框架 具體步驟 一 獲取城市編號def get cit...

簡易爬蟲爬取51job招聘資訊

目標 上的python相關招聘資訊 入門級別 import re import urllib.request class grab object 定義類屬性 num 0 def init self 請求的 self.url 請求頭 self.headers defopenurl self 建立請求物...