Python爬蟲系列(5)XPath語法

2021-10-02 15:19:33 字數 1024 閱讀 8356

xpath是一門在xml和html文件中查詢資訊的語言,可用來在xml和html文件中對元素和屬性進行遍歷

表示式描述

示例結果

nodename

選取此節點的所有子節點

bookstore

選取bookstore下所有的子節點

/如果在最前面,代表從根節點擊取,否則選擇某節點下的某個節點

/bookstore

選取根元素下所有bookstore節點

//從全域性節點中選擇節點,隨便在哪個位置

//book

從全域性節點中找到所有book節點

@選取某個節點的屬性

//book[@price]

選擇所有book節點的price屬性

謂語用來查詢某個特定的節點或者包含某個指定值的節點被嵌在方括號中。

在下面的**中,我們列出了所有帶有謂語的一些路徑表示式,以及表示式的結果:

路徑表示式

描述/bookstore/book[1]

選取bookstore下的第乙個子元素

/bookstore/book[last()]

選取bookstore下的倒數第二個book元素

/bookstore/book[position() < 3]

選取bookstore下前面的兩個子元素

//book[@price]

選取擁有price屬性的book元素

//book[@price=10]

選取所有屬性price等於10的book元素

*表示萬用字元

萬用字元描述

示例結果

*匹配任意節點

/bookstore/*

選取bookstore下的所有節點

@*匹配節點中的任何屬性

//book[@*]

選取所有帶有屬性的book元素

| 選取所有帶有屬性的book元素 |

Python爬蟲系列

部落格 python,爬蟲 由於近來學 lan 業 ai 繁 fa 忙 zuo 快乙個月沒有更新部落格了。這周完成了兩門課的結課考試,現下時間開始變得充裕。準備梳理一下前段時間學習的關於python爬蟲的內容,權當複習鞏固知識。而初次學習時遇到的疑難雜症,那時候的應對策略是抓大放下,在這梳理過程會下...

Python爬蟲系列 開端

網路爬蟲,顧名思義,是從網路上爬取特定資訊的工具。開發環境 乙個完整的爬蟲,一般包含以下四部分或其中幾個部分 主函式spiderurl管理器url manger網頁解析器html parser內容輸出器outputerbeautifulsoup 解析網頁 requests 或 urllib2 獲取網...

Python 爬蟲系列(一)

1 為了省去時間投入學習,推薦直接安裝整合環境 anaconda 2 ide pycharm pydev 3 工具 jupyter notebook 安裝完anaconda會有的 1 瘋狂的python 快速入門精講 python2.x,可體驗到與python3.x的差異 看完這些課程,自己對pyt...