xpath基礎學習

2021-10-08 15:32:15 字數 1032 閱讀 3788

/  路徑以/開始,該路徑表示道乙個元素的絕對路徑

/aa/cc選擇aa的所有cc子元素

//  路徑以//開頭,表示選擇文件中所有滿足//所有規則的元素,(不論層級關係)

//bb  選擇所有的bb元素

//dd//bb  選擇所有父元素是dd的預案bb元素

*  表示選擇所有由*之前的路徑所定位的元素

/aa/cc/dd/*  選擇/aa/cc/dd/下的所有元素

/*/*/*/bb   選擇有三個祖先的bb元素

表示式可以進一步指定元素,其中數字表示元素在選擇集里德位置,而last()函式則表示選擇集中的最後乙個元素

/aa/bb[1]  選擇aa的第乙個bb元素

/aa/bb[last()]  選擇aa的最有乙個bb元素

@指定屬性

//@id   選擇所有的帶有id屬性的元素

//bb[@id] 選擇帶有id屬性的bb元素

//bb[@name] 選擇有name屬性的bb元素

//bb[@*]  選擇有任意屬性的bb元素

//bb[not(@*)] 選擇沒有屬性的bb元素

//bb[@id='b1']  選擇帶有屬性id=b1的元素

normalize-space(name)  函式normalize-space用於去掉name前後空格

//bb[normalize-sapce(@name)='bb'] 選擇屬性值等於bb的元素

count() 計數所選元素的個數

//*[count(bb)=2]  選擇包含有2個bb子元素的元素

//*[count(*)2]  選擇有2個子元素的元素

name()函式返回元素名稱,start-with()  contains()

//*[name()="bb"]  選擇所有名稱為bb的元素

//*[starts-with(name(),'b')] 選擇所有名稱以b開始的元素

//*[contains(name(),'c')]  選擇所有名稱包含c的元素

//cc|//bb  選擇所有的cc和bb元素

學習筆記 XPath基礎

在xpath中經常使用的概念 1 基本值 原子值,atomic value 用於表示簡單的資料值 2 項 iterm 乙個項代表乙個節點或乙個基本值,xpath2.0引入 3 節點集 多個節點 4 序列 item和節點集就是序列,xpath2.0引入。xpath支援的節點型別 指定資料型別方法 使用...

xpath基礎語法

xpath選擇器的使用 html str 這是乙個塊標籤 網qq網一段文字 二段文字 三段文字 11段文字 22段文字 666哈哈哈 xpath也是基於lxml實現對網頁源 的解析 from lxml.html import etree 將html源 解析成為乙個文件樹物件。parser 給這次解析...

xpath解析基礎

import requests from lxml import etree if name main headers ua偽裝 例項化好了乙個etree物件,且將被解析的檔案載入到了物件中 tree etree.parse test.html r tree.xpath html body div ...