基本的xpath語法類似於在乙個檔案系統中定位檔案,如果路徑以斜線 / 開始, 那麼該路徑就表示到乙個元素的絕對路徑:
/aaa
選擇根元素aaa
/aaa/ccc
選擇aaa 的所有ccc子元素
//bbb
選擇所有bbb元素
//ddd/bbb
選擇所有父元素是ddd的bbb元素
星號 * 表示選擇所有由星號之前的路徑所定位的元素
/aaa/ccc/ddd/*
選擇所有路徑依附於/aaa/ccc/ddd 的元素
/*/*/*/bbb
選擇所有的有3個祖先元素的bbb元素
選擇所有元素
/aaa/bbb[1]
選擇aaa 的第乙個bbb子元素
/aaa/bbb[last()]
選擇aaa 的最後乙個bbb子元素
//@id
選擇所有的id屬性
//bbb[@name]
選擇有name屬性的bbb元素
//bbb[@*]
選擇有任意屬性的bbb元素
//bbb[@id='b1']
選擇含有屬性id且其值為'b1'的bbb元素
//bbb[@name='bbb']
選擇含有屬性name且其值為'bbb'的bbb元素
//bbb[normalize-space(@name)='bbb']
選擇含有屬性name且其值(在用normalize-space函式去掉前後空格後)為'bbb'的bbb元素
//*[count(bbb)=2]
選擇含有2個bbb子元素的元素
//*[string-length(name()) = 3]
選擇名字長度為3的元素
//ccc | //bbb
選擇所有的ccc和bbb元素
/aaa
等價於 /child::aaa
/descendant::*
選擇文件根元素的所有後代.即所有的元素被選擇
/aaa/bbb/descendant::*
選擇/aaa/bbb 的所有後代元素
//ddd/parent::*
選擇ddd元素的所有父節點
< bbb/>
< ccc/>
< bbb/>
< bbb/>
< ddd>
< bbb/>
< ccc/>
xpath用法詳解
選擇不包含class屬性的節點 result article.xpath span not class 選擇不包含class和id屬性的節點 result article.xpath span not class and not id 選擇不包含class expire 的span result a...
詳解xpath定位
xpath定位 1 通過開發者工具直接copy 右擊copy copy xpath 2 串聯的方式定位元素 3 通過父元素定位子元素 from selenium import webdriver from time import sleep driver webdriver.chrome drive...
使用 XPath 解析 HTML 文件
原文 使用xpath解析html文件 xpath 的全稱是 xml path language,即 xml 路徑語言,它是一種在結構化文件 比如 xml 和 html 文件 中定位資訊的語言,關於 xpath 的介紹可以參考 後面我們將以下面的 html 文件介紹 xpath 的使用。下表是 xpa...