一、xpath即為xml路徑語言,它是一種用來確定xml(標準通用標記語言的子集)文件中某部分位置的語言。xpath基於xml的樹狀結構,提供在資料結構樹中找尋節點的能力,被開發者採用來當作小型查詢語言。
1、 在 xpath 中,有七種型別的節點:元素、屬性、文字、命名空間、處理指令、注釋以及文件(根)節點。
1) 節點(node)
xml 文件是被作為節點樹來對待的。樹的根被稱為文件節點或者根節點。
<?xml version="1.0" encoding="iso-8859-1"?>
lang="en">harry pottertitle>
j k. rowlingauthor>
2005year>
29.99price>
book>
bookstore>
上面的xml文件中的節點例子:
(文件節點)
j k. rowlingauthor> (元素節點)
lang="en" (屬性節點)
2) 基本值(或稱原子值,atomic value)
基本值是無父或無子的節點。
基本值的例子:
j k. rowling
"en"
3)專案(item)
專案是基本值或者節點。
2、節點關係
父(parent): 每個元素以及屬性都有乙個父。
子(children): 元素節點可有零個、乙個或多個子。
同胞(sibling): 擁有相同的父的節點。
先輩(ancestor):某節點的父、父的父,等等。
後代(descendant):某個節點的子,子的子,等等。
二、xpath 使用路徑表示式來選取 xml 文件中的節點或節點集。節點是通過沿著路徑 (path) 或者步 (steps) 來選取的。
表示式描述nodename
選取此節點的所有子節點。
/從根節點擊取。
//從匹配選擇的當前節點擊擇文件中的節點,而不考慮它們的位置。
.選取當前節點。
..選取當前節點的父節點。
@選取屬性。
<?xml version="1.0" encoding="iso-8859-1"?>
lang="eng">harry pottertitle>
29.99price>
book>
lang="eng">learning xmltitle>
39.95price>
book>
bookstore>
路徑表示式
結果bookstore
選取 bookstore 元素的所有子節點。
/bookstore
選取根元素 bookstore。
注釋:假如路徑起始於正斜槓( / ),則此路徑始終代表到某元素的絕對路徑!
bookstore/book
選取屬於 bookstore 的子元素的所有 book 元素。
//book
選取所有 book 子元素,而不管它們在文件中的位置。
bookstore//book
選擇屬於 bookstore 元素的後代的所有 book 元素,而不管它們位於 bookstore 之下的什麼位置。
//@lang
選取名為 lang 的所有屬性。
徑表示式
結果/bookstore/book[1]
選取屬於 bookstore 子元素的第乙個 book 元素。
/bookstore/book[last()]
選取屬於 bookstore 子元素的最後乙個 book 元素。
/bookstore/book[last()-1]
選取屬於 bookstore 子元素的倒數第二個 book 元素。
/bookstore/book[position()<3]
選取最前面的兩個屬於 bookstore 元素的子元素的 book 元素。
//title[@lang]
選取所有擁有名為 lang 的屬性的 title 元素。
//title[@lang=』eng』]
選取所有 title 元素,且這些元素擁有值為 eng 的 lang 屬性。
/bookstore/book[price>35.00]
選取 bookstore 元素的所有 book 元素,且其中的 price 元素的值須大於 35.00。
/bookstore/book[price>35.00]/title
選取 bookstore 元素中的 book 元素的所有 title 元素,且其中的 price 元素的值須大於 35.00。
萬用字元描述
*匹配任何元素節點。
@*匹配任何屬性節點。
node()
匹配任何型別的節點。 如:
路徑表示式
結果/bookstore/*
選取 bookstore 元素的所有子元素。
//*選取文件中的所有元素。
//title[@*]
選取所有帶有屬性的 title 元素。
/bookstore/book/title | //price
選取屬於 bookstore 元素的 book 元素的所有 title 元素,以及文件中所有的 price 元素。
軸名稱結果
ancestor
選取當前節點的所有先輩(父、祖父等)。
ancestor-or-self
選取當前節點的所有先輩(父、祖父等)以及當前節點本身。
attribute
選取當前節點的所有屬性。
child
選取當前節點的所有子元素。
descendant
選取當前節點的所有後代元素(子、孫等)。
descendant-or-self
選取當前節點的所有後代元素(子、孫等)以及當前節點本身。
following
選取文件中當前節點的結束標籤之後的所有節點。
namespace
選取當前節點的所有命名空間節點。
parent
選取當前節點的父節點。
preceding
選取文件中當前節點的開始標籤之前的所有節點。
preceding-sibling
選取當前節點之前的所有同級節點。
self
選取當前節點。
ancestor::book
選擇當前節點的所有 book 先輩。
ancestor-or-self::book
選取當前節點的所有 book 先輩以及當前節點(如果此節點是 book 節點)
child::*/child::price
選取當前節點的所有 price孫節點。
XPath的簡單介紹以及使用
xpath 是一門在 xml 文件中查詢資訊的語言。xpath它可以用來在 xml 文件中對元素和屬性進行遍歷。要使用xpath首先需要安裝lxml,在終端輸入如下命令即可 pip install lxml 什麼是xpath?首先先來介紹下xml,它是用來儲存和傳輸資料使用的。和html的不同有以下...
xpath常用介紹
介紹下什麼是xpath 1.xpath使用路徑表示式在xml和html中進行導航 2.xpath中包含了一些標準函式庫 3.xpath是乙個w3c的標準 xpath中可以像css的選擇器一樣使用,能夠在頁面頁面當中選擇出來想要選擇的元素 下面列出了一些xpath的常用的選擇 article 選取所有...
XPath 簡單語法
xpath 是xml的查詢語言,和sql的角色很類似。以下面xml為例,介紹xpath 的語法。empire burlesque bob dylan 10.90 hide your heart bonnie tyler 9.90 greatest hits dolly parton 9.90 定位節...