Xpath使用方法

什麼是xpath？

xpath是xml的路徑語言，通俗一點講就是通過元素的路徑來查詢到這個標籤元素。

工具

xpath使用方法

注：預設死格式先寫 //* 代表定位頁面下所有元素

1、xpath支援id、class、name定位功能

1）、通過id定位

//*[@id='kw']

2）、通過class定位

//*[@class='class_name']

3）、通過name定位

//*[@name='name']

2、如果標籤沒有id、class、name三總屬性，xpath還支援屬性定位功能

@代表以屬性定位，後面可以接標籤中任意屬性

//*[@other='attribute']

3、當標籤的屬性重複時，xpath提供了通過標籤來進行過濾

將*換位任意標籤名，則可根據標籤進行篩選

//input[@placeholder='使用者名稱']

4、當標籤頁重複時，xpath提供了層級過濾

例如：找不到兒子，那麼就先找他的爸爸，實在不行可以再找他的爺爺

1）、支援通過/進行層級遞進，找到符合層級關係的標籤

//form/div/input[@placeholder="使用者名稱"]

2）、當層級都重複時，可以通過單個層級的屬性進行定位

//form/div[@class='login-user']/input

5、乙個元素它的兄弟元素跟它的標籤一樣，這時候無法通過層級定位到。因為都是乙個父親生的，多胞胎兄弟。xpath提供了索引過濾

通過索引，在list中定位屬性，與python的索引有些差別，xpath從1開始

//select[@name='city'][1]/option[1]

6、上面幾種如果都用上了之後還重複的話，我們就可以使用xpath提供的終極神器，邏輯運算定位。and 或 or

1）、通過and來縮小過濾的範圍，只有條件都符合時才能定位到

//select[@name='city'and@size='4'and@multiple="multiple"]

2）、or就相反了，只要這些篩選中，其中乙個出現那麼久匹配到了

//select[@name='city'or@size='4']

我通常把xpath看成是屠龍刀。武林至尊，寶刀xpath，css不出，誰與爭鋒？

xpath與css基本使用方法

1 工具firefox50版本以下，安裝外掛程式firebug firepath 2 使用方法表示式描述從根節點擊取從匹配選擇的當前節點擊擇文件中的節點，而不考慮它們的位置代表獲取全部元素 id i1 代表屬性定位，選擇所有的屬性中且標籤id等於i1的元素 placeholder 請通過id...

Scrapy下xpath基本的使用方法

scrapy是基於python的開源爬蟲框架，使用起來也比較方便。具體的官網檔之前以為了解python就可以直接爬了，原來還要了解html，xml的基本協議，在了解基礎以後，在了解下xpath的基礎上，再使用正規表示式 python下的re包提供支援提取一定格式的資訊比如說url 就比較容易...

網頁採集中Xpath簡單使用方法

xpath在簡數採集平台中是定位獲取頁面html標籤或者標籤中的內容。例子 html body p a 上面xpath路徑意思是獲取html標籤下的子標籤body，body下的子標籤p，p下的子標籤a，獲取結果是對應下圖的第10行a標籤例子 html body p a 上面xpath路徑意思是獲取...

Xpath使用方法

xpath與css基本使用方法

Scrapy下xpath基本的使用方法

網頁採集中Xpath簡單使用方法

相關推薦