什麼是xpath?
xpath是xml的路徑語言,通俗一點講就是通過元素的路徑來查詢到這個標籤元素。
工具
xpath使用方法
注:預設死格式 先寫 //* 代表定位頁面下所有元素
1、xpath支援id、class、name定位功能
1)、通過id定位
//*[@id='kw']
2)、通過class定位
//*[@class='class_name']
3)、通過name定位
//*[@name='name']
2、如果標籤沒有id、class、name三總屬性,xpath還支援屬性定位功能
@代表以屬性定位,後面可以接標籤中任意屬性
//*[@other='attribute']
3、當標籤的屬性重複時,xpath提供了通過標籤來進行過濾
將*換位任意標籤名,則可根據標籤進行篩選
//input[@placeholder='使用者名稱']
4、當標籤頁重複時,xpath提供了層級過濾
例如:找不到兒子,那麼就先找他的爸爸,實在不行可以再找他的爺爺
1)、支援通過/進行層級遞進,找到符合層級關係的標籤
//form/div/input[@placeholder="使用者名稱"]
2)、當層級都重複時,可以通過單個層級的屬性進行定位
//form/div[@class='login-user']/input
5、乙個元素它的兄弟元素跟它的標籤一樣,這時候無法通過層級定位到。因為都是乙個父親生的,多胞胎兄弟。xpath提供了索引過濾
通過索引,在list中定位屬性,與python的索引有些差別,xpath從1開始
//select[@name='city'][1]/option[1]
6、上面幾種如果都用上了之後還重複的話,我們就可以使用xpath提供的終極神器,邏輯運算定位。and 或 or
1)、通過and來縮小過濾的範圍,只有條件都符合時才能定位到
//select[@name='city'and@size='4'and@multiple="multiple"]
2)、or就相反了,只要這些篩選中,其中乙個出現那麼久匹配到了
//select[@name='city'or@size='4']
我通常把xpath看成是屠龍刀。武林至尊,寶刀xpath,css不出,誰與爭鋒?
xpath與css基本使用方法
1 工具firefox50版本以下,安裝外掛程式firebug firepath 2 使用方法 表示式描述 從根節點擊取 從匹配選擇的當前節點擊擇文件中的節點,而不考慮它們的位置 代表獲取全部元素 id i1 代表屬性定位,選擇所有的屬性中且標籤id等於i1的元素 placeholder 請通過id...
Scrapy下xpath基本的使用方法
scrapy是基於python的開源爬蟲框架,使用起來也比較方便。具體的官網檔 之前以為了解python就可以直接爬 了,原來還要了解html,xml的基本協議,在了解基礎以後,在了解下xpath的基礎上,再使用正規表示式 python下的re包提供支援 提取一定格式的資訊 比如說url 就比較容易...
網頁採集中Xpath簡單使用方法
xpath在簡數採集平台中是定位獲取頁面html標籤或者標籤中的內容。例子 html body p a 上面xpath路徑意思是獲取html標籤下的子標籤body,body下的子標籤p,p下的子標籤a,獲取結果是對應下圖的第10行a標籤 例子 html body p a 上面xpath路徑意思是獲取...