importrequests
from lxml import
etree
if__name__ == "
__main__":
headers =
#ua偽裝
#例項化好了乙個etree物件,且將被解析的檔案載入到了物件中
tree = etree.parse('
test.html')
#r = tree.xpath('/html/body/div') # '/html'中'/'從根目錄(根節點)
#r1 = tree.xpath('/html//div') # '//'表示示的是多個層級
#r2 = tree.xpath('//div') # '//'表示的是多個層級
#r = tree.xpath('//div[@class="song"]')
#r = tree.xpath('//div[@class="song"]/p[3]') # 索引定位從1開始
#r = tree.xpath('//div[@class="tang"]//li[5]/a/text()')[0] # 索引定位從1開始
#r = tree.xpath('//div[@class="tang"]//li[7]//text()')[0] # 索引定位從1開始
r = tree.xpath('
//div[@class="song"]/img/@src
')#索引定位從1開始
print(r)
xpath解析基礎
xpath解析 最常用且最便捷高校的一種解析方式。通用性。xpath解析原理 1.例項化乙個etree的物件,且需要將被解析的頁面原始碼資料載入到該物件中。2.呼叫etree物件中的xpath方法結合著xpath表示式實現標籤的定位和內容的捕獲。環境的安裝 pip install lxml 如何例項...
Xpath解析資料
xpath,xml path language。是一種小型的查詢語言,是一門在xml文件中查詢的語言。優點 可以在xml中查詢資訊 支援html的查詢 可通過元素和屬性進行導航。xpath的樹形結構 使用xpath選取節點 表示式描述nodename 選取此節點的所有子節點 從根節點擊擇 從匹配選擇...
解析網頁之xpath解析
xpath指的是使用路徑表示式在 xml 文件中查詢資訊的語言。xpath的七個節點術語 元素 屬性 文字 命名空間 處理指令 注釋以及文件 根 節點。每個元素以及屬性都有乙個父節點。元素節點可有零個 乙個或多個子節點。就好像每一片樹葉都只能在一根樹枝上,但每一根樹枝卻有很多樹葉。以此類推,樹幹是所...