python爬蟲XPath學習

xpath簡介和基本使用

1.前言

之前爬蟲的時候沒有用過xpath，就是沒用過lxml這個包，遇到json格式網頁我用的json.loads(),html格式用的beautifulsoup裡面有find和find_all函式查詢標籤之類的。但是xpath在爬蟲裡面也算乙個比較重要的工具，當然要學習啦。

2.過程

找到了乙個不錯的教程，python爬蟲之xpath的基本使用，挺全的，現在收藏一下，寫的時候參考，哈哈。裡面有獲取html某標籤文字內容，標籤屬性之類的。剛剛conda install lxml，裝了下包，到時候from lxml import etree就能用了（打基礎階段，時刻準備著）。在另外乙個**上看到,類似這種：

html = etree.html(wb_data)
html_data = html.xpath('/html/body/div/ul/li/a/text()')

html得到的是elementtree物件，後續列印輸出操作就要轉換成string型別，html_data迴圈遍歷就行。目前先碼上，還沒開始用，預備工作做好。

python爬蟲XPath學習

python爬蟲學習 xpath

爬蟲 xpath學習

爬蟲xpath學習

python爬蟲XPath學習

python爬蟲學習 xpath

爬蟲 xpath學習

爬蟲xpath學習

相關推薦