常用規則
表示式描述nodename
選取此節點所有子節點
/從當前節點直接選取所有子節點
//從當前節點直接選取子孫節點
.選取當前節點
. .選取當前節點父節點
@選取屬性
contains()
屬性多值匹配
text()
獲取文字
python中的xpath
from lxml import etree
html = etree.html(text)
#text為爬取的網頁
result = html.xpath(
"//div[@class='name']/li[contains(@class,'text')]/a/@href"
)#一般用法,注意scrapy中的xpath還需要extract() or extract_first()提取文字,
html_2 = etree.parse(
'text.html'
, etree.htmlparser())
#text.html為硬碟中的html檔案
多屬性匹配
運算子描述or
或and
與mod
除后取餘
|計算兩個節點集+加法
-減法*乘法
div除法=等於
!=不等於
<
小於》大於<=
小於等於
>=
大於等於
《Numpy筆記》 1 基本認識
計算式 一元計算函式 np.mean a 等於 a.mean np.max a np.min a np.abs a np.fabs a np.sqrt a 開方np.square a 平方np.log a np.log10 a np.log2 np.ceil a np.floor a 浮點np.ri...
linux 筆記1 基本認識
乙個完整的計算機系統是由硬體和軟體兩大部分組成的 硬體是指計算機物理裝置本身,它是計算機系統的物質基礎 軟體是相對硬體而言的,是電腦程式以及相關資料等的總稱 程式是計算機完成一項任務的指令的集合 資料是由程式使用或生成的不同型別的資訊 硬體是軟體建立與活動的基礎,軟體是對硬體功能的擴充 軟體通常可分...
XPath的初步認識
嘿嘿,最近開始上班,不是過於太忙,而是自己一直在學習一些專案中用到的而我暫時還沒接觸的知識,wcf,log4等,感覺還沒有總結的需要吧,雖然都了解啦,但是暫時還是初步的學習,基礎的暫時是知道啦,還沒有練習的太多吧,嘿嘿,由於以後就要常常使用xpath啦,所以就來做乙個xpath的demo練習下。一....