列子
描述.intro
選擇class=『intro』的所有節點
#name
選擇id=『name』的所有節點
*選擇所有節點
p選擇所有p節點
div,p
選擇所有div節點和p節點
div p
選擇div節點內部的所有p節點
div>p
選擇父節點為div的所有p節點
div+p
選擇緊接在div節點之後的所有p節點
[target]
選擇帶有target屬性的所有節點
[target=blank]
選擇屬性target=『blank』的所有節點
[target~=blank]
選擇屬性target包含單詞blank的所有節點
a:link
選擇所有未被訪問的節點
a:visited
選擇所有已被訪問的節點
a:hover
選擇滑鼠指標位於其上的鏈結
選擇src屬性以https開頭的所有a節點
a[src$=』.pdf』]
選擇src屬性以.pdf結尾的所有a節點
a[src*=『abc』]
選擇src屬性包含『abc』子串的所有a節點
網路爬蟲之css選擇器
container 選擇id為container的元素 container 選擇所有class包含container的元素 div not content container 選取所有id為非content container 的div div a 選取所有div下所有a元素 ul p 選取ul後面...
爬蟲 css選擇器 和 xpath選擇器
ret soup.select my p ret soup.select body p 子子孫孫 ret soup.select body p 直接子節點 兒子 ret soup.select body p 0 text 直接子節點 兒子 xpath xpath 是一門在 xml 文件中查詢資訊的語...
網路爬蟲css選擇器知識貼(一)
css選擇器 container 選擇id為container的元素 container 選擇所有class包含container的元素 選擇所有元素 div a 選取所有div下所有a元素 ul p 選取ul後面的第乙個p元素 ul p 選取與ul相鄰的所有p元素 a nth child 2 選取...