import requests
from bs4 import beautifulsoup
def bianlisoup(url):
r = requests.get(url, timeout=30)
r.raise_for_status()
demo = r.text
soup = beautifulsoup(demo, "html.parser")
# 子節點列表,contents為列表型別
print("子節點列表:")
print(soup.head.contents) # 輸出head標籤的子節點內容
print(soup.body.contents) # 輸出body標籤的子節點內容
print(len(soup.body.contents)) # 輸出body標籤的子節點數量
print(soup.body.contents[1]) # 輸出第乙個子節點內容
# 兒子節點列表,childern和descendants為迭代型別,只能用在for迴圈之中
print("遍歷兒子節點:") # 與contents類似,區別是children為遍歷兒子節點
for child in soup.body.childern:
print(child)
# 子孫節點列表
print("子孫節點列表:") # 包含所有子孫節點列表
for child in soup.body.descendants:
print(child)
url = ""
bianlisoup(url)
bs4 遍歷文件樹
from bs4 import beautifulsoup html first item second item third item soup beautifulsoup html,lxml ui soup.ui print ui.contents 返回列表 print ui.children ...
基於bs4庫的HTML標籤遍歷方法
html可以看做一棵標籤樹 屬性說明 contents 將該標籤所有的兒子節點存入列表 children 子節點的迭代型別,和contents類似,用於遍歷兒子節點 descendants 子孫節點的迭代型別,包含所有的子孫跌點,用於迴圈遍歷 import requests from bs4 imp...
bs4的用法之遍歷文件樹以及查詢文件樹
bs4的用法之遍歷文件樹以及查詢文件樹 bs4的使用 from bs4 import beautifulsoup html doc the dormouse s story once upon a time there were three little sisters and their name...