from bs4 import beautifulsoup
html =
"""first item
second item
third item
>
"""soup = beautifulsoup(html,
'lxml'
)ui = soup.ui
print
(ui.contents)
#返回列表
print
(ui.children)
#返回迭代器
for i in ui.children:
print
(i)for string in soup.strings:
print
(string)
print
(repr
(string)
)for string in soup.stripped_strings:
print
(string)
print
(repr
(string)
)
contents和children的區別
返回某個標籤下的直接子元素,其中也包括字串。
區別是:contents返回的是乙個列表,children返回的是乙個迭代器。
string和strings、stripped_strings屬性
1、string:獲取某個標籤下的非標籤字串。返回的是字串。如果這個標籤下有多行字串,那麼就不能獲取。
2、strings:獲取某個標籤下的子孫非標籤字串。返回的是生成器。
3、stripped_strings:獲取某個標籤下的子孫非標籤字串,會去掉空白字元,返回的是生成器。
bs4的用法之遍歷文件樹以及查詢文件樹
bs4的用法之遍歷文件樹以及查詢文件樹 bs4的使用 from bs4 import beautifulsoup html doc the dormouse s story once upon a time there were three little sisters and their name...
bs4之標籤樹的下行遍歷
import requests from bs4 import beautifulsoup def bianlisoup url r requests.get url,timeout 30 r.raise for status demo r.text soup beautifulsoup demo,...
Python3 遍歷目錄樹
假定你希望對某個資料夾中的所有檔案改名,包括該資料夾中所有子資料夾中 的所有檔案。也就是說,你希望遍歷目錄樹,處理遇到的每個檔案。寫程式完成這 件事,可能需要一些技巧。好在,python 提供了乙個函式,替你處理這個過程。import os for foldername,subfolders,fil...