使用pip install beautifulsoup4
2.引入beautifulsoup物件
from bs4 import beautifulsoup
3.把網頁解析為beautifulsoup物件
beautifulsoup(要解析的文字,解析器)
例如:beautifulsoup(html,『html.parser』)
注意要解析的文字必須是字串
4.解析網頁
beautifulsoup物件.find(標籤,屬性)
find():提取滿足條件的首個元素
find_all():提取滿足條件的所有元素
屬性使用class_=』』
5.tag物件的三種常用屬性和方法
find():提取tag中的tag
text:提取tag中的文字
[『屬性名』]:提取tag中的屬性值
例子
import requests
from bs4 import beautifulsoup
#1.獲取資料
response=requests.
get(
'')#2.解析資料
soup=
beautifulsoup
(response.text,
'html.parser'
)print
(soup)
#3.提取資料
items=soup.
find_all
('div'
,class_=
'info pure-u'
)list_all =
for i in items:
print
("------------------------"
) name=i.
find
('a'
) fabric=i.
find
('p'
,class_=
'ing ellipsis'
)print
('菜名:'
+name.text[17:
-13]+
+name[
'href'])
print
('原料:'
+fabric.text)
list_all.
([name.text[17:
-13],name[
'href'
],fabric.text]
)
Python基礎 Python語法基礎
關鍵字是python語言的關鍵組成部分,不可隨便作為其他物件的識別符號 andas assert break class continue defdel elif else except exec finally forfrom global ifimport inis lambda notor p...
python初級語法 python語法基礎
寫在最前頭 python 程式對大小寫是敏感的!1 資料型別 1 整數 可以處理任意大小的正負整數 2 浮點數 浮點數運算可能會引入四捨五入的誤差 3 字串 可以是單引號or雙引號括起來的任意文字,但是不包括單引號or雙引號本身。ps 如果字串本身裡含有單引號or雙引號,怎麼辦呢?嘻嘻 可以使用轉義...
python初級語法 Python基礎語法
第一章格式規範 一 標頭檔案 1.注釋行 usr bin python3 coding utf 8 2.匯入模組行 匯入整個模組,格式 import module 匯入模組中全部函式,格式為 from module import 二 識別符號 首字元必須是字母或下劃線。識別符號對大小寫敏感。三 保留...