把上面的規則連線起來,就獲得了完整的正規表示式。
[a-za
-z0-9\
._+]
+@[a-za-z]
+\.(com|org|edu|net)
2:正規表示式常用符號
3:簡單示例
a:注意**中的正規表示式
# coding=utf-8
"""@author: jiajiknag
待抓取的網頁是
"""from urllib.request import urlopen
from bs4 import beautifulsoup
import re
# urlopen 用來開啟並讀取乙個從網路獲取的遠端物件
html = urlopen("")
bs0j = beautifulsoup(html)
images = bs0j.findall("img",)
for image in images:
print(image["src"])
b:結果
不全面,如有關於正規表示式的會繼續更新,博主只是用來作為自己的電子筆記以後方便查閱罷了!!!
基本正規表示式規則
一 特殊字元 eg bhi b.blucy b 這個意思是以hi開頭的以lucy結尾的不換行的字元 1.b 這個叫元字元,代表單詞的開頭或結尾,即單詞的分界處,只是乙個位置 2.這個叫元字元,匹配 除 換行符外的任意字元 3.1 也是元字元,不代表任何字元,而是指代數量,意味著其前面的內容可以重複數...
正規表示式基本規則
正則 解釋 r 回車 n 換行 t 製表符 d 任意乙個數字,0 9 中的任意乙個 w任意乙個字母或數字或下劃線,也就是 a z,a z,0 9,中任意乙個 s包括空格 製表符 換頁符等空白字元的其中任意乙個 小數點可以匹配除了換行符 n 以外的任意乙個字元 a.d 匹配 aaa100 得到 aa1...
正規表示式基本規則
a 字元 x 字元 x。舉例 a 表示字元a 反斜線字元。n 新行 換行 符 u000a r 回車符 u000d b 字元類 abc a b 或 c 簡單類 abc 任何字元,除了 a b 或 c 否定 a za z a到 z 或 a到 z,兩頭的字母包括在內 範圍 0 9 0到9的字元都包括 c ...