爬蟲 正規表示式的小練習

2021-10-04 20:23:23 字數 597 閱讀 5420

1+(34578)中的乙個+9位數字

text="13555310477"

ret=re.match('1[34578]\d',text)

print(ret.group())

數字,字母或者下劃線+@+至少一位的數字或字母+.+至少以為的字母

text="[email protected]"

ret=re.match('\w+@[0-9a-z]+\.[a-z]+',text)

print(ret.group())

前面的協議可以是http或者https或者ftp+://+其他非空字元

print(ret.group())前17位是數字,最後一位不是數字就是x或x

text="23233018521369475x"

ret=re.match('\d[/dxx]',text)

print(ret.group())

正規表示式小練習

1 匹配整數或者小數 包括正數和負數 d d 表示 匹配0次或一次,d表示整數,表示匹配一次或多次,d 表示小數 2 匹配年月日日期 格式2018 12 6 1 d 1 0 2 0?1 9 3 01 12 d 0?1 9 1.1 9 表示年是以數字1 9開頭的,d表示年的位數,1 9 d就表示1 9...

爬蟲 正規表示式

正規表示式 regular expression 是一種字串匹配的模式 pattern 它可以檢查乙個字串是否含有某種子串 替換匹配的子串 提取某個字串中匹配的子串。匯入正則模組 importre 字元匹配 rs re.findall abc adc print rs rs re.findall a...

python正規表示式的小練習

乙個python正規表示式的練習 抓取糗事百科乙個頁面,輸出標題和內容 import urllib.request import re url header 用request包裝url和header req urllib.request.request url,headers header 再將打包...