本節將介紹python中正規表示式最基本的用法,正規表示式本身不做太多介紹。
python中正規表示式的內建模組是re,最基本的用法是判斷某個字串是否符合某個表示式,分組,找出乙個字串中所有符合某個表示式的列表。
可通過search()函式和match()函式來實現,不同之處是match函式是從字串的起始字元開始判斷,而search函式是從任意位置開始判斷。例如:
search:
import re
# check if a string matches a regexp
str = "www.google.com"
match = re.search('g.*e', str)
print(match)
print(match.span())
print(str[match.start():match.end()])
print()
match = re.search('ag.*e', str)
if match:
print("match")
else:
print("not match")
print()
# search and group
match = re.search('(g.*e)\.(com)', str)
if match:
print(match.group(1))
print(match.group(2))
else:
print("not match.")
執行結果:
d:\work\python_workspace\python_study\venv\scripts\python.exe d:/work/python_workspace/python_study/basic_11/search.py
(4, 10)
google
not match
google
comprocess finished with exit code 0
match:
import re
str = "www.google.com"
match = re.match("www", str)
print(match)
match = re.match("google", str)
print(match)
執行結果:
d:\work\python_workspace\python_study\venv\scripts\python.exe d:/work/python_workspace/python_study/basic_11/match.py
none
process finished with exit code 0
這也是乙個非常有用的操作,在網路爬蟲方面應用廣泛。例如:
import re
str = "www.google.com, www.qq.com, "
result = re.findall('www\..*?\.com', str)
for r in result:
print(r)
執行結果:
process finished with exit code 0當然,re模組中還有其它的函式,如split,sub等,由於不太常用,這裡就不過多介紹。
Python基礎之正規表示式
1.正則模組匯入 python中內建正規表示式模組,使用正規表示式時應提前匯入該模組 import re 2.正則命令 匹配任意字元 n除外 匹配字串的起始部分 匹配字串的結束部分 連續匹配0次或多次 連續匹配1次或多次 連續匹配0次或1次 或。匹配 左右表示式任意乙個,從左到右匹配,如果 沒有包括...
Python 正規表示式(基礎)
正規表示式 regular expression 是乙個特殊的字串行,描述了一種字串匹配的模式可以用來檢查乙個串是否含有某種子串 將匹配的子串替換或者從某個串中取出符合某個條件的子串,或者是在指定的文章中,抓取特定的字串等。python處理正規表示式的模組是re模組,它是python語言擁有全部的正...
Python正規表示式基礎
直接給出字元就是精確匹配。特殊字元首先需要轉義如 d 匹配乙個數字,w 匹配乙個字母或者數字。123 d 可以匹配 1231 但是無法匹配 123a d d d 可以匹配到 123 w w w 可以匹配到 py3 表示任意乙個字元,py.可以表示py3 py 等 表示任意長個字元,表示至少乙個字元,...