1. match()函式從字串的開始部分開始匹配,匹配成功,則返回匹配物件;匹配不成功,則返回none。
2. search()函式用它的字串引數,在任意位置對給定的正規表示式模式>>> m = re.match('foo', 'on the table food')
>>> m
>>> none
3. 萬用字元"."匹配除了'\n'以外的任何字元>>> m = re.search('foo', 'seafood')
>>> print m
<_sre.sre_match object at 0x0000000002ad1c60>
>>> print m.group()
4. 字符集類似於『|』
5. 匹配簡單郵箱
6. group()通常用於以普通方式顯示所有的匹配部分,但也能用於獲取各個匹配的子組。可以使用groups()方法獲取乙個包含所有匹配子字串的元組。>>> patt = '\w+@(\w+\.)*\w+\.com'
>>> re.match(patt, 'nobdy@***.yyy.zzz.com')
<_sre.sre_match object at 0x00000000021e7558>
注意:選取子組時,group()的引數可以是第幾個子組,但是groups()沒有引數,傳入位置引數會被當做*areg收集,>>> m = re.match('(a(b))', 'ab')
>>> m.group()
>>> m.group(1)
>>> m.group(2)
'b'>>> m.group(0)
>>> m.groups()
('ab', 'b')
7. findall()查詢字串中某個正規表示式模式全部的非重複出現情況,並返回乙個列表。若未找到匹配部分,則返回空列表>>> m.groups()
('ab', 'b')
>>> m.groups(1)
('ab', 'b')
>>> m.groups(0)
('ab', 'b')
>>> m.groups(2)
('ab', 'b')
>>> m.groups()[0]
>>> re.findall(r'th\w+', 'this and that')
['this', 'that']
>>> re.findall(r'(\w+is) and (\w+at)', 'this and that')
[('this', 'that')]
>>> re.findall(r'(th\w+) and (th\w+)', 'this and that and the and three')
[('this', 'that'), ('the', 'three')]
9. finditer()在匹配物件中迭代。>>> re.findall(r'(th\w+) and (\w+) and (th\w+)', 'this and that and the')
[('this', 'that', 'the')]
>>> re.findall(r'(th\w+)\w+(th\w+)\w+(th\w+)', 'this and that and the')
>>> re.findall(r'(th)\w+', 'this and that and the')
['th', 'th', 'th']
>>> re.findall(r'(th)\w+(th)\w+(th)\w+', 'this and that and the')
