python中的正規表示式
通過re模組實現
:常用來指定乙個字符集;元字元在字符集中不起作用;補集匹配不在區間範圍內的字元。
^:匹配行首。除非設定multline標誌,它只是匹配字串的開始,在multline模式裡,它也可以直接匹配字串中的每個換行。
$:匹配行尾,行尾被定義為要麼是字串尾,要麼是乙個換行字元後面的任何位置。
\d:匹配任何十進位制的數。\d:匹配任何非數字字元。
\s:匹配任何空白字元。 \s:匹配任何非空白字元。
\w:匹配任何字母數字字元。 、\w:匹配任何非字母數字字元。
*:指定前乙個字元可以被匹配0次或更多次,而不是只有一次。匹配引擎會試著重複盡可能多的次數。
+:表示匹配一次或更多次。
?:匹配一次或0次;可理解為它用於標識某物是可選的。
re.i :不區分大小寫。
re.sub:替換
re.split:切割
copy模組
淺拷貝就是對引用的拷貝。
深拷貝就是對物件的拷貝。
python 正則re學習筆記
正規表示式,又稱規則表示式 正規表示式 regular expression 描述了一種字串匹配的模式 pattern 1.代表原子表 儲存表示式 字元集合。匹配所包含的任意乙個字元 a 匹配乙個字母a abc 匹配字母a b c a z 匹配任意一位小寫字母 aabb 匹配任意一位大小寫字母a b...
python學習筆記二(正規表示式)
在爬取網頁資訊的時候,是否是用迴圈擷取字串的方法?至少我之前是這麼做的。我比較懶,直接在字串裡搜關鍵字 用分片拿到想要的資訊,想到要寫正規表示式就有點矗。今天看了下正規表示式,小小的總結下。今天就不講怎麼寫正規表示式了,得依照需求來 自己寫的正則曾經被人鄙視過 今天的主題是怎麼用python的re模...
python學習筆記(二)
集合 set是可變的集合,frozenset是不可變的集合 1.構造集合 s set abcde s set a b c s set abc def ghi s frozenset abcde 2.集合操作 1.新增元素 s.add b 2.刪除元素 s.remove obj 當該元素不存在時丟擲異...