正規表示式修飾符:g, i, m
g (global): 全域性匹配
i (ignorecase): 忽略大小寫匹配
m(multiline): 多行匹配
正則元字元:
1. 量詞元字元:
+:讓前面的元字元出現一到多次
?:出現0到1次
:出現n次
: 出現n到多次
: 出現n-m次
2.特殊意義元字元:
\:轉義字元(把乙個普通字元轉化為特殊意義字元,或把乙個特殊字元轉化為普通字元)
.: 匹配除了\n(換行符)外的所有字元
\d:匹配0-9間的數字
\d:匹配任意乙個不是0-9間的數字 (大寫字母和小寫字母的組合正好是反向的)
\w: 匹配乙個0-9或字母或_之間的字元
\s:匹配乙個任意空白字元
\b:匹配乙個邊界符
x|y:匹配x,或y中的乙個
[a-z]:匹配a-z中的任意乙個
[^a-z]匹配任意乙個非a-z的字元
[xyz]匹配xyz中的任意字元
[^xyz]匹配除了xyz以為的任意字元
():小分組, 可理解為大正則中的乙個
^:以某個元字元開頭
$:以某個元字元結束
?: : (問號+冒號)只匹配,不捕獲
?= :正向預查
?! :負向預查
正則學習 1
概念 1.1 regular expression 正規表示式 主要用於搜尋 過濾字串,包括普通字元 如a z 與特殊字元 元字元 1.2 元字元 匹配字串的頭部 匹配字串的尾部 標記子表示式的開始與結束 匹配前面的子表示式0次或多次 匹配前面的子表示式0次或1次,或指明乙個非貪婪限定符 匹配前面的...
《學習正規表示式》(1)
1.稱為元字元,不參與匹配。2.a a 字元組或者字符集。例如 0 9 或者 01239 前者匹配0 9所有數字字元,後者匹配特定的五個數字字元。3.d 匹配所有阿拉伯數字,成為字元組簡寫式 4.d 匹配非數字字元 5.使用.匹配任意字元,但通常不包括換行符.使用方法 帶匹配連線符 舉例 表示匹配 ...
學習筆記 稀疏性正則化 l1正則化
還記得我們之前用經度和緯度來進行分箱嗎?僅僅是2個特徵進行分箱組合就讓我們的輸入特徵數量暴增。假設我們現在有k個特徵需要來分箱,每個分為長度為k的獨熱編碼。那麼我們輸入特徵就為 k k個,這種指數增長會占用我們大量ram。這是我們需要辦法來拯救我們的ram。那麼乙個好的方法就是讓我們的部分權重為0,...