正規表示式:
1. 概念: 一種字串匹配規則
1.1 判斷 input進來的 是不是qq號 是不是手機號 身份證號 ......
1.2 有乙個檔案,要求把手機號 qq號 取出來
2. 能做什麼:
2.1 可以制定乙個規則:
# 來確認某乙個字串是否符合規則的內容
# 從打斷的字串中找到符合規則的內容
2.2 程式領域
# 1,登入程式頁的都表單驗證 web開發 要求簡單語法
# 2,爬蟲 提取網頁資訊,找到自己需要的資訊,資料分析
# 3,自動化開發 日誌分析
3. 語法:
3.1 元字元
\ 轉義符. 匹配除換行符外任意字元
\w 匹配數字字母下劃線
\d 匹配數字
\s 匹配空白符 \n \t
\n 匹配乙個換行符
\t 匹配乙個製表符
\b 匹配乙個單詞的結尾
^ 匹配字串的開始
$ 匹配字串的開始
\d 匹配非數字
\w 匹配非數字字母下劃線
\s 匹配非空白
a|b 匹配字元a或者字元b
() 匹配括號內的表示式,也表示乙個組 group()
[...] 匹配字元組中的字元
[^..] 匹配除了字元組中字元的所有字元 表示 非
[\d\d] [\w\w] [\s\s] 匹配所有
3.2 量詞 ? + * 貪婪匹配
? 重複0次或者1次+ 重複1次或者更多次
* 重複0或者更多次
重複n次
重複至少n次或更多次
重複n到m次
在量詞後加? 取消貪婪匹配,變成惰性匹配
?? +? *? 回溯演算法
最常用: .*?x 匹配任意字元,直到找到乙個x
正規表示式 1 初識正規表示式
簡單地說,正規表示式就是一套處理字串的規則和方法,以行為單位對字串進行處理,通過特殊的符號的輔助,我們可以快速的過濾,替換某些特定的字串。運維工作中,會有大量訪問日誌,錯誤日誌,大資料。如何能夠快速的過濾出我們需要的內容,這就需要正規表示式。awk,sed,grep egrep 三劍客要想能工作的更...
正規表示式初識
用來指定乙個字元集合 字元直接是 或 的關係,不是乙個特定的字串,跟 abc 不同 abc a z 在字符集中,元字元 不起作用 abc abc 元字元 在字串尾不起作用 abc 就是普通字元。元字元在字符集首表示匹配補集,abc 就是匹配除了a,b,c以外的字元。匹配行首,位於字串首。制定規則re...
正規表示式初識
正規表示式 為轉義如 表示.郵箱匹配 grep e 0 9a za z 0 9a za z a za z a.txt 查詢郵箱 a z 所有小寫字母 a z 所有大寫字母 0 9 所有數字 0 9 所有非數字 表達取反 0 9 a z 0個或多個小寫字母 a z 至少出現一次小寫字母 a z 出現0...