讀《精通正規表示式》 標準量詞是匹配優先的

2021-05-23 09:09:50 字數 402 閱讀 3838

正則字元:^.*([0-9]+)

這個表示式的本意是捕獲整個數字『2003』,但結果並非如此。

為了滿足「[0-9]+」的匹配,「.*」必須交還一些字元。在這個例子中,釋放的字元是「3.」(即最後的「3」和點號 ),之後「3」能夠由「[0-9]」匹配。

「[0-9]」由「+」量詞修飾,所以現在還只做到了最小的匹配可能,現在它遇到了「.」,找不到其它可以匹配的字元。此時沒有「必須」匹配的元素(已經滿足了『[0-9]+』的匹配要求,後面沒有更多的子表示式需要去匹配文字 ),所以「.*」不會被迫交出0。

『[0-9]+ 』)。

匹配優先的結構只會在被迫的情況下交還字元(比如將『[0-9]+』改為『[0-9]』,因為乙個『3』不能滿足,所以此時需要交還乙個『0』 )。所以,最終$1(即第乙個分組)的值是「3」。

讀 《精通正規表示式》

剛學完python就像找點事做,相到以後的自己打算的方向就準備從爬蟲開始學習,爬蟲前面學的好好,但越到後面遇到的正規表示式越看不懂,相比那些函式,這個讓人難以琢磨,與其一直帶著這種異或我打算在學爬蟲之餘好好的學習一下正規表示式,因此我們選擇了這本書。我將記錄我的學習筆記,下面就開始學習之路。re模組...

正規表示式量詞

量詞什麼是量詞 出現的次數 至少出現n次,最多出現m次 例子 查詢qq號 常用量詞 至少n次 任意次 零次或一次 一次或任意次 正好n次 var oinput document.getelementsbytagname input 1 9 qq號第一位為1 9之間的數字 在正則的最開始位置,就代表起...

正規表示式的量詞

量詞,顧名思義,計算數量的詞,三個人,三,就是量詞。那麼,先把正規表示式的量詞供出來 共有 表示原子恰好出現n次。表示原子最少出現n次。最少出現n次,最多出現m次。再來供一段奇葩的亂碼 韓寒三重門1s3 郭敬明小時代1fdss 韓寒後會無期郭敬明小時代2sdf sbusbffsb 方方韓韓 方方方韓...