正規表示式(四) 例項

2021-06-09 04:38:35 字數 1410 閱讀 5914

在正規表示式中,連字元(「-」)有著特殊的意義,它表示乙個範圍,比如從0到9。因此,匹配社會安全號碼中的連字符號時,它的前面要加上乙個轉義字元「/」

[0-9]\-[0-9]\-[0-9]

假設進行搜尋的時候,你希望連字符號可以出現,也可以不出現——即,999-99-9999和999999999都屬於正確的格式。這時,你可以在連字符號後面加上「?」數量限定符號

[0-9]\-?[0-9]\-?[0-9]

((2[0-4]\d|25[0-5]|[01]?\d\d?)\.)(2[0-4]\d|25[0-5]|[01]?\d\d?)

任務:分析乙個

web伺服器日誌檔案,確定每乙個使用者花在**上的時間。在典型的

bea weblogic

日誌檔案中,日誌記錄的格式如下:

首先我們來看看ip位址。ip位址有4個位元組構成,每乙個位元組的值在0到255之間,各個位元組通過乙個句點分隔。因此,ip位址中的每乙個位元組有至少乙個、最多三個數字。圖八顯示了為ip位址編寫的正規表示式:

\d\.\d\.\d\.\d

日誌記錄的時間部分由一對方括號包圍。你可以按照如下思路提取出方括號裡面的所有內容:首先搜尋起始方括號字元(「[」),提取出所有不超過結束方括號字元(「]」)的內容,向前尋找直至找到結束方括號字元。圖九顯示了這部分的正規表示式。

現在,把上述兩個正規表示式加上分組符號(圓括號)後合併成單個表示式,這樣就可以從日誌記錄提取出ip位址和時間。注意,為了匹配「- -」(但不提取它),正規表示式中間加入了「/s-/s-/s」。完整的正規表示式如圖十所示。

\d\.\d\.\d\.\d\s-\s-\s\[[ ^] ]+ \]

下面乙個任務是分析

html

頁面內font

標記的所有屬性。

html

頁面內典型的

font

標記如下所示:

思路:1. 先查詢

的標籤,

正規表示式如下:

2.在1的結果中查詢每個 屬性對

3.對查詢結果按 = split,並去掉value部分的 雙引號

通過傳入的x, 使用正規表示式  ^\w$ 實現

搜尋在任意數目的空格之後再次出現該單詞的情況,如  ^\w+$\s*

任意長度的整數,如-?[0-9]+

小數:-?[0-9]+(\.[0-9]+)?

小數字數確定: -?[0-9]+(\.[0-9])?

正規表示式例項

正規表示式例項 1.驗證數字 只能輸入1個數字 表示式 d 描述 匹配乙個數字 匹配的例子 0,1,2,3 不匹配的例子 2.只能輸入n個數字 表示式 d 例如 d 描述 匹配8個數字 匹配的例子 12345678,22223334,12344321 不匹配的例子 3.只能輸入至少n個數字 表示式 ...

正規表示式例項

正規表示式語法 字元匹配 正規表示式 china 匹配 chinaabc 句點符號 正規表示式 t.n 匹配 tan,tbn,tcn,t n,t n等 方括號符號 方括號只有裡面指定的字元才參與匹配,也就是說,正規表示式 t aeio n 只匹配 tan ten tin 和 ton 但 toon 不...

正規表示式例項

正規表示式例項 1.驗證數字 只能輸入1個數字 表示式 d 描述 匹配乙個數字 匹配的例子 0,1,2,3 不匹配的例子 2.只能輸入n個數字 表示式 d 例如 d 描述 匹配8個數字 匹配的例子 12345678,22223334,12344321 不匹配的例子 3.只能輸入至少n個數字 表示式 ...