正規表示式 學習筆記1 2

2021-09-21 15:19:46 字數 1602 閱讀 6711

書接上一回:

例項三:

資料提取

要求:從一段html

**中提取出所有的

email

位址和< a href...>tag

中的鏈結位址

public

class

htmltest 

system.

out.println(

"開始檢查超連結");

for(string link : 

extractlink

(htmltext)) 

}

private

static

listextractlink(string htmltext) 

return

result;

}

private

static

listextractemail(string htmltext) 

return

result;

}}

public

class

regexes (?=\\b)";

public

static

final

string 

href_link_regex

= "(?i)]+)['\"\\s>]";

} 執行結果:

開始檢查email

郵箱是:[email protected]

郵箱是:[email protected]

郵箱是:[email protected]

開始檢查超連結

超連結是:

超連結是:

超連結是:

超連結是:

超連結是:

例項四:

查詢重複單詞

要求:查詢一段文字中是否存在重複單詞,如果存在,去掉重複單詞。

public

class

findword ;

for(string sentence:sentences)

system.

out.println(

"");

}}

private

static

string removedupwords(string 

sentence) 

private

static

boolean

containdupword(string sentence) 

else

}

} public

class

regexes

執行結果:

校驗句子:this is a normal sentence

校驗句子:oh,my god!duplicate word word

duplicate word found!!

正在去除重複單詞oh,my god!duplicate word

校驗句子:this sentence contain no duplicate word words

未完待續。。。

12 正規表示式

正規表示式 是乙個非常強大而實用的工具,可以用乙個模式串匹配一系列符合規則的字串。現在就請大家實現乙個正規表示式的匹配工具。雖然正規表示式的規則很複雜,但其中的核心規則,只要實現就可以處理大多數的問題 c 匹配任意字母c 匹配任意的單個字元 匹配輸入字串的開頭 匹配輸入字串的結尾 匹配前乙個字元的零...

正規表示式學習筆記

正規表示式學習日記 1 為萬用字元,表示任何乙個字元,例如 a.c 可以匹配 anc abc acc 2 在內可以指定要求匹配的字元,例如 a nbc c 可以匹配 anc abc acc 但不可以匹配 ancc a到z可以寫成 a z 0到9可以寫成 0 9 3 數量限定符號,表示匹配次數 或者叫...

正規表示式學習筆記

字元描述 將下乙個字元標記為乙個特殊字元 或乙個原義字元 或乙個 向後引用 或乙個八進位制轉義符。例如,n 匹配字元 n n 匹配乙個換行符。序列 匹配 而 則匹配 匹配輸入字串的開始位置。如果設定了 regexp 物件的 multiline 屬性,也匹配 n 或 r 之後的位置。匹配輸入字串的結束...