書接上一回:
例項三:
資料提取
要求:從一段html
**中提取出所有的
位址和< a href...>tag
中的鏈結位址
public
class
htmltest
system.
out.println(
"開始檢查超連結");
for(string link :
extractlink
(htmltext))
}
private
static
listextractlink(string htmltext)
return
result;
}
private
static
listextractemail(string htmltext)
return
result;
}}
public
class
regexes (?=\\b)";
public
static
final
string
href_link_regex
= "(?i)]+)['\"\\s>]";
} 執行結果:
開始檢查email
開始檢查超連結
超連結是:
超連結是:
超連結是:
超連結是:
超連結是:
例項四:
查詢重複單詞
要求:查詢一段文字中是否存在重複單詞,如果存在,去掉重複單詞。
public
class
findword ;
for(string sentence:sentences)
system.
out.println(
"");
}}
private
static
string removedupwords(string
sentence)
private
static
boolean
containdupword(string sentence)
else
}
} public
class
regexes
執行結果:
校驗句子:this is a normal sentence
校驗句子:oh,my god!duplicate word word
duplicate word found!!
正在去除重複單詞oh,my god!duplicate word
校驗句子:this sentence contain no duplicate word words
未完待續。。。
12 正規表示式
正規表示式 是乙個非常強大而實用的工具,可以用乙個模式串匹配一系列符合規則的字串。現在就請大家實現乙個正規表示式的匹配工具。雖然正規表示式的規則很複雜,但其中的核心規則,只要實現就可以處理大多數的問題 c 匹配任意字母c 匹配任意的單個字元 匹配輸入字串的開頭 匹配輸入字串的結尾 匹配前乙個字元的零...
正規表示式學習筆記
正規表示式學習日記 1 為萬用字元,表示任何乙個字元,例如 a.c 可以匹配 anc abc acc 2 在內可以指定要求匹配的字元,例如 a nbc c 可以匹配 anc abc acc 但不可以匹配 ancc a到z可以寫成 a z 0到9可以寫成 0 9 3 數量限定符號,表示匹配次數 或者叫...
正規表示式學習筆記
字元描述 將下乙個字元標記為乙個特殊字元 或乙個原義字元 或乙個 向後引用 或乙個八進位制轉義符。例如,n 匹配字元 n n 匹配乙個換行符。序列 匹配 而 則匹配 匹配輸入字串的開始位置。如果設定了 regexp 物件的 multiline 屬性,也匹配 n 或 r 之後的位置。匹配輸入字串的結束...