乙個奇怪的正規表示式

2022-07-17 01:39:08 字數 620 閱讀 2139

昨天,我在做網路爬蟲的時候,遇到了乙個**對文字框的輸入作了編碼處理:

具體作了什麼樣的處理,前面幾句用了js的replace方法,替換了一些特殊符號,後面用了乙個正規表示式進行了特殊的編碼工作。我當時的文字:acm task force on k–12 education and technology。js執行後,k之後的-進行了編碼。我一開始不明白這個正則的含義。/^[ -~]+$,它怎麼就不能匹配-能?後來用c#寫了程式:

string s = "

acm task force on k–12 education and technology";

var ascii = "

^[ -~]+$";

var reg = new

regex(ascii);

foreach (var item in

s)

else

}

執行程式後,才突然想起來,中括號中的-是表示範圍,如果表示自己的話,就得轉義啊。比如[0-9],[a-z] 都表示乙個連續的範圍,後來想起ascii碼,然後查了下,原來這個正則表示的是空格到~之間的字元。真相終於大白。

ascii碼 十進位制32到126之間的字元。

乙個正規表示式的例子

需求 通過.net的正則 上面3個都得到 aa 並對語句稍微講解一下。謝謝。http w 這個是我寫的。不知道怎麼加上或者匹配www 還有?這個什麼意思查不到。解決 i 匹配模式,表示忽略大小寫,在.net中等價於在後面加regexoptions.ignorecase引數 http www 肯定逆序...

乙個新人理解正規表示式

知識點 1 表單驗證 針對於 非空驗證 去空格 非空驗證是什麼呢,就是說 當我輸入乙個賬號的時候不能輸入乙個空格就完事了,乙個空格或者多個空格絕對不是賬號,我們接收乙個賬號的時候首先要做的就是把他的前後空格給去掉,然後判斷一下他是不是空的,如果是空的那麼就提示他輸入有誤。對比驗證 跟乙個值對比 就是...

乙個正規表示式引起的雜談

re.compile r s s usage n t n 一開始咋也不能明白啥意思 探索第一步 非貪婪模式的正則匹配 此部落格介紹的非常好 s 正則 i,m,s,x,g 正則i,s,m,g 這些是模式修正符 解說正規表示式模式中使用的修正符 i 如果設定此修正符,模式中的字元將同時匹配大小寫字母。m...