C 中使用正規表示式提取超連結位址的集中方法

2022-02-23 17:08:03 字數 1197 閱讀 3196

一般在做爬蟲或者cms的時候經常需要提取 href鏈結或者是src位址。此時可以使用正規表示式輕鬆完成。

regex reg = new regex(@"

(?is)]*?href=(['""]?)(?[^'""\s>]+)\1[^>]*>(?(?:(?!

");

matchcollection mc =reg.matches(yourstr);

foreach (match m in

mc)

方法2:

class="

brush: c-sharp;

">regex r;

match m;

r = new regex("

href\\s*=\\s*(?:\"(?<1>[^\"]*)\"|(?<1>\\s+))

",

regexoptions.ignorecase|regexoptions.compiled);

for (m = r.match(inputstring); m.success; m =m.nextmatch())

方法3:提取img src的

class="

brush: c-sharp;

">regex reg = new regex(@"

(?i)]*?\ssrc\s*=\s*(['""]?)(?[^'""\s>]+)\1[^>]*>

");

matchcollection mc =reg.matches(yourstr);

foreach (match m in

mc)

方法4:

提取img src

class="

brush: c-sharp;

">

//////獲取img的路徑

//////

html字串文字

///以陣列形式返回路徑

public

static

string gethtmlimageurllist(string

htmltext)

return

surllist;

}

C 中使用正規表示式提取超連結位址的集中方法

一般在做爬蟲或者cms的時候經常需要提取 href鏈結或者是src位址。此時可以使用正規表示式輕鬆完成。regex reg new regex is href s 1 matchcollection mc reg.matches yourstr foreach match m in mc 方法2 r...

超連結提取的正規表示式

匯入 using system.text.regularexpressions 測試成功 string str regex re new regex href s s s regexoptions.ignorecase regexoptions.singleline matchcollection ...

微軟面試題 正規表示式提取鏈結位址

寫出正規表示式,從乙個字串中提取鏈結位址。比如下面字串中 it面試題部落格中包含很多 微軟面試題 微軟面試題 則需要提取的位址為 微軟面試題 在python中 import re p re.compile href content it面試題部落格中包含很多 p.search content gro...