一般在做爬蟲或者cms的時候經常需要提取 href鏈結或者是src位址。此時可以使用正規表示式輕鬆完成。
regex
reg = new
regex(@"(?is)]*?href=(['""]?)(?[^'""\s>]+)\1[^>]*>(?(?:(?!");
matchcollection mc = reg.matches(yourstr);
foreach (match m in mc)
方法2:
regex r;match m;
r = new regex("href\\s*=\\s*(?:\"(?<1>[^\"]*)\"|(?<1>\\s+))",
regexoptions.ignorecase|regexoptions.compiled);
for (m = r.match(inputstring); m.success; m = m.nextmatch())
方法3:提取img src的
regex reg = newregex(@"(?i)]*?\ssrc\s*=\s*(['""]?)(?[^'""\s>]+)\1[^>]*>");
matchcollection mc = reg.matches(yourstr);
foreach (match m in mc)
方法4:
提取img src
///
/// 獲取img的路徑
///
/// html字串文字
/// 以陣列形式返回路徑
public static string gethtmlimageurllist(string htmltext)
return surllist;
}
C 中使用正規表示式提取超連結位址的集中方法
一般在做爬蟲或者cms的時候經常需要提取 href鏈結或者是src位址。此時可以使用正規表示式輕鬆完成。regex reg new regex is href s 1 matchcollection mc reg.matches yourstr foreach match m in mc 方法2 c...
超連結提取的正規表示式
匯入 using system.text.regularexpressions 測試成功 string str regex re new regex href s s s regexoptions.ignorecase regexoptions.singleline matchcollection ...
微軟面試題 正規表示式提取鏈結位址
寫出正規表示式,從乙個字串中提取鏈結位址。比如下面字串中 it面試題部落格中包含很多 微軟面試題 微軟面試題 則需要提取的位址為 微軟面試題 在python中 import re p re.compile href content it面試題部落格中包含很多 p.search content gro...