網上找了很多方法,都仔細讀懂了,但是自己發現很多html頁面中其實可以用更巧妙的方法去提取http鏈結,用的思想是,html中url鏈結都是一組雙引號中的,我只需要針對鏈結末尾的(且出現的第乙個)雙引號即可
html頁面例
// an highlighted block
="hotnews"
>
="im**iew"id=
"im**iew"
>
""target=
"_blank"
>
"">
<
/a>
<
/div>
"hdline0"
>
""target=
"_blank"
class
="a3"
>
...的***之「喻」 <
/a>
<
/li>
="hdline1"
>
""target=
"_blank"
>
《***x》宣傳片<
/a>
"font-size: 12px"
>
<
/i>
""target=
"_blank"
>
主題歌《夢想陽光》發布<
/a>
<
/li>
="hdline2"
>
"">
""target=
"_blank"
class
="a3"
>
【央視快評】******xx道路<
/a>
<
/li>
="hdline3"
>
""target=
"_blank"
>同舟共濟<
/a>
"font-size: 12px"
>
<
/i>
""target=
"_blank"
>
《***x關鍵一招》第一集<
/a>
<
/li>
="hdline4"
>
""target=
"_blank"
class
="a3"
>
【數說xx開放40年】40年減貧7.4億人<
/a>
<
/li>
="hdline5"
>
""target=
"_blank"
>***出席的這個活動,有什麼來頭?<
/a>
<
/li>
<
/ul>
<
/div>關鍵**:
(i)結果:
學習記錄 正規表示式
學習記錄 正規表示式 註明 記錄工作和學習中常用的正規表示式以及php中常用得兩個函式preg match all preg replace 特殊字元類含義.所有字元 d所有數字 d所有非數字 w數字字母下劃線 w非數字字母下劃線 s 換行等空白區域 s非空白區域 1 匹配字元1 1 3 匹配字元1...
學習正規表示式記錄
表1.常用的元字元 說明 匹配除換行符以外的任意字元 w匹配字母或數字或下劃線或漢字 s匹配任意的空白符 d匹配數字 b匹配單詞的開始或結束 匹配字串的開始 匹配字串的結束 1.d 這個是驗證輸入5到12位的數字 2.語法說明 重複零次或更多次 重複一次或更多次 重複零次或一次 重複n次 重複n次或...
正規表示式學習記錄
表示用什麼開頭 b 表示以b開頭的字元 表示以什麼結尾 3 表示以3結尾的字元 代表任意字元 代表出現任意個數,包括0次 代表出現必須大於1次,不包括0次 代表出現2次 代表任意字元出現2次 代表出現3次和3次以上 代表出現2 5次 非貪婪匹配 從左邊開始匹配 如 匹配aaxooooooxoxxjf...