記錄Python正規表示式學習

網上找了很多方法，都仔細讀懂了，但是自己發現很多html頁面中其實可以用更巧妙的方法去提取http鏈結，用的思想是，html中url鏈結都是一組雙引號中的，我只需要針對鏈結末尾的（且出現的第乙個）雙引號即可

html頁面例

// an highlighted block
="hotnews"
>
="im**iew"id=
"im**iew"
>
""target=
"_blank"
>
"">
<
/a>
<
/div>
"hdline0"
>
""target=
"_blank"
class
="a3"
>
...的***之「喻」 <
/a>
<
/li>
="hdline1"
>
""target=
"_blank"
>
《***x》宣傳片<
/a>
"font-size: 12px"
>
<
/i>
""target=
"_blank"
>
主題歌《夢想陽光》發布<
/a>
<
/li>
="hdline2"
>
"">
""target=
"_blank"
class
="a3"
>
【央視快評】******xx道路<
/a>
<
/li>
="hdline3"
>
""target=
"_blank"
>同舟共濟<
/a>
"font-size: 12px"
>
<
/i>
""target=
"_blank"
>
《***x關鍵一招》第一集<
/a>
<
/li>
="hdline4"
>
""target=
"_blank"
class
="a3"
>
【數說xx開放40年】40年減貧7.4億人<
/a>
<
/li>
="hdline5"
>
""target=
"_blank"
>***出席的這個活動，有什麼來頭？<
/a>
<
/li>
<
/ul>
<
/div>關鍵**：
(i)結果：
				學習記錄 正規表示式
學習記錄 正規表示式 註明 記錄工作和學習中常用的正規表示式以及php中常用得兩個函式preg match all preg replace 特殊字元類含義.所有字元 d所有數字 d所有非數字 w數字字母下劃線 w非數字字母下劃線 s 換行等空白區域 s非空白區域 1 匹配字元1 1 3 匹配字元1...
				學習正規表示式記錄
表1.常用的元字元 說明 匹配除換行符以外的任意字元 w匹配字母或數字或下劃線或漢字 s匹配任意的空白符 d匹配數字 b匹配單詞的開始或結束 匹配字串的開始 匹配字串的結束 1.d 這個是驗證輸入5到12位的數字 2.語法說明 重複零次或更多次 重複一次或更多次 重複零次或一次 重複n次 重複n次或...
				正規表示式學習記錄
表示用什麼開頭 b 表示以b開頭的字元 表示以什麼結尾 3 表示以3結尾的字元 代表任意字元 代表出現任意個數，包括0次 代表出現必須大於1次，不包括0次 代表出現2次 代表任意字元出現2次 代表出現3次和3次以上 代表出現2 5次 非貪婪匹配 從左邊開始匹配 如 匹配aaxooooooxoxxjf...

記錄Python正規表示式學習

學習記錄 正規表示式

學習正規表示式記錄

正規表示式學習記錄

相關推薦

學習記錄正規表示式