正規表示式regular expression,這裡簡稱regex,簡而言之本質上是一種expression表示式。既是表示式,一般包含運算元和操作符。
php的正規表示式regex由單引號或雙引號加斜槓對稱包含,即『/[expression]/』或"/[expression]/",[expression]為自定義內容。基本用法:善用搜尋引擎searching? engine,簡稱se。各種search各種篩選的迭代。使用ascii碼字母字元來代表expression表示式中的字元模式。我們都知道,通用ascii碼是128個,是有序集合。所以從a到z可以寫成[a-z],區分大小寫是ascii碼表的基本常識。還有一些常規的縮寫expression表示式,對於新手而言很有規範的。但是用到後面,發現有些對中文字符集,如gb2312、gbk和big5裡的中文字元匹配就不太友好friendly,甚至感到有點糟糕的體驗experience。所以熟悉後建議使用ascii碼表和unicode編碼結合中文字符集自定義方為上策。
以上皆為「廢話」。
以下是一些自己的匹配通用expression表示式:
# 1)img標籤source源,副檔名字尾為.jpg .jpeg .png .gif .webp .bmp的
# 2)超連結http(s)
# 3)屬性包含href的標籤
$linktagpattern='/href=[\'"][^<>"\']+[\'"]/';
# 4)副檔名字尾為.js
# 5)img標籤
$imgpattern='/]*?>/';
# 6)img標籤,包含alt屬性
$altpattern='/]*alt=[^>]+>/';
# 7)html頭部的meta標籤,包含屬性為charset字符集
$mcharsetpattern='/]*charset=[^>]+>/';
# 8)屬性為charset
$charsetpattern='/charset=[a-za-z0-9]+/';
# 9)html頭部的title標籤,即網頁標題title
$titlepattern='/[^>]*<\/title>/';
# 2023年10月23日 星期三 13:02 mrn
# 10)title標籤內容,即標題內容
$titlesrcpattern='/[^<>]+/';
# 11)http(s) 響應response頭資訊:etag,即包含檔名的etag標籤
$tagfilepattern='/etag:[ ]*"[^<\"\']+"/';
# 12)響應response頭資訊的content-type資訊
$contenttypepattern='/content-type:[ ]*[a-za-z0-9]+[\/][a-za-z0-9]+/';
常用正規表示式範例
校驗數字的表示式 數字 0 9 n位的數字 d 至少n位的數字 d m n位的數字 d 零和非零開頭的數字 0 1 9 0 9 非零開頭的最多帶兩位小數的數字 1 9 0 9 0 9 帶1 2位小數的正數或負數 d d 正數 負數 和小數 d d 有兩位小數的正實數 0 9 0 9 有1 3位小數的...
php正規表示式詳解,PHP正規表示式使用詳解
操作符 描述 轉義符 圓括號和方括號 限定符 anymetacharacter 位置和順序 或 操作 全部符號解釋 字元 描述 將下乙個字元標記為乙個特殊字元 或乙個原義字元 或乙個 向後引用 或乙個八進位制轉義符。例如,n 匹配字元 n n 匹配乙個換行符。序列 匹配 而 則匹配 匹配輸入字串的開...
PHP正規表示式
php正規表示式的定義 用於描述字元排列和匹配模式的一種語法規則。它主要用於字串的模式分割 匹配 查詢及替換操作。php中的正則函式 php中有兩套正則函式,兩者功能差不多,分別為 一套是由pcre perl compatible regular expression 庫提供的。使用 preg 為字...