text=
'現在是北京時間2020-3-16 2023年3月16日 2020.3.16 13:00'
re.findall(
'\d年\d月\d日'
,text)
[『2023年3月16日』]re.findall(
'\d\-\d\-\d'
,text)
[『2020-3-16』]re.findall(
'\d[\.\-/年]\d[\.\-/月]\d[\.\-/日]'
,text)
[『2020-3-16』, 『2023年3月16』, 『2020.3.16』]正規表示式的() {} 有著不同的意思。() 是為了提取匹配字串的,表示式中有幾個()就有幾個相應的匹配字串
(\s*)表示連續空格的字串
是定義匹配的字元範圍。比如[a-za-z0-9]表示相應位置的字元要匹配英文本元和數字。[\s表示空格或者號]
{}一般是用來匹配的長度。比如\s表示匹配三個空格,\s[1,3]表示匹配1到3個空格
(0-9)匹配』0-9』本身。[0-9]匹配數字(注意後面有,可以為空)[0-9]+匹配數字(注意後面有+,不可以為空)
寫法是錯誤的
[0-9]表示長度為0到9的數字字串。
正則匹配文字中的鏈結
最近做的乙個專案中遇到使用正則匹配一段文字中的 url 並將其顯示為短連線的需求。顯示的文字包括為防止 xss 而用 js 處理過的帶有特殊符號的文字以及 php 直接渲染後的文字,所以需要兩個正規表示式。匹配不帶特殊符號的文字的正則 匹配帶有特殊符號的文字的正則 type 為 0 表示文字中不帶有...
Python使用正則匹配處理文字
文字內容處理 import re pattern re.compile xmin n.xmax n.text pattern1 re.compile xmax pattern2 re.compile xmin with open 041.textgrid as lines 一次性讀入txt檔案,並把...
Python 正則匹配標籤中的 中文
有如下內容 text 測試學習正則 使用正則 匹配出所有的中文。p re.compile r x00 xff div for m in p.finditer text print m.group 1 列印結果 測試學習正則這樣就是比較的簡單,直接是 匹配ascii碼大於255的那些字元 包括中文符號...