模組的含義 正規表示式

2022-04-28 15:12:17 字數 2765 閱讀 7940

一,什麼是模組?

1.常見的場景:乙個模組就是乙個包含了python定義和宣告的檔案,檔名就是模組名字加上.py的字尾。

但其實import載入的模組分為四個通用類別: 

1 使用python編寫的**(.py檔案)    # 自定義模組 我們自己寫的模組

2 已被編譯為共享庫或dll的c或c++擴充套件    # 第三方模組 需要我們自己安裝的模組

3 包好一組模組的包

4 使用c編寫並鏈結到python直譯器的內建模組   # 內建模組 不需要我們自己安裝的 直譯器自帶的

2.為何要使用模組?

如果你退出python直譯器然後重新進入,那麼你之前定義的函式或者變數都將丟失,因此我們通常將程式寫到檔案中以便永久儲存下來,需要時就通過python test.py方式去執行,此時test.py被稱為指令碼script。

隨著程式的發展,功能越來越多,為了方便管理,我們通常將程式分成乙個個的檔案,這樣做程式的結構更清晰,方便管理。這時我們不僅僅可以把這些檔案當做指令碼去執行,還可以把他們當做模組來匯入到其他的模組中,實現了功能的重複利用,

模組的匯入應該在程式開始的地方

二,正規表示式(本身也和python沒有什麼關係,就是匹配字串內容的一種規則)

官方定義:正規表示式是對字串操作的一種邏輯公式,就是用事先定義好的一些特定字元、及這些特定字元的組合,

組成乙個「規則字串」,這個「規則字串」用來表達對字串的一種過濾邏輯。

#

正規表示式

1,#從大段的文字中找到符合規則的內容

#爬蟲 從網頁的字串中獲取你想要的資料

#日誌分析 提取 2018-8-12 10:---- 花的所有錢

#什麼是日誌 :

#2018-8-12 10:00:00 樓下早點攤 3.00

2, #

判斷某個字串是否完全符合規則

#表單驗證 : 手機號 qq號碼 郵箱 銀行卡 身份證號 密碼

#正規表示式 只和字串打交道

1

字元組 : [字元組]

2在同乙個位置可能出現的各種字元組成了乙個字元組,在正規表示式中用表示

3字元分為很多類,比如數字、字母、標點等等。

4 假如你現在要求乙個位置"

只能出現乙個數字

",那麼這個位置上的字元只能是0、1、2...9這10個數之一。

#

字元組 : 寫在中括號中的內容,都出現在下面的某乙個字元的位置上都是符合規則的

#[0-9] 匹配數字

#[a-z] 匹配小寫字母

#[a-z] 匹配大寫字母

#[8-9]

#[a-za-z] 匹配大小寫字母

#[a-za-z0-9] 匹配大小寫字母+數字

#[a-za-z0-9_] 匹配數字字母下滑線

#

元字元#

\w 匹配數字字母下滑線 word關鍵字 [a-za-z0-9_]

#\d 匹配所有的數字 digit [0-9]

#\s 匹配所有的空白符 回車/換行符 製表符 空格 space [\n\t ]

#匹配換行符 回車 \n

#匹配製表符 tab \t

#匹配空格

#\w \d \s 和\w \d \s取反

#[\s\s] [\d\d] [\w\w]是三組全集 意思是匹配所有字元

#\b 表示單詞的邊界

#和轉義字母相關的 元字元

#\w \d \s(\n\t) \b \w \d \s

#^ $

#^ 匹配乙個字串的開始

#$ 匹配乙個字串的結束

#. 表示匹配 除換行符之外的所有字元

# 只要出現在中括號內的內容都可以被匹配

#[^] 只要不出現在中括號中的內容都可以被匹配

#有一些有特殊意義的元字元進入字元組中會回覆它本來的意義 : . | [ ] ( )

#a|b 或 符合a規則的或者b規則的都可以被匹配

#如果a規則是b規則的一部分,且a規則比b規則要苛刻/長,就把a規則寫在前面

#將更複雜的\更長的規則寫在最前面

#() 分組 表示給幾個字元加上量詞約束的需求的時候,就給這些量詞分在乙個組

#量詞#

表示 這個量詞之前的字元出現n次

# 表示這個量詞之前的字元至少出現n次

# 表示這個量詞之前的字元出現n-m次

#? 表示匹配量詞之前的字元出現 0次 或者 1次 表示可有可無

#+ 表示匹配量詞之前的字元出現 1次 或者 多次

#* 表示匹配量詞之前的字元出現 0次 或者 多次

貪婪匹配:   

#

正規表示式的匹配特點 : 貪婪匹配

#它會在允許的範圍內取最長的結果

#非貪婪模式/惰性匹配 : 在量詞的後面加上?

#.*?x 匹配任意非換行符字元任意長度 直到遇到x就停止

#print(r'\\n')

#print(r'\n')

#關於字串挪到python中的轉義的問題 : 只需要在工具中測試完畢,確認可以匹配上之後,

挪到python中在字串的外面加上r,r''即可

正規表示式 的含義

的第乙個用法,匹配0次或1次。第二個含義,作為正則的懶惰模式。正則有兩種模式,一種為貪婪模式 預設 另外一種為懶惰模式,以下為例 abc dfe gh 對上面這個字串使用 將會匹配整個字串,因為正則預設是 盡可能多的匹配 雖然 abc 滿足我們的表示式,但是 abc dfe gh 也同樣滿足,所以正...

正規表示式符號含義

匹配字串的開始位置 在中使用,此時它表示不接受該字元集合。舉例 a 匹配以a開始的字串 a 匹配不含a的字串 當使用在a m表示範圍 當使用在第乙個字元時表示連字串。舉例 abc 匹配字元結束位置 舉例 a 匹配以a結束的字串 匹配除換行符 n之外的任何單字元。匹配前面的子表示式零次或一次 舉例 t...

正規表示式,模組

正規表示式 1 9 d 0 9x 1 9 d 0 9x 1 9 d d 0 9x 1 9 d 0 9x 1 9 d 貪婪匹配 貪婪匹配就是盡可能多的匹配 123script 加上?為將貪婪匹配模式轉為非貪婪匹配模式,會匹配盡量短的字串 的用法 是任意字元 是取 0 至 無限長度 是非貪婪模式。何在一...