一,什麼是模組?
1.常見的場景:乙個模組就是乙個包含了python定義和宣告的檔案,檔名就是模組名字加上.py的字尾。
但其實import載入的模組分為四個通用類別:
1 使用python編寫的**(.py檔案) # 自定義模組 我們自己寫的模組
2 已被編譯為共享庫或dll的c或c++擴充套件 # 第三方模組 需要我們自己安裝的模組
3 包好一組模組的包
4 使用c編寫並鏈結到python直譯器的內建模組 # 內建模組 不需要我們自己安裝的 直譯器自帶的
2.為何要使用模組?如果你退出python直譯器然後重新進入,那麼你之前定義的函式或者變數都將丟失,因此我們通常將程式寫到檔案中以便永久儲存下來,需要時就通過python test.py方式去執行,此時test.py被稱為指令碼script。
隨著程式的發展,功能越來越多,為了方便管理,我們通常將程式分成乙個個的檔案,這樣做程式的結構更清晰,方便管理。這時我們不僅僅可以把這些檔案當做指令碼去執行,還可以把他們當做模組來匯入到其他的模組中,實現了功能的重複利用,
模組的匯入應該在程式開始的地方
二,正規表示式(本身也和python沒有什麼關係,就是匹配字串內容的一種規則)
官方定義:正規表示式是對字串操作的一種邏輯公式,就是用事先定義好的一些特定字元、及這些特定字元的組合,組成乙個「規則字串」,這個「規則字串」用來表達對字串的一種過濾邏輯。
#正規表示式
1,#從大段的文字中找到符合規則的內容
#爬蟲 從網頁的字串中獲取你想要的資料
#日誌分析 提取 2018-8-12 10:---- 花的所有錢
#什麼是日誌 :
#2018-8-12 10:00:00 樓下早點攤 3.00
2, #
判斷某個字串是否完全符合規則
#表單驗證 : 手機號 qq號碼 郵箱 銀行卡 身份證號 密碼
#正規表示式 只和字串打交道
1字元組 : [字元組]
2在同乙個位置可能出現的各種字元組成了乙個字元組,在正規表示式中用表示
3字元分為很多類,比如數字、字母、標點等等。
4 假如你現在要求乙個位置"
只能出現乙個數字
",那麼這個位置上的字元只能是0、1、2...9這10個數之一。
#字元組 : 寫在中括號中的內容,都出現在下面的某乙個字元的位置上都是符合規則的
#[0-9] 匹配數字
#[a-z] 匹配小寫字母
#[a-z] 匹配大寫字母
#[8-9]
#[a-za-z] 匹配大小寫字母
#[a-za-z0-9] 匹配大小寫字母+數字
#[a-za-z0-9_] 匹配數字字母下滑線
#元字元#
\w 匹配數字字母下滑線 word關鍵字 [a-za-z0-9_]
#\d 匹配所有的數字 digit [0-9]
#\s 匹配所有的空白符 回車/換行符 製表符 空格 space [\n\t ]
#匹配換行符 回車 \n
#匹配製表符 tab \t
#匹配空格
#\w \d \s 和\w \d \s取反
#[\s\s] [\d\d] [\w\w]是三組全集 意思是匹配所有字元
#\b 表示單詞的邊界
#和轉義字母相關的 元字元
#\w \d \s(\n\t) \b \w \d \s
#^ $
#^ 匹配乙個字串的開始
#$ 匹配乙個字串的結束
#. 表示匹配 除換行符之外的所有字元
# 只要出現在中括號內的內容都可以被匹配
#[^] 只要不出現在中括號中的內容都可以被匹配
#有一些有特殊意義的元字元進入字元組中會回覆它本來的意義 : . | [ ] ( )
#a|b 或 符合a規則的或者b規則的都可以被匹配
#如果a規則是b規則的一部分,且a規則比b規則要苛刻/長,就把a規則寫在前面
#將更複雜的\更長的規則寫在最前面
#() 分組 表示給幾個字元加上量詞約束的需求的時候,就給這些量詞分在乙個組
#量詞#表示 這個量詞之前的字元出現n次
# 表示這個量詞之前的字元至少出現n次
# 表示這個量詞之前的字元出現n-m次
#? 表示匹配量詞之前的字元出現 0次 或者 1次 表示可有可無
#+ 表示匹配量詞之前的字元出現 1次 或者 多次
#* 表示匹配量詞之前的字元出現 0次 或者 多次
貪婪匹配:
#正規表示式的匹配特點 : 貪婪匹配
#它會在允許的範圍內取最長的結果
#非貪婪模式/惰性匹配 : 在量詞的後面加上?
#.*?x 匹配任意非換行符字元任意長度 直到遇到x就停止
#print(r'\\n')
#print(r'\n')
#關於字串挪到python中的轉義的問題 : 只需要在工具中測試完畢,確認可以匹配上之後,
挪到python中在字串的外面加上r,r''即可
正規表示式 的含義
的第乙個用法,匹配0次或1次。第二個含義,作為正則的懶惰模式。正則有兩種模式,一種為貪婪模式 預設 另外一種為懶惰模式,以下為例 abc dfe gh 對上面這個字串使用 將會匹配整個字串,因為正則預設是 盡可能多的匹配 雖然 abc 滿足我們的表示式,但是 abc dfe gh 也同樣滿足,所以正...
正規表示式符號含義
匹配字串的開始位置 在中使用,此時它表示不接受該字元集合。舉例 a 匹配以a開始的字串 a 匹配不含a的字串 當使用在a m表示範圍 當使用在第乙個字元時表示連字串。舉例 abc 匹配字元結束位置 舉例 a 匹配以a結束的字串 匹配除換行符 n之外的任何單字元。匹配前面的子表示式零次或一次 舉例 t...
正規表示式,模組
正規表示式 1 9 d 0 9x 1 9 d 0 9x 1 9 d d 0 9x 1 9 d 0 9x 1 9 d 貪婪匹配 貪婪匹配就是盡可能多的匹配 123script 加上?為將貪婪匹配模式轉為非貪婪匹配模式,會匹配盡量短的字串 的用法 是任意字元 是取 0 至 無限長度 是非貪婪模式。何在一...