from urllib import request
#輸入正規表示式模組
import re
page=1
url=''
r=request.request(url)
r.add_header('user-agent','abc')
#讀取首頁原碼並命名為content
content=request.urlopen(r).read().decode('utf-8')
#用compile方法預編譯,即制定匹配規則:re.compile函式有兩個引數(pattern,flag=0),若flag引數為re.s,則正規表示式中的「.」也可以表示一行(預設「.」表示除行以外的任何字元。主要使用.*?和(.*?)兩個組合,.*? 是乙個固定的搭配,.和*代表可以匹配任意無限多個字元,加上?表示使用非貪婪模式進行匹配,也就是我們會盡可能短地做匹配,以後我們還會大量用到 .*? 的搭配。(.*?)代表乙個分組,在這個正規表示式中我們匹配了五個分組,在後面的遍歷item中,item[0]就代表第乙個(.*?)所指代的內容,item[1]就代表第二個(.*?)所指代的內容,以此類推。
pattern=re.compile('.(.*?)(.*?)(.*?)#findall函式在給定字串中查詢所有符合上述正則規則的表示式。
items=re.findall(pattern,content)
for item in items:
python3 5學習if(學習筆記2)
coding utf 8 height input 請輸入你的身高 單位 m height float height weight input 請輸入你的體重 單位 kg weight float weight data weight 2 height print data if data 18.5...
python 3 5 學習筆記
字串方法 msg this is message msg.title 首字母大寫 msg.lower 字串全部小寫 msg.upper 字串全部大寫 msg.rstrip 刪除字串前後的空格 msg.lstrip 刪除字串前面的空格 msg.strip 刪除字串後面的空格 str msg 將msg轉...
Python 3 5 變數命名規範
為了避免編寫 時產生錯誤,也為了使寫出的 具有更好的可讀性,python中的變數應遵守以下命名規範 1.變數名只能包含字母 數字和下劃線。變數名不能以數字開頭,但可以使用字母或者下劃線開頭。2.不要使用python的保留關鍵字作為變數名。如class print等。3.變數名中不要包含空格,如需分隔...