python 3 5 爬蟲日記2

2021-07-09 06:04:35 字數 706 閱讀 5579

from urllib import request

#輸入正規表示式模組

import re

page=1

url=''

r=request.request(url)

r.add_header('user-agent','abc')

#讀取首頁原碼並命名為content

content=request.urlopen(r).read().decode('utf-8')

#用compile方法預編譯,即制定匹配規則:re.compile函式有兩個引數(pattern,flag=0),若flag引數為re.s,則正規表示式中的「.」也可以表示一行(預設「.」表示除行以外的任何字元。主要使用.*?和(.*?)兩個組合,.*? 是乙個固定的搭配,.和*代表可以匹配任意無限多個字元,加上?表示使用非貪婪模式進行匹配,也就是我們會盡可能短地做匹配,以後我們還會大量用到 .*? 的搭配。(.*?)代表乙個分組,在這個正規表示式中我們匹配了五個分組,在後面的遍歷item中,item[0]就代表第乙個(.*?)所指代的內容,item[1]就代表第二個(.*?)所指代的內容,以此類推。

pattern=re.compile('.(.*?)(.*?)(.*?)#findall函式在給定字串中查詢所有符合上述正則規則的表示式。

items=re.findall(pattern,content)

for item in items:

python3 5學習if(學習筆記2)

coding utf 8 height input 請輸入你的身高 單位 m height float height weight input 請輸入你的體重 單位 kg weight float weight data weight 2 height print data if data 18.5...

python 3 5 學習筆記

字串方法 msg this is message msg.title 首字母大寫 msg.lower 字串全部小寫 msg.upper 字串全部大寫 msg.rstrip 刪除字串前後的空格 msg.lstrip 刪除字串前面的空格 msg.strip 刪除字串後面的空格 str msg 將msg轉...

Python 3 5 變數命名規範

為了避免編寫 時產生錯誤,也為了使寫出的 具有更好的可讀性,python中的變數應遵守以下命名規範 1.變數名只能包含字母 數字和下劃線。變數名不能以數字開頭,但可以使用字母或者下劃線開頭。2.不要使用python的保留關鍵字作為變數名。如class print等。3.變數名中不要包含空格,如需分隔...