1)類和物件
2)正規表示式
3)re模組
4)http請求
在python中,定義類是通過class關鍵字:
class student(object):定義好了student類,就可以根據student類建立出student的例項,建立例項是通過類名+()實現的:pass
class後面緊接著是類名,即student,類名通常是大寫開頭的單詞,緊接著是(object),表示該類是從哪個類繼承下來的,繼承的概念我們後面再講,通常,如果沒有合適的繼承類,就使用object類,這是所有類最終都會繼承的類。
bart = student()字串是程式設計時涉及到的最多的一種資料結構,對字串進行操作的需求幾乎無處不在。比如判斷乙個字串是否是合法的email位址,雖然可以程式設計提取@前後的子串,再分別判斷是否是單詞和網域名稱,但這樣做不但麻煩,而且**難以復用。bart
<main.student object at 0x10a67a590>
student
正規表示式是一種用來匹配字串的強有力的**。它的設計思想是用一種描述性的語言來給字串定義乙個規則,凡是符合規則的字串,我們就認為它「匹配」了,否則,該字串就是不合法的。
所以我們判斷乙個字串是否是合法的email的方法是:
建立乙個匹配email的正規表示式;
用該正規表示式去匹配使用者的輸入來判斷是否合法。
因為正規表示式也是用字串表示的,所以,我們要首先了解如何用字元來描述字元。
在正規表示式中,如果直接給出字元,就是精確匹配。用\d可以匹配乙個數字,\w可以匹配乙個字母或數字,所以:
『00\d』可以匹配』007』,但無法匹配』00a』;
『\d\d\d』可以匹配』010』;
『\w\w\d』可以匹配』py3』;
.可以匹配任意字元,所以:
'py.『可以匹配』pyc』、『pyo』、'py!'等等。
安裝requests
如果安裝了anaconda,requests就已經可用了。否則,需要在命令列下通過pip安裝:
$ pip install requests
如果遇到permission denied安裝失敗,**上sudo重試。
使用requests
要通過get訪問乙個頁面,只需要幾行**:
urllib提供了一系列用於操作url的功能。
geturllib的request模組可以非常方便地抓取url內容,也就是傳送乙個get請求到指定的頁面,然後返回http的響應:
例如,對豆瓣的乙個url進行抓取,並返回響應:
from urllib import requestpostwith request.urlopen(『』) as f:
data = f.read()
print(『status:』, f.status, f.reason)
for k, v in f.getheaders():
print(』%s: %s』 % (k, v))
print(『data:』, data.decode(『utf-8』))
如果要以post傳送乙個請求,只需要把引數data以bytes形式傳入。
handler
如果還需要更複雜的控制,比如通過乙個proxy去訪問**,我們需要利用proxyhandler來處理.
Python基礎第8期 任務1打卡
1 環境搭建 anaconda環境配置 直譯器 2 python初體驗 print and input 3 python基礎講解 python變數特性 命名規則 注釋方法 python中 作用 學會使用dir 及和help import使用 pep8介紹 4 python數值基本知識 python中...
Python基礎第8期 任務1打卡
1 環境搭建 anaconda環境配置 直譯器 2 python初體驗 print and input 3 python基礎講解 python變數特性 命名規則 注釋方法 python中 作用 學會使用dir 及和help import使用 pep8介紹 4 python數值基本知識 python中...
Python基礎第8期 任務1打卡
1 環境搭建 anaconda環境配置 直譯器 2 python初體驗 print and input 3 python基礎講解 python變數特性 命名規則 注釋方法 python中 作用 學會使用dir 及和help import使用 pep8介紹 4 python數值基本知識 python中...