Python正規表示式使用過程中的小細節

2022-08-19 23:27:12 字數 510 閱讀 1891

今天用python寫了個簡單的爬蟲程式,抓取虎撲籃球(nba.hupu.com)的首頁內容,**如下:

1

#coding:gb2312

2import

urllib2, re

3 webpage = urllib2.urlopen('

')4 text =webpage.read()

5 m = re.search('彩票'

, text)

6print m.group(1)

按照預想應該輸出的結果是"

" ,但是得到的結果卻是:

"" >cba

|國際足球

|中國足球|賽車

|網球|裝備

|識貨|經過思考後發現問題所在,根據python正規表示式的貪婪匹配原則,python會匹配從 此外也需要注意 彩票

兩個group中的空格,若沒有空格,python將會將隨後的target="_blank"也進行匹配,空格在此相當於起分隔的作用。

python正規表示式及使用正規表示式的例子

正規表示式 正則表達用來匹配字串 正規表示式匹配過程 正規表示式語法規則 匹配除換行 n 外的任意字串 abcabc 轉義字元,使後乙個字元改變原來的意思 a c a c 字符集,對應的位置可以是字符集中任意字元,字符集中的字元可以逐個列出,也可以給出範圍,如 abc 或 a c 第乙個字元如果是 ...

Python正規表示式使用

python正規表示式使用 正規表示式不是python內建的功能,所以需要引入import re模組才可以使用。正規表示式的功能很多,但是我們通常使用的功能也就是那幾個,這裡對工作中經常使用到的正規表示式進行乙個系統的總結。1.字元 匹配除了換行符 n 外的字元 轉義字元,使後乙個字元改變以前的意思...

python 正規表示式使用

場景 替換很多動態資料的時候,會重複很多的條件判斷if,replace。作用 完成多步,同時去匹配符合特定規則的字串,完成通用的正則匹配 正規表示式是一種通用的字串匹配技術,是不會因為程式語言不同發生變化。想要查詢某種特徵的,具有一定規則的字串,都是可以嘗試使用正規表示式 jsonpath,xpat...