python爬蟲常用資料整理函式

2022-09-18 06:51:24 字數 473 閱讀 5643

text()                       獲取xpath中的值。...../h1/text()

extract()[0]              selector的方法用於提取內容為乙個陣列。

extract_first("")        與extract()[0]相同更加準確

contains()     匹配乙個屬性值中包含的字串 contains(@class, 'vote-post')

strip()        把頭和尾的空格去掉

lstrip()       把左邊的空格去掉

rstrip()         把右邊的空格去掉

replace('c1','c2')   把字串裡的c1替換成c2。故可以用replace(' ','')來去掉字串裡的所有空格

split()       通過指定分隔符對字串進行切片,如果引數num 有指定值,則僅分隔 num 個子字串

Python爬蟲day2 2 python函式詳解

1.認識python函式 函式的本質就是功能的封裝。使用函式可以大大提高程式設計的效率與程式的可讀性 2.區域性變數與全域性變數變數是有生效範圍的,這個生效範圍我們稱為作用域。作用域從變數出現開始到程式的最末的變數叫做全域性變數,作用域只在區域性的變數叫做區域性變數。3.函式引數使用詳解 函式的定義...

python常用函式 enumerate函式

1 如果對乙個列表,既要遍歷索引又要遍歷元素時,首先可以這樣寫 list1 這 是 乙個 測試 for i in range len list1 print i list1 i 2 上述方法有些累贅,利用enumerate 會更加直接和優美 list1 這 是 乙個 測試 for index,ite...

python爬蟲整理(包含例項)

提取碼 po9s pip install requestsresponse requests.post url,data 傳送post請求,請求url位址對應的響應 response.content.decode response.requests.headers 請求頭 response.head...