python pandas str列內建方法

2021-08-17 19:10:54 字數 1097 閱讀 8592

pandas的dataframe,有時需要處理一些字串型別列,運用series.str列內建方法很方便。

1.one hot 獨熱編碼,get_dummies

series=data['列名'].str.get_dummies(sep=',')

實現dataframe中列有多值,且想把這列one hot下

2.切分字串,split()

series=data['列名'].str.split(',')

把dataframe列中字串以','分隔開,每個元素分開後存入乙個列表裡

series=data['列名'].str.split(',',expand=true)

引數expand,這個引數取true時,會把切割出來的內容當做一列,產生多列。

series=data['列名'].str.split(',',expand=true)[0]

可以只要第一列。

3.替換,replace()

series=data['列名'].str.replace(',','-')

用『-』代替『,』

4.是否包含表示式,contains()

series=data['列名'].str.contains('we')

返回的是布林值series

5.查詢所有符合正規表示式的字元findall()

series=data['列名'].str.findall("[a-z]")

以陣列的形式返回

6.計算字串的長度,len()

series=data['列名'].str.len()

7.去除前後的空白字元,strip()

series=data['列名'].str.strip()

rstrip() 去除後面的空白字元

lstrip() 去除前面的空白字元

8.isalnum() 是否全部是數字和字母組成

isalpha() 是否全部是字母

isdigit() 是否全部都是數字

isspace() 是否空格

islower() 是否全部小寫

isupper() 是否全部大寫

istitle() 是否只有首字母為大寫,其他字母為小寫

python pandas str列內建方法

pandas的dataframe,有時需要處理一些字串型別列,運用series.str列內建方法很方便。1.one hot 獨熱編碼,get dummies series data 列名 str.get dummies sep 實現dataframe中列有多值,且想把這列one hot下 2.切分字...

python pandas str列內建方法

pandas的dataframe,有時需要處理一些字串型別列,運用series.str列內建方法很方便。0 0.提取數字 f comment1 f comment str.extract d 提取該列中的數字,若無數字則為none,如 afc12.123 提取到12 1.one hot 獨熱編碼,g...

scrapy crawlspider內建方法原始碼

有經驗的同學都知道它是乙個列表,儲存的元素時rule類的例項,其中每乙個例項都定義了一種採集站點的行為。如果有多個rule都匹配同乙個鏈結,那麼位置下標最小的乙個rule將會被使用。init 在原始碼中可以看到,它主要就是執行了 compile rules方法,這邊暫時不講。parse 預設 方法,...