pandas的dataframe,有時需要處理一些字串型別列,運用series.str列內建方法很方便。
1.one hot 獨熱編碼,get_dummies
series=data['列名'].str.get_dummies(sep=',')
實現dataframe中列有多值,且想把這列one hot下
2.切分字串,split()
series=data['列名'].str.split(',')
把dataframe列中字串以','分隔開,每個元素分開後存入乙個列表裡
series=data['列名'].str.split(',',expand=true)
引數expand,這個引數取true時,會把切割出來的內容當做一列,產生多列。
series=data['列名'].str.split(',',expand=true)[0]
可以只要第一列。
3.替換,replace()
series=data['列名'].str.replace(',','-')
用『-』代替『,』
4.是否包含表示式,contains()
series=data['列名'].str.contains('we')
返回的是布林值series
5.查詢所有符合正規表示式的字元findall()
series=data['列名'].str.findall("[a-z]")
以陣列的形式返回
6.計算字串的長度,len()
series=data['列名'].str.len()
7.去除前後的空白字元,strip()
series=data['列名'].str.strip()
rstrip() 去除後面的空白字元
lstrip() 去除前面的空白字元
8.isalnum() 是否全部是數字和字母組成
isalpha() 是否全部是字母
isdigit() 是否全部都是數字
isspace() 是否空格
islower() 是否全部小寫
isupper() 是否全部大寫
istitle() 是否只有首字母為大寫,其他字母為小寫
python pandas str列內建方法
pandas的dataframe,有時需要處理一些字串型別列,運用series.str列內建方法很方便。1.one hot 獨熱編碼,get dummies series data 列名 str.get dummies sep 實現dataframe中列有多值,且想把這列one hot下 2.切分字...
python pandas str列內建方法
pandas的dataframe,有時需要處理一些字串型別列,運用series.str列內建方法很方便。0 0.提取數字 f comment1 f comment str.extract d 提取該列中的數字,若無數字則為none,如 afc12.123 提取到12 1.one hot 獨熱編碼,g...
scrapy crawlspider內建方法原始碼
有經驗的同學都知道它是乙個列表,儲存的元素時rule類的例項,其中每乙個例項都定義了一種採集站點的行為。如果有多個rule都匹配同乙個鏈結,那麼位置下標最小的乙個rule將會被使用。init 在原始碼中可以看到,它主要就是執行了 compile rules方法,這邊暫時不講。parse 預設 方法,...