pandas的dataframe,有時需要處理一些字串型別列,運用series.str列內建方法很方便。0
0.提取數字
f[『comment1』]=f[『comment』].str.extract(』(\d+)』)
提取該列中的數字,若無數字則為none,如:afc12.123 提取到12
1.one hot 獨熱編碼,get_dummies
series=data[『列名』].str.get_dummies(sep=』,』)
實現dataframe中列有多值,且想把這列one hot下
2.切分字串,split()
series=data[『列名』].str.split(』,』)
把dataframe列中字串以』,'分隔開,每個元素分開後存入乙個列表裡
series=data[『列名』].str.split(』,』,expand=true)
引數expand,這個引數取true時,會把切割出來的內容當做一列,產生多列。
series=data[『列名』].str.split(』,』,expand=true)[0]
可以只要第一列。
3.替換,replace()
series=data[『列名』].str.replace(』,』,』-』)
用『-』代替『,』
4.是否包含表示式,contains()
series=data[『列名』].str.contains(『we』)
返回的是布林值series
5.查詢所有符合正規表示式的字元findall()
series=data[『列名』].str.findall("[a-z]")
以陣列的形式返回
6.計算字串的長度,len()
series=data[『列名』].str.len()
7.去除前後的空白字元,strip()
series=data[『列名』].str.strip()
rstrip() 去除後面的空白字元
lstrip() 去除前面的空白字元
8.isalnum() 是否全部是數字和字母組成
isalpha() 是否全部是字母
isdigit() 是否全部都是數字
isspace() 是否空格
islower() 是否全部小寫
isupper() 是否全部大寫
istitle() 是否只有首字母為大寫,其他字母為小寫
python pandas str列內建方法
pandas的dataframe,有時需要處理一些字串型別列,運用series.str列內建方法很方便。1.one hot 獨熱編碼,get dummies series data 列名 str.get dummies sep 實現dataframe中列有多值,且想把這列one hot下 2.切分字...
python pandas str列內建方法
pandas的dataframe,有時需要處理一些字串型別列,運用series.str列內建方法很方便。1.one hot 獨熱編碼,get dummies series data 列名 str.get dummies sep 實現dataframe中列有多值,且想把這列one hot下 2.切分字...
scrapy crawlspider內建方法原始碼
有經驗的同學都知道它是乙個列表,儲存的元素時rule類的例項,其中每乙個例項都定義了一種採集站點的行為。如果有多個rule都匹配同乙個鏈結,那麼位置下標最小的乙個rule將會被使用。init 在原始碼中可以看到,它主要就是執行了 compile rules方法,這邊暫時不講。parse 預設 方法,...