pandas入門之string與object

2021-10-07 12:53:03 字數 1001 閱讀 1787

1.轉換

pd.series([1

,'1.'])

.astype(

'str'

).astype(

'string'

)

2.拆分str.split

s.

str.split(

'_')

.str[1

]

3.拼接str.cat

4.替換str.replace函式與正規表示式

需要賦值元素為缺失值**為object再轉回來),否則請使用str.replace方法

5.字串匹配與提取

5.1str.extract方法

5.2str.extractall方法

與extract只匹配第乙個符合條件的表示式不同,extractall會找出所有符合條件的字串,並建立多級索引(即使只找到乙個)。

5.3str.contains與str.match

match依賴於python的re.match,檢測內容為是否從頭開始包含該正則模式。

6.常用字串方法

6.1str.strip過濾空格

6.2str.lower和str.upper,大小寫轉換

6.3str.swapcase和str.capitalize,分別表示交換字母大小寫和大寫首字母

6.4isnumeric,檢查每一位是否都是數字。

【問題一】 str物件方法和df/series物件方法有什麼區別?

df[「xx」].str,那麼xx這一列必須是字串型別,當然在pandas裡面是object,不能是整形、時間型別等等。如果想對這些型別使用的話,必須先df[「xx」].astype(str)轉化一下,才能使用此方法。

【問題三】 rsplit方法的作用是什麼?它在什麼場合下適用?

和split用法一致,只不過預設是從右往左分隔

本文的內容來自datawhale社群pandas組隊學習專案,具體教程請檢視

pandas 入門之Series學習

pandas 入門學習 series 使用方法 import pandas as pd from pandas import series,dataframe import numpy as npseries 是一種類似於一維陣列的物件,它是由一組資料 各種numpy資料 以及一組與之相關的索引組成...

Pandas 快速入門

pandas其實很簡單,共有三種資料結構。其中一維為series,二維為dataframe,三維為panel.先說series,numpy陣列,python列表等都可以生成series。它的結構分為兩部分,索引和值。獲取索引的方式為 index 方法,獲取值得方式為values 方法。而資料框又多乙...

pandas入門 十一

跟series中的值一樣,軸標籤也可以通過函式或對映進行轉換,從而得到乙個新的不同標籤的物件。軸還可以被就地修改,而無需新建乙個資料結構。跟series一樣,軸索引也有乙個map方法 將其賦值給index,這樣就可以對dataframe進行就地修改 想要建立資料集的轉換版 而不是修改原始資料 比較實...