import pandas as pd
df = pd.read_excel(
'成績表(統計).xls'
,sheet_name=
'寫入(新)'
)df = df[
'性別'
].astype(
str)
## 字串切片
df['身高_num'
]= df[
'身高'].
str[0:
3]## 去除
df['身高_num'
]= df[
'身高'].
str.strip(
'cm'
)df[
'身高_num'
]= df[
'身高'].
str.replace(
'cm',''
)print
(df.info())
## 轉換成整數型資料
df = df[
'身高_num'
].astype(
int)
## 字串分割(位址)
df = df[
'住址'].
str.split(
',')
df = df[
'住址'].
str.split(
',')
.str[0
]## 字串長度
df = df[
'住址'].
str.
len(
)print
(df)
pandas處理字串
1 dataframe的列 df.columns.str.strip df.columns.str.lower 處理列 清理開頭和結尾的白空格,將所有的名稱都換為小寫,並且將其餘的空格都替換為下劃線 df.columns df.columns.str.strip str.lower str.repl...
pandas 資料處理
pandas中資料可以分為series,dataframe,panel分別表示一維至三維資料。其中在構造時,index表示行名,columns表示列名 構造方式 s pd.series data index index s pd series np random randn 5 index a b ...
pandas資料處理
dataframe.duplicated subset none,keep first 判斷dataframe中的資料是否有重複 必須一行中所有資料都重複才算重複,只能判斷行,不能判斷列 返回series dataframe.drop duplicates subset none,keep firs...