分析文字資料時經常要對csv檔案做處理,用pandas在對**資料取值時經常會忘了怎麼操作,下面做乙個小的總結,只涉及經常用的一些操作。
train.csv內容如下:
list1
list2
list3aa
1bb2
cc3d
d4ee
5
import pandas as pd
data = pd.read_csv('train.csv')
# 切片取某幾行值。第二三行
print(data[1:3])
# 取某幾列。第一二列
print(data[['list1','list2']])
# 取某行某列的值,即具體單元格。第一行第二列
print(data.iloc[0:1, 1:2])
# 或者
print(data.loc[0,'list2'])
# 或者
print(data.iat[0,1])
# 按條件取值,第三列大於2的所有行
print(data[data['list3']>2])
# 按條件取值,第三列行值等於c的單元格
print(data.loc[data['list1']=='c','list3'])
其中iloc只能用數字索引,不能用索引名,loc相反 pandas中dict和dataFrame互轉
pd.dataframe dict a 使用df.to dict 缺省會把key和值分開 引數 dict 預設 list series split records index 如果是list dict 這種巢狀情況轉的df,迴轉需要使用records 拿上面的資料舉例,df b a b c 0 0 ...
pandas的資料結構之DataFrame
dataframe是乙個 型的資料結構,它含有一組有序的列,每列可以是不同資料型別的資料。dataframe既有行索引也有列索引,可以將它看作為乙個由series組成的字典 共用同乙個索引 dataframe中的資料是以乙個或多個二維塊儲存的,而不是列表 字典或別的一維資料結構。a 通過字典建立,字...
pandas 把字典轉換成DataFrame
把dictd 轉換成dataframe,首先,dataframe的語法格式應為 import pandas as pd df pd.dataframe a 是columns,對應的是list12 輸出 a 0 012 但是如果是 df pd.dataframe 直接輸入dict 1會報錯 value...