pandas資料處理(一)
import pandas as pd
import numpy as np
#利用numpy生成一組datafrome資料
df=pd.dataframe(np.arange(16).reshape(4,4))
print(df)
–out
0 1 2 3
0 0 1 2 3
1 4 5 6 7
2 8 9 10 11
3 12 13 14 15
#我們看到有一行,豎我們沒有指定沒結果卻出現了,
#那因為datafrome是我們的二維數列,產生了行索引和豎索引
#當然我們也可以指定索引數值
df=pd.dataframe(np.arange(16,32).reshape(4,4),index=[『a』,『b』,『c』,『d』],columns=[『w』,『x』,『y』,『z』])
print(df)
–out
w x y z
a 16 17 18 19
b 20 21 22 23
c 24 25 26 27
d 28 29 30 31
#datafrome 匯入字典a=
df=pd.dataframe(a)
print(df)
–out
id name ***
0 001 小貓 女
1 002 小狗 男
2 003 小狼 男
#pandas果然功能強大,這也是我非常喜歡的乙個地方
#檢視行索引
print(df.index)
–out
rangeindex(start=0, stop=3, step=1)
#檢視列索引
print(df.columns)
–out
index([『id』, 『name』, 『***』], dtype=『object』)
#檢視資料
print(df.values)
–out
[[『001』 『小貓』 『女』]
[『002』 『小狗』 『男』]
[『003』 『小狼』 『男』]]
#檢視型別
print(type(df))
–out
#檢視列表中資料型別
print(type(df))
–out
id object
name object
*** object
dtype: object
#檢視資料維度
print(df.shape)
–out
(3, 3)
#按要求顯示資料
print(df.head(1))
–out
id name ***
0 001 小貓 女
#顯示倒數第一行
print(df.tail(1))
–out
id name ***
2 003 小狼 男
#顯示列表資訊
print(df.info())
–out
rangeindex: 3 entries, 0 to 2
data columns (total 3 columns):
0 id 3 non-null object
1 name 3 non-null object
2 *** 3 non-null object
dtypes: object(3)
memory usage: 200.0+ bytes
none
Pandas資料處理(一)
pandas是非常著名的開源資料處理庫,我們可以通過它完成對資料集進行快速讀取 轉換 過濾 分析等一系列操作。除此之外,pandas 擁有強大的缺失資料處理與資料 可謂是資料預處理中的必備利器。特有的資料結構是 pandas 的優勢和核心。我們可以將任意格式的資料轉換為 pandas 的資料型別,並...
pandas 資料處理
pandas中資料可以分為series,dataframe,panel分別表示一維至三維資料。其中在構造時,index表示行名,columns表示列名 構造方式 s pd.series data index index s pd series np random randn 5 index a b ...
pandas資料處理
dataframe.duplicated subset none,keep first 判斷dataframe中的資料是否有重複 必須一行中所有資料都重複才算重複,只能判斷行,不能判斷列 返回series dataframe.drop duplicates subset none,keep firs...