1.series- 主要用於處理一維資料,一般由乙個陣列的資料構成。
2.dataframe- 主要用於處理二維資料。
from pandas import series, dataframe
-series
eg
import pandas as pd
s1 = pd.series([1,2,3,4])
s1 // 0 1
1 22 3
3 4
dtype: int64
s1.index
//rangeindex(start=0, stop=4, step=1)
s1.values
//array([1,2,3,4])
#利用index
s2 = pd.series([100,78,65,90],index=["chinese","english","history","maths"])
s2// chinese 100
english 78
history 65
maths 90
dtype: int64
s2[["english","history"]]
// english 78
history 65
dtype: int64
d1 =
s3 = pd.series(d1)
#s3就跟平常的series一樣
-dataframe
dfperson =
personsheet = pd.dataframe(dfperson)
#形成了清晰的**
// name age
0 tom 20
1 jack 21
2 kitty 20
3 eric 21
personsheet.head() #獲取前五個資料
personsheet.columns
personsheet.values
personsheet.age
import bumpy as np
numframe = np.random.randn(10,5) #10行5列
numsheet = pd.dataframe(numframe)
- 傳入資料
personinfo = pd.read_csv('dir',header=none,names=["column1",...,"columnn"])
#header = none 表示不將資料的第一行作為列名,且names自定義列名
personinfo = pd.read_excel('dir',headenone,names=["","",...,""])
personinfo.shape #獲取excel檔案的行和列
-排序
datasort = pd.series(range(5), index=['b','a','e','c','d'])
datasort.sort_index() #公升序排列
datasort.sort_index(ascending=false) #降序排列
-分組
personinfoed = personinfo.groupby(['age'])
personinfoed.count() #求數量
「妖精」團隊 阿里巴巴
6年 這個正迅速擴張的團隊仍超乎尋常地保持著 亢奮 和 戰鬥欲 有人質疑這是 精神控制術 而阿里巴巴決定在新年將塑造團隊的種種魔力 制度化 成為其 基本法 在以 白娘子傳奇 聞名的江南杭城,坐落著兩個氣質與這座城市極不搭調的樓層。15天前,這個富有 攻擊性 的空間 迫使全球最有影響力的女人之一,eb...
「妖精」團隊 阿里巴巴
6年 這個正迅速擴張的團隊仍超乎尋常地保持著 亢奮 和 戰鬥欲 有人質疑這是 精神控制術 而阿里巴巴決定在新年將塑造團隊的種種魔力 制度化 成為其 基本法 在以 白娘子傳奇 聞名的江南杭城,坐落著兩個氣質與這座城市極不搭調的樓層。15天前,這個富有 攻擊性 的空間 迫使全球最有影響力的女人之一,eb...
阿里巴巴的面試
今年4月17日,阿里巴巴到深圳招聘,受君銳的推薦,我也報著嘗試與有機會不放過的心理去參加了面試,畢竟長年這樣沒完沒了的跑來跑去也不是個辦法 面試位址是在上海賓館,來的人挺多的,估計有好幾百,因為來招聘的人就有十幾個,並且是從上午一直到下午,簡單的了解了一下,從銷售到工程師,再到架構師都在招,看來是準...