>>
> df = pd.dataframe([[
1,1,
1,1]
,[2,
2,2,
2],[
3,3,
3,3]
], \
columns=
["col1"
,"col2"
,"col3"
,"col4"])
>>
> df # 輸出
col1 col2 col3 col4
0111112
2222
3333
如果我們呼叫df.mean(axis=1)
,我們將得到按行計算的均值
>>
> df.mean(axis=1)
0112
23
然而,如果我們呼叫df.drop((name, axis=1)
,我們實際上刪掉了一列,而不是一行:
>>
> df.drop(
"col4"
, axis=1)
col1 col2 col301
1112
2223
33
其實問題理解axis
有問題,df.mean
其實是在每一行上取所有列的均值,而不是保留每一列的均值。也許簡單的來記就是axis=0
代表往跨行(down
),而axis=1
代表跨列(across
),作為方法動作的副詞(譯者注)
換句話說:
下圖代表在dataframe
當中axis
為0
和1
時分別代表的含義:
軸用來為超過一維的陣列定義的屬性
二維資料擁有兩個軸:第0軸沿著行的垂直往下,第1軸沿著列的方向水平延伸。所以問題當中第乙個列子
df.mean(axis=1)
代表沿著列水平方向計算均值,而第二個列子df.drop(name, axis=1)
代表將name
對應的列標籤(們)沿著水平的方向依次刪掉。 python資料分析
以網路爬蟲為例,網路爬蟲是乙個自動提取網頁的程式,爬蟲是搜尋引擎的第一步,也是最容易的一部。網頁搜尋,建立索引,查詢排序 用c c 效率高,速度塊,適合通用搜尋引擎做往往爬取。但是它的缺點也特別明顯 開發慢,寫起來又臭又長的。而python無論在資料分析還是在指令碼自動化編寫尚都是簡單,易學的。良好...
python資料分析
陣列間的算術運算 npwhere pandas的使用 np.random.rand 3,4 產生乙個3行4列的矩陣 0 1之間的 in 32 data1 1,2,3,4.0 in 34 arr1 np.array data1 in 35 arr1 out 35 array 1.2.3.4.in 37...
python資料分析
1.資料分析的含義與目標 2.python與資料分析 3.python資料分析大家族 4.python環境搭建 一 numpy 功能 ndarray 多維操作 線性代數 官網 numpy是python語言的乙個擴充程式庫。支援高階大量的維度陣列與矩陣運算,此外也針對陣列運算提供大量的數學函式庫。nu...