3.比較資料
4.篩選出滿足條件的資料
5.去掉重複資料
import numpy
from pandas import dataframe
df = dataframe(
)print
(df)
#執行結果
data1 data2
02.080182
0.4941481-
0.291509
-0.2600242-
0.066761
0.793961
30.826279
1.269465
41.215479
-1.329569
df.
(lambda x:
min(x)
)#方法一
df.(
lambda x:
min(x)
,axis=0)
#方法二
#執行結果
data1 -
0.291509
data2 -
1.329569
dtype: float64
df.
(lambda x:
max(x)
,axis=
1)
#執行結果
02.0801821-
0.260024
20.793961
31.269465
41.215479
dtype: float64
df.
(lambda x:numpy.
all(x>0)
,axis=
1)
#執行結果
0true
1false
2false
3true
4false
dtype:
bool
df[df.
(lambda x:numpy.
all(x>0)
,axis=1)
]
#執行結果
data1 data2
0 2.080182 0.494148
3 0.826279 1.269465
from pandas import read_csv
filename =
"f:\\資料分析\\資料分析3\\章節4資料處理\\4\\4.3\\data.csv"
df = read_csv(filename,encoding=
"utf-8"
)print
(df)
df.drop_duplicates(
)
結果對比: python資料分析 numpy入門
import numpy as np import random 建立陣列 t1 np.array random.randint 2,9 for i in range 10 t2 np.arange 1,6 t3 np.array range 1,10,2 print t1 t1 print t2 ...
資料分析 numpy陣列 01
預備知識 能夠乙個接乙個地儲存在計算機儲存器的一塊連續區域內的表示方法稱為陣列array。資料分析 numpy numpy是python語言的乙個拓展程式庫,支援大量的維度陣列與矩陣運算,而且numpy針對於陣列運算提供大量的數學函式庫。numpy 是乙個執行速度非常快的數學庫,主要用於陣列計算 1...
python資料分析之Numpy
numpy系統是python的一種開源的數值計算擴充套件 ndarray 多維陣列 所有元素必須是相同型別 ndim屬性,維度個數 shape屬性,各維度大小 dtype屬性,資料型別 coding utf 8 import numpy as np 生成指定維度的隨機多維資料 data np.ran...