資料分析入門之numpy陣列資料大小比較與篩選去重

2021-10-01 19:25:42 字數 1694 閱讀 7393

3.比較資料

4.篩選出滿足條件的資料

5.去掉重複資料

import numpy

from pandas import dataframe

df = dataframe(

)print

(df)

#執行結果

data1 data2

02.080182

0.4941481-

0.291509

-0.2600242-

0.066761

0.793961

30.826279

1.269465

41.215479

-1.329569

df.

(lambda x:

min(x)

)#方法一

df.(

lambda x:

min(x)

,axis=0)

#方法二

#執行結果

data1 -

0.291509

data2 -

1.329569

dtype: float64

df.

(lambda x:

max(x)

,axis=

1)

#執行結果

02.0801821-

0.260024

20.793961

31.269465

41.215479

dtype: float64

df.

(lambda x:numpy.

all(x>0)

,axis=

1)

#執行結果

0true

1false

2false

3true

4false

dtype:

bool

df[df.

(lambda x:numpy.

all(x>0)

,axis=1)

]

#執行結果

data1 data2

0 2.080182 0.494148

3 0.826279 1.269465

from pandas import read_csv

filename =

"f:\\資料分析\\資料分析3\\章節4資料處理\\4\\4.3\\data.csv"

df = read_csv(filename,encoding=

"utf-8"

)print

(df)

df.drop_duplicates(

)

結果對比:

python資料分析 numpy入門

import numpy as np import random 建立陣列 t1 np.array random.randint 2,9 for i in range 10 t2 np.arange 1,6 t3 np.array range 1,10,2 print t1 t1 print t2 ...

資料分析 numpy陣列 01

預備知識 能夠乙個接乙個地儲存在計算機儲存器的一塊連續區域內的表示方法稱為陣列array。資料分析 numpy numpy是python語言的乙個拓展程式庫,支援大量的維度陣列與矩陣運算,而且numpy針對於陣列運算提供大量的數學函式庫。numpy 是乙個執行速度非常快的數學庫,主要用於陣列計算 1...

python資料分析之Numpy

numpy系統是python的一種開源的數值計算擴充套件 ndarray 多維陣列 所有元素必須是相同型別 ndim屬性,維度個數 shape屬性,各維度大小 dtype屬性,資料型別 coding utf 8 import numpy as np 生成指定維度的隨機多維資料 data np.ran...