import pandas as pd
data =
df = pd.dataframe(data,index=
['s1'
,'s2'])
print
(df)
# 兩數相加
print
(df[
'c1'
]+ df[
'c2'])
# 兩數相減
print
(df[
'c1'
]-df[
'c2'])
# 兩數相乘
print
(df[
"c1"
]* df[
'c2'])
# 兩數相除
print
(df[
"c1"
]/ df[
'c2'])
# 任意一列加減乙個常數
print
(df[
"c1"]+
2)print
(df[
"c1"]-
2)# 任意一列乘除乙個數
print
(df[
"c1"]*
2)print
(df[
"c1"]/
2)
import pandas as pd
data =
df = pd.dataframe(data,index=
['s1'
,'s2'])
print
(df)
# 比較大小
print
(df[
'c1'
]>df[
'c2'])
print
(df[
'c1'
]!=df[
'c2'])
print
(df[
'c1'
]'c2'
])
import pandas as pd
data =
df = pd.dataframe(data,index=
['s1'
,'s2'])
print
(df)
'''彙總運算:就是將資料進行彙總返回乙個彙總以後的結果值
'''# 1。count非空值計算
# count函式:返回結果為該資料表中每列的非空值的個數
print
(df.count())
# axis = 1表示來求取每一行非空值的個數
print
(df.count(axis=1)
)# 也可以對每一列求個數
print
(df[
'c1'
].count())
# 2.sum求和函式
# sum函式:返回的是每一列的求和結果
print
(df.
sum())
# axis = 1表示每一行求和結果
print
(df.
sum(axis=1)
)# 也可以對每一列求和
print
(df[
'c1'].
sum())
# 3.mean求均值
# mean函式:返回每一列的均值
print
(df.mean())
# axis = 1表示每一行求均值
print
(df.mean(axis=1)
)# 也可以對每一列求均值
print
(df[
'c1'
].mean())
# 4。max求最大值
# max函式:可對每一行或每一列求最大值
print
(df.
max())
# axis = 1表示求每一行最大值
print
(df.
max(axis=1)
)# 也可以對每一列求最大值
print
(df[
'c1'].
max())
# 5。min求最小值
# max函式:可對每一行或每一列求最小值
print
(df.
min())
# axis = 1表示求每一行最大值
print
(df.
min(axis=1)
)# 也可以對每一列求最大值
print
(df[
'c1'].
min())
print
('...........換資料............'
)data1 =
df1 = pd.dataframe(data1,index=
['s1'
,'s2'
,'s3'])
print
(df1)
# 6。median求中位數
#median函式:可對每一行或每一列求中位數
print
(df1.median())
# axis = 1表示求每一行的中位數
print
(df1.median(axis=1)
)# 也可以對每一列求最大值
print
(df1[
'c1'
].median())
print
('...........換資料............'
)data2 =
df2 = pd.dataframe(data2,index=
['s1'
,'s2'
,'s3'])
print
(df2)
# 7.mode求眾數;眾數:每一組資料**現次數最多的數
# mode函式:可對每一行或每一列求眾數
print
(df2.mode())
# axis = 1表示求每一行的眾數
print
(df2.mode(axis=1)
)# 也可以對每一列求眾數
print
(df2[
'c1'
].mode())
#8。var求方差:方差是用來衡量一組資料的離散程度
#var函式:可對每一行或每一列求方差
print
(df1.var())
# axis = 1表示求每一行的方差
print
(df1.var(axis=1)
)# 也可以對每一列求方差
print
(df1[
'c1'
].var())
# 9。std求標準差:標準差是方差的平方根,二者都是用來表示資料的離散程度的
#std函式:可對每一行或每一列求標準差
print
(df1.std())
# axis = 1表示求每一行的標準差
print
(df1.std(axis=1)
)# 也可以對每一列求標準差
print
(df1[
'c1'
].std())
print
('...........換資料............'
)data3 =
df3 = pd.dataframe(data3,index=
['s1'
,'s2'
,'s3'
,'s4'
,'s5'])
print
(df3)
# 10。quantile求分位數:分位數是比中位數更加詳細的基於位置的指標,分位數主要有四分之一分位數,四分之二分位數,四分之三分位數,而四分之二分位數就是中位數
#std函式:可對每一行或每一列求分位數
# 求列的四分之一分位數
print
(df3.quantile(
0.25))
# 求列的四分之三分位數
print
(df3.quantile(
0.75))
# axis = 1表示求每一行的分位數
print
(df3.quantile(
0.25
,axis=1)
)# 也可以對每一列求分位數
print
(df3[
'c1'
].quantile(
0.25
))
'''
我們一般用相關係數來衡量兩者的相關程度,所以相關性計算就是計算相關係數,比較常用的是皮爾遜係數
'''import pandas as pd
data =
df = pd.dataframe(data)
print
(df)
#用corr函式計算相關性
print
(df[
'col1'
].corr(df[
'col2'])
)# 還可以對整個表中各個兩兩字段求相關性
print
(df.corr(
))
python 資料運算
算數運算 a 10b 20 print a b 相加print a b 減法print a b 乘法print b a 除法print b 2 a 求餘數print b a 冪次方print b a 取整數 結果如下 30 10 2002.0 210240000000000 2 比較運算 賦值運算 ...
python資料基本運算
1.移動到本行開頭 home鍵 2.移動到本行末尾 end鍵盤 3.注釋 ctrl 4.複製行 ctrl d 5.選擇列 滑鼠左鍵 alt 6.移動行 shift alt 上下箭頭1.單行注釋 以 號開頭。2.多行注釋 三引號開頭,三引號結尾。表示乙個功能,函式定義者是提供功能的人,函式呼叫者是使用...
python 或運算 Python運算子
python運算子 1 算術運算子 加 減 乘 除 這四個運算子是跟數學上的意義一致。取餘 兩者相除取餘數。取整 兩者相除取整數。冪 x的y次冪。a 100 b 21 c 2d 5 print a b print a b print a b print a b print a b print a b...