linux+pycharm+anaconda
import pandas as pd
#拿出資料,某幾行或某幾列
data=pd.dataframe([[
20,99999,6
],[30
,999999,6
],[20
,999994],
[27],
[30,999999,6
]])data.columns=
["年齡"
,"收入"
,"家屬數"
]data.index=
[i for i in
range(5
)]#通過傳去表頭拿資料
data[
["收入"
,"年齡"]]
#通過傳去具體位置拿資料(前行後是列)
data.iloc[:,
[0,2
]]#選擇所有行中的第一和第三列
#切片方法獲取資料
data.iloc[::
2,::
2]#篩選符合條件的資料,bool索引篩選
condition=data[
"年齡"
]>
25data[condition]
#loc[[行表頭],[列表頭]]和iloc[[行索引],[列索引]]
#bool值和列表頭篩選,多條件雙中括號
data[data[
"年齡"
]>25]
[["收入"
,"家屬數"]]
#混合篩選,ix[行索引,[列表頭]],棄用
data.ix[0:
2,["年齡"
,"收入"]]
#replace替換,得指定被替換的源資料
new_data=data[
'收入'
].replace(
99999
,999998
)#替換nana值,相當於fillna(),np.nan是python對缺失值的表示方式
new_data=data.replace(np.nan,
999955
)#多對對替換,data.replace()
#排序ascending,false降序,true公升序
new_data=data.sort_values(by=
["年齡"
],ascending=
false
)#通過na_position將確實值顯示在最前面
new_data=data.sort_values(by=
["收入"
],na_position=
"first"
)new_data
python基礎分析 資料分析 Python基礎
學python前要明確其使用目的。學python是為了進行資料分析,所以現階段最主要的任務是了解python的最基礎知識,然後通過運用python進行資料分析的專案,從而學會使用python。一 資料型別 1 整數 浮點數 字串 2 列表 list 2list.count obj 統計某個元素在列表...
python基礎資料分析
單樣本t檢驗 乙個連續變數與乙個數值的顯著性關係 sm.stats.descrstatsw a b ttest mean 0.1 0.1為引數 雙樣本t檢驗 乙個分類變數 二分類 與乙個連續變數的顯著性關係 方差齊性檢查 a1 creditcard exp a b 0 c a2 creditcard...
python資料分析基礎
python資料分析基礎 學資料分析之前應該明白整個資料分析的基本流程 1.明確需求與目的 2.資料收集 3.資料預處理 4.資料分析 5.編寫報告 假設檢驗,也稱為顯著性檢驗,是通過樣本的統計量,來判斷與總體引數之間是否存在差異 差異是否顯著 即我們對總體引數進行一定的假設,然後通過收集到的資料,...