初學pandas的時候,對資料的一些引數是記不太得的。所以就來記錄下這些輸出的意義。
在吳恩達的機器學習作業中,幾乎每個作業的步驟都是首先用pandas讀取資料,然後使用describe()方法進行檢視
就會得到如下:
那麼我門來看看這個表達了什麼:
由標題我們只看exam1,exam2代表兩個科目.來解釋一下
count:總共有100條記錄相當於100個人參加這兩次考試
mean:就是除去缺考的(等於空值)之外的平均值
std:就是成績的方差
min:就是成績最差的人
25%: 表示25%分位數 就是成績從低到高排序,在第百分之25的時候的人的成績
50%:就是成績剛好中間的分數。等於中位數
75%:跟25的解釋一樣。
max:第一名的分數,就是最大值
對pandas中describe的理解
例如讀入乙個資料 df pd.read csv somedata.csv 在探索資料的時候,可以使用describe函式,describe函式預設只列印出來numerical data的資料,對於object型別的不列印。例如 df.describe 缺省會把具有數值型別的資料的資訊列印出來。當然也...
describe和corr的用法詳解
1.data.describe 基本統計量 count 195.000000 數量 mean 2744.595385 均值 std 424.739407 標準差 min 865.000000 最小值 25 2460.600000 下四分位 50 2655.900000 中位數 75 3023.200...
pandas找出某值的所有行 Pandas基礎1
1.series 1.1 pandas系列可以使用以下建構函式建立 資料幀 dataframe 是二維資料結構,即資料以行和列的 方式排列。功能 潛在的列是不同的型別 大小可變 標記軸 行和列 可以對行和列執行算術運算 pandas中的dataframe可以使用以下建構函式建立 pandas.dat...