import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
train = pd.read_csv('f:\o2o\my data\ccf_online_stage1_train.csv')
train.head(5) #顯示前5行資料
train.tail(5) #顯示後5行
train.columns #檢視列名
train.info() #檢視各字段的資訊
train.shape #檢視資料集行列分布,幾行幾列
arr=train.groupby(u'action')#groupby 按屬性分組
a=pd.dataframe(arr.size())#將組數的計數count儲存在**中
print(a)
a.plot(kind='bar')#畫條形圖
plt.show()
驗證性分析 描述性分析
描述分析本質是對資料的特徵進行概括,一般會表現在如下方面 1.集中趨勢 2.離散趨勢 3.分布 概括的方式有數字和圖表,不過在此部分我們先講述數字,圖表部分在後續的資料視覺化部分說明。變數層次一般分為三類。定類層次 該類變數的取值只有類別屬性之分,無大小 程度之分。定序層次 該變數的取值除了有類別屬...
資料的描述性統計
對資料的描述分為三個維度,分別是 資料的集中趨勢 資料的離中趨勢和資料的分布形態。描述資料集中趨勢的指標有眾數 中位數和平均數,其中平均數又分為算數平均數 加權平均數和幾何平均數 眾數資料集合 現次數最多的數值被稱為眾數。如果乙個資料集合中,只有乙個數值出現最多,那麼這個數值就是該資料集合的眾數。眾...
描述性程式設計
1.描述性程式設計的思想 思想 物件沒有新增到物件庫,就用描述性程式設計的方法。如果有些物件無法新增到物件庫中,也可以用描述性程式設計。2.描述性程式設計的2種寫法 也可以多個屬性來確定乙個物件 屬性之間用逗號 英文狀態下的逗號 分開 browser micclass browser page mi...