定性資料的描述性分析

2021-08-11 04:41:08 字數 483 閱讀 6592

import pandas as pd

import numpy as np

import matplotlib.pyplot as plt

train = pd.read_csv('f:\o2o\my data\ccf_online_stage1_train.csv')

train.head(5) #顯示前5行資料

train.tail(5) #顯示後5行

train.columns #檢視列名

train.info() #檢視各字段的資訊

train.shape #檢視資料集行列分布,幾行幾列

arr=train.groupby(u'action')#groupby 按屬性分組

a=pd.dataframe(arr.size())#將組數的計數count儲存在**中

print(a)

a.plot(kind='bar')#畫條形圖 

plt.show()

驗證性分析 描述性分析

描述分析本質是對資料的特徵進行概括,一般會表現在如下方面 1.集中趨勢 2.離散趨勢 3.分布 概括的方式有數字和圖表,不過在此部分我們先講述數字,圖表部分在後續的資料視覺化部分說明。變數層次一般分為三類。定類層次 該類變數的取值只有類別屬性之分,無大小 程度之分。定序層次 該變數的取值除了有類別屬...

資料的描述性統計

對資料的描述分為三個維度,分別是 資料的集中趨勢 資料的離中趨勢和資料的分布形態。描述資料集中趨勢的指標有眾數 中位數和平均數,其中平均數又分為算數平均數 加權平均數和幾何平均數 眾數資料集合 現次數最多的數值被稱為眾數。如果乙個資料集合中,只有乙個數值出現最多,那麼這個數值就是該資料集合的眾數。眾...

描述性程式設計

1.描述性程式設計的思想 思想 物件沒有新增到物件庫,就用描述性程式設計的方法。如果有些物件無法新增到物件庫中,也可以用描述性程式設計。2.描述性程式設計的2種寫法 也可以多個屬性來確定乙個物件 屬性之間用逗號 英文狀態下的逗號 分開 browser micclass browser page mi...