資料視覺化
#輸入所有的列都在輸出中,
df.describe(include='all')
#count:計數,這一組資料中包含的資料個數
#mean:平均值,這一組資料的平均值
#std:標準差,這一組資料的標準差
#top:資料**現次數最高的值
#unique:表示有多少種不同的值
#freq:出現次數最高的那個值的(top)的出現頻率
#50%:中位數
2、缺失值的視覺化
#check missing data 視覺化缺失值的情況
import missingno as msno # check missing value
#missingno提供了乙個小的工具集,它提供了靈活且易於使用的缺失資料視覺化和實用工具,允許您快速獲得
#資料集完整性(或缺失性)的視覺化摘要。
3、製作wordcloud
from wordcloud import wordcloud
fig,ax=plt.subplots(1,2,figsize=(16,32))
worldcloud=wordcloud(background_color='white',width=800,height=800).generate(' '.join(data['name']))
worldcloud_sub=wordcloud(background_color='white',width=800,height=800).generate(' '.join(data['subtitle'].dropna()
.astype(str)))
ax[0].imshow(worldcloud)
ax[0].axis('off')#關閉座標軸
ax[0].set_title('worldcloud(name)')#設定標題
資料視覺化 什麼是資料視覺化
資料對應的英文單詞是data,從資訊獲取的角度看,資料是對目標觀察和記錄的結果,是現實世界中的時間 地點 事件 其他物件或概念的描述。不同學者對資料的作用也給出不同的定義,大致分為以下3類 視覺化對應的兩個英文單詞 visualize和visualization。visualize是動詞,描述 生成...
資料視覺化
資料視覺化主要旨在借助於圖形化手段,清晰有效地傳達與溝通資訊。但是,這並不就意味著資料視覺化就一定因為要實現其功能用途而令人感到枯燥乏味,或者是為了看上去絢麗多彩而顯得極端複雜。為了有效地傳達思想概念,美學形式與功能需要齊頭並進,通過直觀地傳達關鍵的方面與特徵,從而實現對於相當稀疏而又複雜的 資料集...
資料視覺化
畫餅圖 def print pie input data res for each in input data res each res.get each,0 1 label x for j in res fig plt.figure plt.pie x,labels label,autopct 1...