Python資料處理 資料視覺化 一

2021-10-20 12:51:06 字數 1937 閱讀 6394

以資料集iris為例——iris資料集是乙個有關花的資料集,涉及花的四個特徵,分別是花萼的長和寬,花瓣的長和寬

#引入第三方庫

import numpy as np

import seaborn as sns

import matplotlib.pyplot as plt

from pandas import dataframe

import pandas as pd

from sklearn.datasets import load_iris

from sklearn.decomposition import pca

from sklearn.model_selection import train_test_split

from sklearn.svm import svc

from sklearn.metrics import accuracy_score

#匯入iris資料集

iris =

load_iris

()

#定義變數 賦值

iris_data = iris.data

feature_names = iris.feature_names

iris_target = iris.target

#格式整理

iris_target.shape =

(150,1

)iris_all = np.

hstack

((iris_data,iris_target)

)#轉化為dataframe格式

iris_data_df =

dataframe

(iris_data,columns=feature_names)

iris_target_df =

dataframe

(iris_target,columns=

['target'])

iris_data_all_df =

dataframe

(iris_all,columns=feature_names+

['target'

])

#箱線圖

sns.

boxenplot

(data=iris_data_df)

plt.

show

()

#折線圖

plt.

plot

(iris_data_df)

plt.

legend

(feature_names)

plt.

show

()

sepal_data_df = iris_data_df[

['sepal length (cm)'

,'sepal width (cm)']]

plt.

plot

(sepal_data_df)

plt.

legend([

'sepal length (cm)'

,'sepal width (cm)'])

plt.

title

('sepal data'

)plt.

show

()

sns.

pairplot

(iris_data_all_df,vars=iris_data_all_df.columns[:4

],hue=

'target'

,size=

3,kind=

"reg"

)plt.

show

()

Python資料處理之資料視覺化 二

本篇使用資料 口袋妖怪資料集 提取碼s30w import pandas as pd import matplotlib.pyplot as plt import matplotlib.gridspec as gridspec 匯入資料 data pd.read csv data pokemon p...

Pandas資料處理基礎7 資料視覺化及其用法

numpy,pandas,matplotlib 構成了乙個完善的資料分析生態圈,所以 3 個工具的相容性也非常好,甚至共享了大量的介面。當我們的資料是以 dataframe 格式呈現時,可以直接使用 pandas 提供的 dataframe.plot 方法呼叫 matplotlib 介面繪製常見的圖...

Python 資料視覺化

資料視覺化指的是通過視覺化表示來探索資料,它與資料探勘緊緊相關,而資料探勘指的是使用 來探索資料集的規律和關聯。資料集可以是用一行 就能表示的小型數字列表,也可以是數以吉位元組的資料。漂亮地呈現資料關乎的並非僅僅是漂亮的。以引人注目的簡潔方式呈現資料,讓人能夠明白其含義,發現資料集中原本未意識到的規...