筆記 資料缺失視覺化

2021-10-04 13:09:01 字數 1143 閱讀 3894

#coding:utf-8

#匯入warnings包,利用過濾器來實現忽略警告語句。

import warnings

warnings.filterwarnings(『ignore』)

import pandas as pd

import numpy as np

import matplotlib.pyplot as plt

import seaborn as sns

import missingno as msno

```python

## 1) 載入訓練集和測試集;

train_data = pd.read_csv('data/train.csv', sep=' ')

print("train_data.shape: ",train_data.shape)

# null視覺化

missing = train_data.isnull().

sum(

)missing = missing[missing >0]

missing.sort_values(inplace=

true

)# pandas中的sort_values()函式原理類似於sql中的order by,可以將資料集依照某個欄位中的資料進行排序,

# 該函式即可根據指定列資料也可根據指定行的資料排序。

# inplace引數:是否用排序後的資料集替換原來的資料,預設為false,即不替換

# missingno庫提供了乙個靈活易用的視覺化工具來觀察資料缺失情況,是基於matplotlib的,接受pandas資料來源

msno.matrix(train_data.sample(

250)

)# pandas.dataframe.sample:隨機選取若干行

12 19學習筆記 資料視覺化

前奏 import matplotlib.pyplot as plt x 1,2,3 x1 2,3,4 y 1,2,3,4,5 z com a com b com c z1 com a com b com c plt.bar z,x,label bar 1 color red 柱狀圖 plt.bar...

python缺失值視覺化

以阿里二手車交易 訓練資料為例 coding utf 8 匯入warnings包,利用過濾器來實現忽略警告語句。import warnings warnings.filterwarnings ignore import pandas as pd import matplotlib.pyplot as...

12 20學習筆記 資料視覺化小練習

主要用於處理一些資料 以讀取csv檔案為例 from matplotlib import pyplot as plt import pandas as pd x pd.read csv users 蔡洪浩 desktop countries.csv y x 10 y x.country china ...