#coding:utf-8
#匯入warnings包,利用過濾器來實現忽略警告語句。
import warnings
warnings.filterwarnings(『ignore』)
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import missingno as msno
```python
## 1) 載入訓練集和測試集;
train_data = pd.read_csv('data/train.csv', sep=' ')
print("train_data.shape: ",train_data.shape)
# null視覺化
missing = train_data.isnull().
sum(
)missing = missing[missing >0]
missing.sort_values(inplace=
true
)# pandas中的sort_values()函式原理類似於sql中的order by,可以將資料集依照某個欄位中的資料進行排序,
# 該函式即可根據指定列資料也可根據指定行的資料排序。
# inplace引數:是否用排序後的資料集替換原來的資料,預設為false,即不替換
# missingno庫提供了乙個靈活易用的視覺化工具來觀察資料缺失情況,是基於matplotlib的,接受pandas資料來源
msno.matrix(train_data.sample(
250)
)# pandas.dataframe.sample:隨機選取若干行
12 19學習筆記 資料視覺化
前奏 import matplotlib.pyplot as plt x 1,2,3 x1 2,3,4 y 1,2,3,4,5 z com a com b com c z1 com a com b com c plt.bar z,x,label bar 1 color red 柱狀圖 plt.bar...
python缺失值視覺化
以阿里二手車交易 訓練資料為例 coding utf 8 匯入warnings包,利用過濾器來實現忽略警告語句。import warnings warnings.filterwarnings ignore import pandas as pd import matplotlib.pyplot as...
12 20學習筆記 資料視覺化小練習
主要用於處理一些資料 以讀取csv檔案為例 from matplotlib import pyplot as plt import pandas as pd x pd.read csv users 蔡洪浩 desktop countries.csv y x 10 y x.country china ...