讀書筆記資料科學入門 視覺化資料

2021-07-17 00:19:40 字數 3079 閱讀 9958

資料視覺化是資料科學家的重要部分。建立視覺化的目的:探索資料,交流資料。

本章利用乙個外接的matplotlib庫的配置進行視覺化的初步了解

許多任務具可以視覺化資料,目前應用很廣的是matplotlib庫,在windows下配置該模組稍微比較麻煩,下面會一步一步講解:

matplotib 是python 的乙個繪相簿,裡頭有各種各樣的繪圖方法,可以用matplotib 顯示影象,放大影象,儲存影象等等,對於opencv處理影象具有非常大的幫助。

python第三方模組中一般會自帶setup.py檔案,在windows環境下,我們只需要使用cmd命令:

cd c:\python\..

python setup.py install

numpy,scipy,matplotlib

numpy: 

scipy: 

matplotlib: 

當出現各種報錯的時候,然後進行測試的時候一般會出現很多問題都是確實某某模組的問題,這些模組舉例如下:

1. no module name six

解壓之後,進入解壓目錄,命令列執行 python setup.py install 就可以安裝完成。

2.importerror: matplotlib requires dateutil

同樣到解壓目錄下,執行 python  setup.py install 同樣可以安裝成功,

3.importerror: matplotlib requires pyparsing

以上缺少的模組以及應對各種模組不同安裝方法如上。

測試程式如下:

觀察離散的專案集合數量變化:

>>> movies = ["annie","ben-hur","caseblanca","gandhi","westsidestory"]

>>> num_oscars=[5,11,3,8,10]

>>> xs = [i+0.1 for i,_ in enumerate(moveies)]

>>> xs = [i+0.1 for i,_ in enumerate(movies)]

>>> from matplotlib import pyplot as plt

>>> plt.bar(xs,num_oscars)//設定條形圖高度和寬度

>>> plt.title("love movies")

>>> plt.xticks([i+0.5 for i,_ in enumerate(movies)],movies)//設定x軸的變數名字

條形圖主要用來繪製擁有大量數值取值的變數直方圖,探索取值是如何分布的。其中bar函式引數中寬度設定了左移變數是為了使中心在某處。

函式plt.axis([2012.5,2014.5,499,506])顯示的是橫軸2013到2014而縱軸是499到506

如果為了表示某種事物的趨勢,那麼可以採用線圖。

首先進行資料的讀取:

>>> variance = [1,2,4,8,16,32,64,128,256]

>>> bias_squared=[256,128,64,32,16,8,4,2,1]

>>> total_error=[x+y for x,y in zip(variance,bias_squared)]

>>> total_error

[257, 130, 68, 40, 32, 40, 68, 130, 257]

>>> xs = [i for i,_ in enumerate(variance)]

>>> xs

[0, 1, 2, 3, 4, 5, 6, 7, 8]

然後進行繪製偏差方差的權衡圖

同乙個圖上顯示多個序列:

散點圖是顯示成對資料集的視覺化關係的選擇,比如你的使用者已有的朋友數目和他們每天花在**上分鐘數

筆記 資料缺失視覺化

coding utf 8 匯入warnings包,利用過濾器來實現忽略警告語句。import warnings warnings.filterwarnings ignore import pandas as pd import numpy as np import matplotlib.pyplot...

12 19學習筆記 資料視覺化

前奏 import matplotlib.pyplot as plt x 1,2,3 x1 2,3,4 y 1,2,3,4,5 z com a com b com c z1 com a com b com c plt.bar z,x,label bar 1 color red 柱狀圖 plt.bar...

資料科學導論課程筆記(二) 資料視覺化

資料視覺化是一項致力於把抽象的資料或概念轉化為適於人類理解和接受的視覺化的資訊的技術。是乙個典型的交叉學科,涉及電腦科學,認知心理學,美學和藝術設計等學科,涉及資料處理 演算法設計和軟體開發和人機互動等多種知識和技能。視覺化是一種以影象 圖表或動畫的形式進行有效資訊傳遞的技術。它的主要目的在於,作為...