認識常見的Python資料分析庫

2021-08-29 07:38:22 字數 890 閱讀 9945

numpy 是乙個 python 包。 它代表 「numeric python」。 它是乙個由多維陣列物件和用於處理陣列的例程集合組成的庫。

numpy的主要功能:

· 快速高效的多維陣列物件ndarray

· 用於對陣列執行元素級計算以及直接對陣列執行數**算的函式

· 用於讀寫硬碟上基於陣列的資料集的工具

· 線性代數運算、傅利葉變換,以及隨機數生成

· 用於將c、c++、fortran**整合到python的工具

· 與線性代數有關的操作;

· numpy 擁有線性代數和隨機數生成的內建函式;

總的來說,numpy適合用於科學計算和機器學習等大型計算工程,甚至成了matlab的優秀替代者。

scipy

scipy是乙個開放原始碼的bsd許可的數學,科學和工程庫。 scipy庫依賴於numpy,它提供了便捷且快速的n維陣列操作。構建scipy庫的主要原因是,它能與numpy陣列一起工作,並提供了許多使用者友好和高效的數字實踐,例如:數值積分和優化的例程。

matplotlib

matplotlib是乙個python 2d繪相簿,可以生成各種硬拷貝格式和跨平台互動式環境的出版物質量資料。matplotlib可用於python指令碼,python和ipython shell,jupyter筆記本,web應用程式伺服器和四個圖形使用者介面工具包。

matplotlib主要用於資料分析最後的資料視覺化。當然目前有很matplotlib的替代者,比如pychart、echarts。

後續計畫

本文只是對常見的python資料庫進行了簡單介紹,後續我們將開始一系列的python資料分析教程。由於python3未來更有可能成為主流,我們的python版本選為3.7.0,大家可以同步安裝好這些包,讓我們一起開啟python探索資料之旅~

資料分析 資料的認識

乙個資料物件代表乙個實體 entity 資料物件又稱為樣本 例項 資料點 或物件 資料行對應資料物件 列對應屬性 資料物件用屬性 attribute 描述 屬性 attribute 是乙個資料字段,表示資料物件的乙個特徵 標稱屬性 nominal attribute 其值是一些符號或者事物的名稱。是...

資料分析師認識

今天與同事聊到如何入手做乙份資料分析專題,詢問了整個製作流程,這也讓想要入門的人有個學習的地方。在做資料分析之前,需要具備資料分析基礎知識,比如基本定義 維度,指標等概念 以下製作專題五部曲流程 第一步,跟客戶確認需求,專題的目標是什麼 第二步,採集基礎資料,包括使用者基本資訊,使用者pv等 第三步...

python資料分析

以網路爬蟲為例,網路爬蟲是乙個自動提取網頁的程式,爬蟲是搜尋引擎的第一步,也是最容易的一部。網頁搜尋,建立索引,查詢排序 用c c 效率高,速度塊,適合通用搜尋引擎做往往爬取。但是它的缺點也特別明顯 開發慢,寫起來又臭又長的。而python無論在資料分析還是在指令碼自動化編寫尚都是簡單,易學的。良好...