如果安裝的是anaconda 發行版,已自帶numpy. scipy, matplotlib, pandash, sckit-learn, kreas 和gensim 等,下面簡單介紹下這邊擴充套件包的,便於使用相關功能時快速查詢。
numpy :
python 沒有提供陣列功能,numpy提供了真正的資料功能,以及對資料進行快速處理的函式,很多庫將依賴於它!
scipy:
依賴於numpy, 提供矩陣支撐,讓其有類似malab的功能,最優化,積分,擬合,訊號影象處理,常微分求解和其他科學工程常用的計算。
matplotlib:
強大的資料視覺化工具,作相簿。主要用於二位繪圖和簡單的三維繪圖。
pandas:
強大,靈活的資料分析和探索工具。支援類似於sql的資料增刪查改,豐富的資料處理函式,支援時間序列功能,支援靈活處理缺失資料。基本結構為dataframe和series。
satasmodels:
pandas著眼於資料的讀取、處理和探索,而statsmodels則更注重用於資料的統計建模分析,類似於r。並支援與pandas進行資料互動,因此,組合為強大的資料探勘組合,
scikit-learn :
支援回歸、分類、聚類等強大的機器學習庫。包括資料預處理、分類、回歸、聚類、**和模型分析等。依賴於numpy,scipy和matplotlib。
kreas:
深度學習庫。彌補scikit-learn所沒有包含的神經網路。功能相對強大,但原理又相對簡單的模型,在語言處理、影象識別等領域有著重要的作用。
windows安裝較為麻煩,可用gpu加速預算
gensim:
文字主題模式下的庫,可用於文字挖掘。如文字相似度計算,lda,word2vec等,建議在linux環境下執行。
可架構虛擬機器進行操作。
python資料分析工具安裝集合
用python做資料分析離不開幾個好的輪子 或稱為科學棧 第三方包等 比如matplotlib,numpy,scipy,pandas,scikit learn,gensim等,這些包的功能強大,豐富,包括含了繪圖,機器學習,爬蟲,資料分析等等。而開發工具推薦使用pycharm或者jupyter no...
python資料分析工具安裝教程
python本身的資料分析功能不強,需要安裝一些第三方擴充套件庫來增強它的能力,介紹兩種方法 潔淨python3.x自行安裝庫 注意有安裝的先後順序 在cmd的視窗中執行python後執行或在pycharm的ter視窗中執行 1.1安裝numpy numpy實現了真正的陣列功能,後面介紹的scipy...
Python資料分析工具之matplotlib
能將資料進行視覺化,更直觀的呈現 使資料更加客觀 更具說服力 python 2d 繪圖領域使用最廣泛的套件 usr bin python coding utf 8 author acker date 2020 10 31 import matplotlib.pyplot as plt,matplot...