1.numpy為python提供快速的陣列處理能力。對於數值型資料,numpy陣列在儲存和處理資料時要比內建的python資料結構高效得多;
2.pandas提供了快速便捷處理結構化資料的大量資料結構和函式;
3.matplotlib是最流行的用於繪製圖表和其它二維資料視覺化的python庫,生態非常好,可以作為預設的視覺化工具;
4.ipython是python資料棧最重要的工具之一,可以大大提高互動式計算和軟體開發的生產率,它是jupyter專案(乙個互動和探索式計算的高效環境)中的乙個元件,可以理解為乙個用於編寫、測試、除錯python**的強化shell;
5.scipy是提供了很多專門解決數學計算的各種標準集合,包括微積分,線代,訊號處理等。
6.statsmodels是乙個統計分析包,包含經典統計學和經濟計量學的演算法,包括線性回歸,方差分析等;
7.scikit-learn是python的通用機器學習工具包,包括分類,回歸,聚類等。
8.注意當使用conda或pip安裝包時,不能用pip公升級conda的包,這樣可能會導致環境發生問題;
利用python進行資料分析
目錄 10 minutes to pandas 翻譯 pandas中loc iloc ix的區別 pandas dropna函式 pandas中dataframe的stack unstack 和pivot 方法的對比 pandas中關於set index和reset index的用法 python匿...
利用python進行資料分析
利用python進行資料分析,需要了解一些基本的方法,比如掌握回歸分析的方法,通過線性回歸和邏輯回歸,其實你就可以對大多數的資料進行回歸分析,並得出相對精確地結論。這部分需要掌握的知識點如下 回歸分析 線性回歸 邏輯回歸 基本的分類演算法 決策樹 隨機森林 樸素貝葉斯 基本的聚類演算法 k mean...
《利用Python進行資料分析》筆記
之前的筆記一直記在我的印象筆記上,今天突然想到 不如直接記在部落格上,印象筆記只記錄生活上的事,這樣也分工明確一些。同時也能和大家分享,也許可以幫助到別人。由於這個學習筆記系列主要還是用於個人學習總結用,所以會比較凌亂,望大家理解!2017 9 23 p151 pd.dropna thresh 其中...