利用python進行資料分析 第一章

2021-10-10 21:34:09 字數 672 閱讀 5045

1.numpy為python提供快速的陣列處理能力。對於數值型資料,numpy陣列在儲存和處理資料時要比內建的python資料結構高效得多;

2.pandas提供了快速便捷處理結構化資料的大量資料結構和函式;

3.matplotlib是最流行的用於繪製圖表和其它二維資料視覺化的python庫,生態非常好,可以作為預設的視覺化工具;

4.ipython是python資料棧最重要的工具之一,可以大大提高互動式計算和軟體開發的生產率,它是jupyter專案(乙個互動和探索式計算的高效環境)中的乙個元件,可以理解為乙個用於編寫、測試、除錯python**的強化shell;

5.scipy是提供了很多專門解決數學計算的各種標準集合,包括微積分,線代,訊號處理等。

6.statsmodels是乙個統計分析包,包含經典統計學和經濟計量學的演算法,包括線性回歸,方差分析等;

7.scikit-learn是python的通用機器學習工具包,包括分類,回歸,聚類等。

8.注意當使用conda或pip安裝包時,不能用pip公升級conda的包,這樣可能會導致環境發生問題;

利用python進行資料分析

目錄 10 minutes to pandas 翻譯 pandas中loc iloc ix的區別 pandas dropna函式 pandas中dataframe的stack unstack 和pivot 方法的對比 pandas中關於set index和reset index的用法 python匿...

利用python進行資料分析

利用python進行資料分析,需要了解一些基本的方法,比如掌握回歸分析的方法,通過線性回歸和邏輯回歸,其實你就可以對大多數的資料進行回歸分析,並得出相對精確地結論。這部分需要掌握的知識點如下 回歸分析 線性回歸 邏輯回歸 基本的分類演算法 決策樹 隨機森林 樸素貝葉斯 基本的聚類演算法 k mean...

《利用Python進行資料分析》筆記

之前的筆記一直記在我的印象筆記上,今天突然想到 不如直接記在部落格上,印象筆記只記錄生活上的事,這樣也分工明確一些。同時也能和大家分享,也許可以幫助到別人。由於這個學習筆記系列主要還是用於個人學習總結用,所以會比較凌亂,望大家理解!2017 9 23 p151 pd.dropna thresh 其中...