《python資料分析基礎教程》學習筆記。
2.1 python資料分析常用的類庫
類庫是用來實現各種功能的類的集合。
-1. numpy
numpy(numerical python)是python科學計算的基礎包,提供以下功能:
-2. pandas
pandas是python資料分析的核心庫,是基於numpy構建的含有複雜資料結構和工具的資料分析包。
pandas圍繞著series(一維序列)和dataframe(二維序列)著兩個核心資料結構展開的。
pandas提供了複雜精細的索引功能,以便快捷地完成重塑、切片、聚合和選取資料子集等操作。
-3. matplotlib
matplotlib是最流行的用於繪製資料圖表的python庫,非常適合建立出版物中的圖表。
-4. scipy
scipy是一組專門用於科學計算的開源python庫,它構建於numpy的基礎之上,提供了乙個用於在python中進行科學計算的工具集。
scipy經常於numpy、pandas、matplotlib和ipython這些核心庫一起使用。
-5. scikit-learn
scikit-learn 是乙個簡單有效的資料探勘和資料分析工具,可供使用者在各種環境下重複使用。是建立在numpy、scipy和matplotlib的基礎上的,對一些常用的演算法進行了封裝。
scikit-learn 的基本功能主要為:
-6. ipython
ipython 是python科學計算標準工具集的組成部分,它為互動式和探索式計算機提供了乙個高效的開發環境。
2.2 jupyter notebook
《精益資料分析》筆記 第5章 資料分析框架
1 戴夫.麥克盧爾 的海盜指標說 麥克盧爾將創業公司最需要關注的指標分為五大類 1 獲取使用者acquisition 2 提高活躍度 activation 3 提高留存率 retention 4 獲取營收 revenue 5 自傳播 referral 這一模型,描述了使用者 客戶 訪客須經歷的五個環...
《利用Python進行資料分析 第2版》第五章筆記
一 pandas兩個主要資料結構 series和dataframe series是一種類似於一維陣列的物件 obj pd.series 4,7,5,3 dataframe既有行索引也有列索引,它可以被看做由series組成的字典 共用同乙個索引 del frame lieming 刪除列 2種方法建...
利用python 進行資料分析 第8章 (1)
繪圖引用 import matplotlib.pyplot as plt matplotlib 的影象都位於figure 物件中。可以用plt.figure 建立乙個新的figure plt.figure plt.figure 有一些選項,特別是figsize,它用於確保當儲存到磁碟時具有一定的大小...