1.ndarry
2.通用函式:快速的元素級陣列函式
3.利用陣列進行資料處理
4.利用陣列的檔案輸入輸出
5.現行代數
6.隨機數生成
7.隨機漫步
1.合併資料集
pandas.merge
pandas.concat
pd.merge(df1, df2, how=』inner』)
索引上的合併
軸向連線
np.concatenate([testarr, testarr], axis=0|1)
2.重塑和軸線旋轉
3.資料轉換
重新命名軸索引
離散化和面元劃分
監測和過濾異常值
排列和隨機取樣
np.random.seed(12345)
data = dataframe(np.random.randn(1000, 4))
data.describe()
分類變數轉換成啞變數矩陣dummy matrix 指標矩陣
就是計算某列若干個值在各行出現情況的矩陣(0,1)
4.字串操作
模式匹配
字串物件操作
正規表示式
5.usda食品資料庫
利用python進行資料分析
目錄 10 minutes to pandas 翻譯 pandas中loc iloc ix的區別 pandas dropna函式 pandas中dataframe的stack unstack 和pivot 方法的對比 pandas中關於set index和reset index的用法 python匿...
利用python進行資料分析
利用python進行資料分析,需要了解一些基本的方法,比如掌握回歸分析的方法,通過線性回歸和邏輯回歸,其實你就可以對大多數的資料進行回歸分析,並得出相對精確地結論。這部分需要掌握的知識點如下 回歸分析 線性回歸 邏輯回歸 基本的分類演算法 決策樹 隨機森林 樸素貝葉斯 基本的聚類演算法 k mean...
《利用Python進行資料分析》筆記
之前的筆記一直記在我的印象筆記上,今天突然想到 不如直接記在部落格上,印象筆記只記錄生活上的事,這樣也分工明確一些。同時也能和大家分享,也許可以幫助到別人。由於這個學習筆記系列主要還是用於個人學習總結用,所以會比較凌亂,望大家理解!2017 9 23 p151 pd.dropna thresh 其中...