資料分析複習
什麼是資料分析
通過對資料的蒐集、整理、清洗,提取資料的潛在特徵,找到資料的隱藏規律,發現潛在目標及價值。
怎麼實現分析目標
借助於一些工具及演算法
資料採集
資料分析
資料視覺化
信用卡盜刷分析
1.分析審視資料
2.特徵工程
畫出直方圖,找出分布有明顯區別的變數,是對分類目標(信用卡是否盜刷)區分度最大的特徵.
3.特徵轉換
```
credit['time'] = credit['time'].map(lambda x:divmod(x,3600)[0])
```
4.特徵縮放
//standardscaler將目標資料轉換到均值為0標準差為1資料
from sklearn.preprocessing import standardscaler
standscaler = standardscaler()
cols = ['time','amount']
credit2[cols] = standscaler.fit_transform(credit2[cols])
5.機器學習演算法的選取 資料分析基礎
import numpy as npimport pandas aspd import scipy import matplotlib.pyplot asplt 資料匯入 df pd.read csv r encoding gbk print df.head 前五行 print df.tail 最後...
大資料分析複習筆記
資料探勘 有效性 可用性 出乎意料 可理解性 假設有圖 其鄰接矩陣 m為 帶入公式迭代,結果為 最終,rm 1 而 ry ra 0 這從漫步者的角度很好理解,在經過一段時間之後,漫步者到達了 m 節點,然而 m 節點只有指向自己的鏈結,然後就只能一直停留在 m,所以最後的概率一定是1,而其他兩個節點...
基礎的資料分析
什麼是資料分析?資料分析是指用適當的統計分析對收集來的大量資料進行分析,提取有用資訊和形成結論而對資料加以詳細研究和概括總結的過程。在實用中,資料分析可幫助人們作出判斷,以便採取適當行動。資料分析的目的是什麼?資料分析的目的是把隱沒在一大批看來雜亂無章的資料中的資訊集中 萃取和提煉出來,以找出所研究...