從A到Z,掌握機器學習基本詞彙 A

2021-09-20 01:07:29 字數 1052 閱讀 9781

accuracy: 準確率

機器學習的常用評價指標。定義如下:

accuracy = (truepositives + truenegatives) / 總樣本數

經常和準確率一起出現的,還有精確率和召回率。

activation function: 啟用函式一種函式(例如 relu 或 sigmoid),將前一層所有神經元啟用值的加權和輸入到乙個非線性函式中,然後向下一層傳遞該函式的輸出值(典型的非線性)。

如下圖,在神經元中,輸入的 inputs 通過加權,求和後,還被作用了乙個函式,這個函式就是啟用函式 activation function。

常見的啟用函式有:sigmoid、tanh、relu、softmax等

adagrad:一種優化演算法

adagrad是一種複雜的優化演算法(梯度下降演算法),它能夠在迭代過程中不斷地自我調整學習率,並讓模型引數中每個元素都使用不同學習率。

auc: 曲線下面積

auc(area under curve)也是一種常見的機器學習評價指標,和roc(receiver operating characteristic)曲線一起常被用來評價乙個二值分類器(binary classifier)的優劣。相比準確率、召回率、f-score這樣的評價指標,roc曲線有這樣乙個很好的特性:當測試集中正負樣本的分布變化的時候,roc曲線能夠保持不變。在實際的資料集中經常會出現類不平衡(class imbalance)現象,即負樣本比正樣本多很多(或者相反),而且測試資料中的正負樣本的分布也可能隨著時間變化。

auc值是乙個概率值,當你隨機挑選乙個正樣本以及乙個負樣本,當前的分類演算法根據計算得到的score值將這個正樣本排在負樣本前面的概率就是auc值。auc值越大,當前的分類演算法越有可能將正樣本排在負樣本前面,即能夠更好的分類。

從調包到工程實戰,如何快速掌握機器學習技能

基礎技能是必備的 一方面是因為機器學習本身的體系十分龐大,當然只是教sklearn調個模型顯然不是在認真講機器學習。學習路徑的設計 知識點難易度的把握,案例的選取,內容的深入程度 等細節都做了大量延伸和重點打磨。既要易於理解,也要兼顧深度 掌握那部分核心技能,並在實際的案例中輸出結果 比如系統的微積...

機器學習從入門到出家

作者 張紅林 編輯 顧鄉 本文主要介紹的是自己的一些經歷,以及讀過的一些書,實際應用的經驗並沒有介紹,包括現在很多機器學習的書一般也是側重於理論,結合實踐的時候會發現和模型比起來,資料清洗 特徵工程的實際效果更明顯,而這方面很難有系統的理論知識,怎麼辦呢?讀 去搜尋自己應用領域有關的 大公司的經典的...

快速排序 從理解到掌握

首先我們先來看下快速排序演算法的原理 從陣列中取得乙個 標誌數字 沒有要求,可以隨便取,一般取第乙個 定義兩個位置變數 i j i 左邊找大於等於 標誌數字 的數 i 從右邊找小於等於 標誌數字 的數 找到後兩者交換位置 直到以該數字為標誌,實現該數字的左邊都是小於等於該數字的數,右邊都是大於等於該...