有無數激情滿滿大步向前,誓要在機器學習領域有一番作為的同學,在看到公式的一刻突然就覺得自己狗帶了。是啊,機器學習之所以相對於其他開發工作,更有門檻的根本原因就是數學
。每乙個演算法,要在訓練集上最大程度擬合同時又保證泛化能力,需要不斷分析結果和資料,調優引數,這需要我們對資料分布和模型底層的數學原理有一定的理解。所幸的是如果只是想合理應用機器學習,而不是做相關方向高精尖的research,需要的數學知識啃一啃還是基本能理解下來的。至於更高深的部分,恩,博主非常願意承認自己是『數學渣』。
基本所有常見機器學習演算法需要的數學基礎,都集中在微積分、線性代數和概率與統計當中。下面我們先過一過知識重點,文章的後部分會介紹一些幫助學習和鞏固這些知識的資料。
1 微積分
微分的計算及其幾何、物理含義,是機器學習中大多數演算法的求解過程的核心。比如演算法中運用到梯度下降法、牛頓法等。如果對其幾何意義有充分的理解,就能理解「梯度下降是用平面來逼近區域性,牛頓法是用曲面逼近區域性」,能夠更好地理解運用這樣的方法。
凸優化和條件最優化 的相關知識在演算法中的應用隨處可見,如果能有系統的學習將使得你對演算法的認識達到乙個新高度。
2 線性代數
大多數機器學習的演算法要應用起來,依賴於高效的計算,這種場景下,程式設計師gg們習慣的多層for迴圈通常就行不通了,而大多數的迴圈操作可轉化成矩陣之間的乘法運算,這就和線性代數有莫大的關係了
向量的內積運算更是隨處可見。
矩陣乘法與分解在機器學習的主成分分析(pca)和奇異值分解(svd) 等部分呈現刷屏狀地出現。
3 概率與統計
從廣義來說,機器學習在做的很多事情,和統計層面資料分析和發掘隱藏的模式,是非常類似的。
極大似然思想、貝葉斯模型 是理論基礎,樸素貝葉斯(na?ve bayes )、語言模型(n-gram)、隱馬爾科夫(hmm)、隱變數混合概率模型是他們的高階形態。
常見分布如高斯分布是混合高斯模型(gmm)等的基礎。
捕魚用到的數學知識
1 三點決定乙個圓,切不能3點一線 塊 return unityengine.vector3 return number function fishtools.getcircle pt1,pt2,pt3 local radius local x1,x2,x3 pt1.x,pt2.x,pt3.x lo...
機器學習 數學 機器學習涉及的數學知識
簡單總結 機器學習涉及的數學知識有 線性代數,概率論和統計學,多變數微積分,演算法和複雜優化,以及其他等。原文 在過去幾個月裡,有幾個人聯絡過我,說他們渴望進軍資料科學領域,使用機器學習 ml 技術探索統計規律,並打造資料驅動的完美產品。但是,據我觀察,一些人缺乏必要的數學直覺和框架,無法獲得有用的...
機器學習及其數學知識 知識星球
為什麼要加入付費知識星球?每一條都是精心篩選,用心編輯,為您節約時間 邀請了在各個領域比較優秀的朋友做嘉賓 利物浦博士,gdg組織者,ibm資料科學家,前阿里演算法工程師 阿里nlp演算法工程師,美國前十理工院校碩士,實現物理到cs的華麗轉身 十年經驗的c 資深工程師,方向是計算機視覺,人體姿態 付...