"""
1. 需要明確:
演算法是核心,資料和計算是基礎
2. 找準定位:
如果只是開發工程師:沒必要把數學的推導搞得特別清楚。僅需要把演算法的原理搞清楚、知道用在哪些方面、該演算法擅長及不擅長的領域即可
重要:特徵工程、調引數、優化
大部分複雜模型的演算法設計都是演算法工程師在做
應該怎麼做?
1. 學會分析問題,使用機器學習演算法的目的,想要演算法完成何種任務
2. 掌握演算法基本思想,並對問題用相應的演算法以及庫和框架去解決問題
3. 機器學習演算法的判別依據
資料型別:
離散型資料,又稱計算資料:全部是整數,不能再細分,也不能再進一步提高其精確度
連續型資料:變數可以在某個範圍內取任一數,如時間、質量等,含有小數部分
僅需記住:離散型區間內不可分,連續型區間內可分
資料型別個不同應用:
離散型:分類
連續型:**
4. 機器學習演算法的分類:
監督學習(**):有特徵值+目標值,即有標準答案
分類:k-近鄰演算法、貝葉斯分類、決策樹與隨機森林、邏輯回歸、神經網路
目標值是離散型資料
概念:分類是監督學習的乙個核心問題,在監督學習中,當輸出變數取有限個離散值時,**問題會變成分類問題。最基礎的便是二分類問題,即判斷是否
回歸:線性回歸、嶺回歸
目標值是連續型資料
用途:用於**輸入變數和輸出變數之間的關係
標註:隱馬爾可夫模型
無監督學習:只有特徵值,即沒有標準答案
聚類:k-means
5. 機器學習的開發流程:
(圍繞)資料:
1. 本身有資料
2. 合作過來資料
3. 購買的資料(很少)
流程:1. 原始資料:明確問題做什麼。即建立模型(到底是分類還是回歸等):根據資料型別(目標值型別),劃分應用種類
2. 資料的基本處理:用pd去處理資料(缺失值、合併表...)
3. 特徵工程:對特徵進行處理(重要環節)
4. 找到合適的演算法去進行**
ps:模型=演算法+資料
5. 模型的評估:判定模型的效果怎麼樣。
如果模型評估沒有合格:
1. 換算法、引數
2. 特徵工程重新處理
6. 上線使用:常以api形式提供
"""
機器學習演算法分類
這些演算法按照學習方式分類的分的話,可以分為一下幾類 1 監督式學習 從給定的訓練資料集中學習出乙個函式,當新的資料到來時,可以根據這個函式 結果。監督學習的訓練集需要包括輸入和輸出,也可以說是特徵和目標。訓練集中的目標是由人標註的。常見的監督式學習演算法包括回歸分析和統計分類。2 非監督式學習 與...
機器學習 分類演算法
最優化理論基礎 分類演算法詳解 簡單例項講解樸素貝葉斯分類演算法 機器學習實戰 樸素貝葉斯 機器學習實戰 python3 基於概率論的分類方法 樸素貝葉斯 機器學習入門之決策樹演算法 決策樹演算法的基本原理 機器學習實戰 python3 決策樹id3 機器學習實戰 基於資訊理論的三種決策樹演算法 i...
機器學習演算法分類
4.了解了機器學習的各種類別,那麼每一種類別有哪些應用呢?機器學習 machine learning 是人工智慧 ai 重要的一部分,是實現人工智慧的乙個途徑。機器學習包含不同種類的演算法,而為了解決不同型別的問題,機器學習演算法可以分為特定的種類,我們要使用最適合的演算法來解決它最擅長的問題。學習...