演算法以及開發流程
明確的幾點問題:
1.演算法是核心,資料和計算是基礎
2. 找準定位,知道演算法原理,學會運用。
3.學會分析問題,使用機器學習演算法的目的,在什麼情況下運用。
4.掌握演算法的基本思想,學會對問題用相應的演算法解決。
5.學會利用庫和框架解決問題。
演算法判別依據
資料型別判斷:
離散型資料:分類:由記錄不同類別個體的數目所得到的資料,又稱計數資料,所有這些資料全部是整數,而且不能在細分,也不能進一步提高他們的精確度。
連續型資料:回歸變數可以在某個範圍內取任一數,即變數的取值可以使連續的,如,長度,時間,質量等,這類整數通常是非整數,含有小數部分。
離散型區間不可分,連續型區間可分
例子:比如對貓狗分類,就是屬於離散型。對與股價的**這個就是連續型。
機器學習演算法分類
監督學習:有特徵值+目標值
分類 : k-近鄰演算法、貝葉斯分類、決策樹與
隨機森林、邏輯回歸、神經網路
回歸 : 線性回歸、嶺回歸
標註: 隱馬爾可夫模型
無監督學習:只有 特徵值
聚類 : k-means
機器學習開發流程
1.首先獲得原始資料
2.然後明確問題建立模型:根據資料型別劃分應用種類
3.然後資料的基本處理,用pandas處理資料(缺失值,合併表。。。)
4.特徵工程(對特徵進行處理)重要
5.找到合適的演算法進行**或者分析
6.模型的評估,判定效果
7.以api形式提供介面,上線。
05 機器學習演算法分類以及開發流程
1.需要明確 演算法是核心,資料和計算是基礎 2.找準定位 如果只是開發工程師 沒必要把數學的推導搞得特別清楚。僅需要把演算法的原理搞清楚 知道用在哪些方面 該演算法擅長及不擅長的領域即可 重要 特徵工程 調引數 優化 大部分複雜模型的演算法設計都是演算法工程師在做 應該怎麼做?1.學會分析問題,使...
機器學習演算法簡介
一 監督學習 偏差和方差就像飛鏢射到靶子上。每個飛鏢就是從不同資料集得出的 結果。高偏差 低誤差的模 型就是把飛鏢扔到了離靶心很遠的地方,但是都集中在乙個位置。而高偏差 高誤差的模型就是把飛 鏢扔到了靶子上,但是飛鏢離靶心也很遠,而且彼此間很分散。低偏差 高誤差的模型就是把飛鏢扔 到了離靶心很近的地...
03 機器學習開發流程
上一章 02 機器學習理性認識 讓大家對機器學習的相關演算法有了乙個初步的認識和了解。筆者的寫作思路是先把機器學習的每個大分類,以及大分類下的中小分類做乙個總體介紹。當後續對具體的演算法模型講解後,大家再回過頭對照今天講過的這些分類,你們會發現整個文集提供給你們的是乙個完整的知識體系。昨天的內容發布...