機器學習其實就是利用現有資料,設計出演算法模型的過程。其流程如下:
1、獲取資料
2、資料分析
3、設計演算法
4、測試演算法
5、驗證評估
6、提交演算法
對資料的處理分為四種情況:分類、聚類、回歸、降維。其中又以分類為主。
分類思想主要分為兩種:1、利用歐式距離判定樣本屬於哪一類。2、利用概率大小進行分類。
分類的方法主要有:knn,貝葉斯、神經網路、支援向量機、決策樹、隨機森林。
聚類的方法主要有:k均值法、學習向量量化法、高斯混合聚類、密度聚類、層次聚類。
回歸和將為主要用來分析資料和剔除不重要的屬性,以達到減小演算法計算時間的目的。
機器學習流程介紹
本文只是對機器學習的流程做乙個簡單的描述,每個環節涉及的東西很多,不是本文介紹的範圍,對其中比較重要的知識點稍微提及一下,具體的可以參考其他文章學習。先上一張流程圖。機器學習從資料準備到上線流程 接下來根據流程圖,逐步分析機器學習的流程。1.資料來源 機器學習的第乙個步驟就是收集資料,這一步非常重要...
機器學習專案流程
在微博上看到七月演算法寒老師總結的完整機器的學習專案的工作流程,結合天池比賽的經歷寫的。現在機器學習應用非常流行,了解機器學習專案的流程,能幫助我們更好的使用機器學習工具來處理實際問題。1.理解實際問題,抽象為機器學習能處理的數學問題 理解實際業務場景問題是機器學習的第一步,機器學習中特徵工程和模型...
機器學習實用流程
1 抽象成數學問題 明確問題是進行機器學習的第一步。機器學習的訓練過程通常都是一件非常耗時的事情,胡亂嘗試時間成本是非常高的。這裡的抽象成數學問題,指的我們明確我們可以獲得什麼樣的資料,目標是乙個分類還是回歸或者是聚類的問題,如果都不是的話,如果劃歸為其中的某類問題。2 獲取資料 資料決定了機器學習...