機器學習專案清單 機器學習實戰

2021-10-10 02:00:45 字數 874 閱讀 9517

摘自《機器學習實戰 基於sklearn、keras和tensorflow 第2版》 附錄b中的機器學習專案清單,用於自查

4.對於有監督學習任務,請確定目標屬性。

5.視覺化資料。

6.研究屬性之間的相關性。

7.研究如何手動解決問題。

8.確定你可能希望使用的轉變。

9.確定有用的額外資料。

10.記錄所學的知識。

1.資料清理:

2.特徵選擇(可選):

3.特徵工程(如果適用):

4.特徵縮放:

1.使用標準引數訓練來自不同類別(例如線性、樸素貝葉斯、svm,隨機森林、神經網路等)的許多快速和粗糙的模型。

2.衡量並比較其效能。

對於每個模型,使用n折交叉驗證,在n折上計算效能度量的均值和標準差。

3.分析每種演算法的最重要的變數。

4.分析模型所犯錯誤的型別。

5.快速進行特徵選擇和特徵工程。

6.在前面5個步驟中執行一兩個以上的快速迭代。

7.篩選出前三到五個最有希望的模型,優先選擇會產生不同型別錯誤的模型。

1.使用交叉驗證微調超引數:

2.嘗試使用整合方法。組合最好的模型通常會比單獨執行有更好的效能。

3.一旦對最終模型有信心,就可以在測試集中測量其效能,以估計泛化誤差。

注意:在測量了泛化誤差之後,請不要對模型進行調整:否則你會開始過擬合測試集。

3.說明你的解決方案為何可以實現業務目標。

4.別忘了介紹你一路上注意到的有趣觀點。

5.確保通過精美的視覺化效果或易於記憶的陳述來傳達你的主要發現(例如,「中等收入是房價的第一大**指標」)。

3.定期根據新資料重新訓練模型(盡可能自動進行)。

機器學習專案清單

開頭註明 內容大部分來自機器學習實戰 基於scikit learn和tensorflow 一 架構問題,關注藍圖 1.定義當前目標 2.思考解決方案 3.是否可以重用他人的經驗與工具 4.盡可能獲取幫助 二 獲取資料 1.列出資料及其體量 2.查詢並記錄獲取資料的途徑 3.檢查需要的空間 4.檢查法...

機器學習專案流程清單

這份列表可以知道你部署自己的機器學習專案。總共有八個步驟 首先你要有乙個要解決的問題 獲取解決問題需要的資料 探索資料,對資料有乙個清楚的理解 預處理資料以便更好地輸入給機器學習演算法 探索不同的模型並且找到最好的那個 調整你的模型引數,並將這些引數組合成乙個更好的解決方案 展示你的結果 對你的系統...

機器學習實戰

花了一段時間,總算把 機器學習實戰 粗讀了一遍,重點就在這個粗讀上。這本書的確不錯,機器學習的幾個經典演算法都涉及了,每個演算法都有1 2個實際例子進行說明,都有實實在在的 讓我想起了linus的 talk is cheap,show me the code 那句名言。但多年來養成的習慣,從來都是喜...