1. 訓練集與測試集:
將資料分成兩部分
一部分用於機器的訓練,即讓機器從這些資料中獲取合適的引數,構建出模型, 這些資料稱為訓練集
另一部分用於機器訓練出來的模型進行**,根據一些指標來判斷模型的好壞,這些資料稱為測試集
2. 分類問題與回歸問題:
分類: **的結果是離散值 例如明天是否會下雨, 腫瘤是良性或者是惡性
回歸: **的結果是連續值 例如根據房子面積、位置**房價, 明天的溫度
3. 過擬合與欠擬合
過擬合: 得到的模型在訓練集上效果過於的好,導致在測試集上效果不好
欠擬合: 得到的模型在訓練集上效果不好,顯然在測試集上效果也不好
4. 特徵(features)與目標(label)
三明距離市中心2km的碧桂園一間單元房100平方公尺, 總售價80w
市中心2km 100平方公尺可以 看做特徵
總售價80w 可以看做目標
5. 監督學習與無監督學習
將有目標值的資料進行學習稱為監督學習
將沒有目標值的資料進行學習稱為無監督學習
小白一枚,純粹個人記錄
機器學習筆記01 機器學習簡介
機器學習是人工智慧的乙個分支,它業是一類演算法的總稱。這些演算法能夠根據提供的訓練資料按照一定的方式來學習,最終用於 或者分類。更具體的說,機器學習可以看作是尋找乙個函式,輸入是樣本資料,輸出是期望的結果,只是這個函式過於複雜,以至於不太方便形式化表達。需要注意的是,機器學習的目標是使學到的函式很好...
機器學習筆記 01
本csdn部落格學習筆記對應為機器學習西瓜書教材,一切內容以西瓜書教材為準 新學期的學習依舊,這次發表在csdn部落格上的是西瓜書版機器學習教材的學習心得和筆記的主要內容,可能不是很詳盡,但保證是本人理解與提煉的結果。1.1引言 機器學習 通過計算的手段,利用經驗改善系統的效能 一般流程 資料 學習...
機器學習基礎學習筆記 機器學習基礎介紹
概念 多領域交叉學科,設計概率論 統計學 逼近論 凸分析 演算法複雜度理論等多門學科。專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的效能。學科定位 人工智慧 artificial intelligence,ai 的核心,是是計算機具有智慧型...