2021.1.26
***************=
概論人工智慧》機器學習》深度學習
機器學習問題
資料->聚類、分類、**、異常值分析
機器學習的基本方法
監督學習
1、資料集中的樣本帶有標籤,有明確目標。
2、回歸和分類。
無監督學習
1、資料集中的樣本沒有標籤,沒有明確目標。
2、聚類、降維、排序、密度估計、關聯規則挖掘
*強化學習(介於前兩者之間)
1、智慧型決策的過程,通過過程模擬和觀察來不斷學習,提高決策能力
2、alphgo
基本概念
資料集:乙個樣本集合
樣本:資料集的一行。乙個樣本包含乙個或多個特徵,此外還可能包含乙個標籤。
特徵:進行**時使用的輸入變數。
訓練集:用於訓練模型的資料集。
測試集:用於測試
模型:x,y之間的對映關係。
損失函式:
優化目標:
監督學習
回歸問題
樣本資料有目標、標籤,類似高中的誤差分析。
分類資料樣本是集散型別
找一根分割線將資料分開,具有最大分割距離是最好的
有的資料線性不可分,可以公升維。
無監督學習
概念:將資料集中相似的資料進行分組
例子:k——means聚類
過度擬合問題
模型過於複雜導致已知資料**的很好,但對未知資料**很差。
正則化模型選擇
交叉驗證
k折交叉驗證
機器學習十講 第一講
我們將機器學習定義為一組能夠自動檢測模式資料的方法,然後利用未發現的模式來 未來的資料,或者在不確定的情況下執行各種決策 例如計畫如何收集更多的資料 模型和計算能力 深度學習 gpu 分布式系統 廣泛的應用場景 營銷 廣告 金融 交通 醫療等 是指資料採集 資料清洗 資料分析和資料應用的整個流程中的...
機器學習十講 第二講回歸
資料酷客 大講堂 機器學習第二講 用乙個或多個自變數來 因變數的數學方法 在機器學習中,回歸指的是一類 變數為連續值的有監督學習方法 在回歸模型中,需要 的變數叫做因變數,用來解釋因變數變化的變數叫做自變數。一元線性回歸 多元線性回歸 可能遇到的問題 多重共線性 最小二乘的引數估計為 widehat...
機器學習十講第三講
本講開始講了梯度下降演算法和最大似然估計演算法。樣本數量 n classes 2,類別數量 n features 2,特徵數量 n informative 2,有資訊特徵數量 n redundant 0,冗餘特徵數量 n repeated 0,重複特徵數量 n clusters per class ...