機器學習 ML分類

2021-10-04 04:03:50 字數 726 閱讀 7109

為了更好的學習機器學習知識,進行機器學習的分類

按照機器學習任務分類可以分為

分類問題是我們最常用的任務,如,新聞分類,分類,檔案分類可以按照各個領域進行分類,如教育,體育,科技,經濟等等

聚類問題,簡單的說是群,俗話是物以類聚,目的是將樣品劃分為緊密關係的子類或者是簇

最常用的是用k-means聚類演算法

回歸問題,我想到了回歸演算法,就2種,如1,0,true false,好,壞,等

主要用到了線性回歸演算法

降維主要目的的把複雜的問題轉為簡單的問題,採用某種對映方式。有點像數學裡面的引數替代

高維度空間的資料點對映到低緯度的空間,可能的原因是高維度的包含冗餘資料和噪音,需要通過降維將其消除;

常用的降維模型維pca和線性判別分析lda

簡稱為監督學習:是指基於一組帶有結果標註的樣品訓練模型,然後通過模型對新的未知結果的樣本做出**

如:分類classify和回歸 regression

訓練樣本的結果資訊是沒有被標註的,訓練集的結果標籤還是未知的。目標是通過這些無標記訓練樣本的學習來揭開資料的內部規律,發現隱藏在資料的內在模式,為進一步處理資料提供基礎。

聚類:(clustering和降維 dimensionreduction)

評價學習,學習過程就是看做事乙個評價的過程,如下圖模式

機器學習ML策略

機器學習ml策略 1 為什麼是ml策略 例如 識別cat分類器的識別率是90 怎麼進一步提高識別率呢?想法 1 收集更多資料 2 收集更多的多樣性訓練樣本 3 使用梯度下降訓練更長時間 4 嘗試adam代替梯度下降 5 嘗試更大的網路 6 嘗試更小的網路 7 嘗試dropout 8 嘗試l2正則化 ...

ML 機器學習基礎

目錄 偏差與方差 導致偏差和方差的原因 深度學習中的偏差與方差 生成模型與判別模型 兩者之間的聯絡 優缺點常見模型 先驗概率與後驗概率 在監督學習中,模型的泛化誤差可分解為偏差 方差與雜訊之和 偏差用於描述模型的擬合能力 方差用於描述模型的穩定性 方差通常是由於模型的複雜度相對於訓練集過高導致的 監...

ML 初識機器學習

arthur samual 1959 在沒有明確設定的情況下,使計算機具有學習能力的研究領域。機器學習是研究使計算機完成複雜任務並且無須對其進行明確程式設計的科學學科,機器學習中的演算法將學習如何解決給定的任務,這些演算法包括來自統計學 概率論和資訊理論的方法和技術。機器學習專案由多個步驟組成,通常...