機器學習演算法分類

2021-09-27 06:45:19 字數 1659 閱讀 1201

4.了解了機器學習的各種類別,那麼每一種類別有哪些應用呢?

機器學習(machine learning)是人工智慧(ai)重要的一部分,是實現人工智慧的乙個途徑。機器學習包含不同種類的演算法,而為了解決不同型別的問題,機器學習演算法可以分為特定的種類,我們要使用最適合的演算法來解決它最擅長的問題。

學習方式

描述監督學習(supervised learning)

可以由輸入資料中學到或建立乙個新模型,並依此模式推測新的結果,輸入資料報含特徵值和目標值

非監督學習(unsupervised learning)

可以由輸入資料中學到或建立乙個模型,並依此模式推測新的結果,輸入資料由特徵值組成

半監督學習(semi-supervised learning

介於監督學習和非監督學習之間

增強學習(reinforcement learning

智慧型體(agent)以「試錯」的方式進行學習,通過與環境進行互動獲得的獎賞指導行為,目標是使智慧型體獲得最大的獎賞(馬爾可夫決策模型等)

學習任務

描述分類(classification

在監督學習中,當輸出變數(目標值)取有限個離散值值時,**問題變成分類問題,最基礎為二分類,即判斷是非

回歸(regression)

監督學習中回歸用於**輸入變數和輸出變數之間的關係,輸出(目標值)是連續型的值

聚類(clustering)

無監督學習,將資料物件分為不同聚類(群落/團體)

學習方式

任務演算法

監督學習

分類k-近鄰演算法(knn),貝葉斯分類,決策樹與隨機森林,邏輯回歸,神經網路等

監督學習

回歸線性回歸,嶺回歸等

非監督學習

聚類k-means演算法等

這裡提到的輸出變數型別不同於我們通常理解的整型,浮點型等資料型別,這裡指的資料型別大致可以分為兩類

1.離散型資料: 由記錄不同類別個體的數目所得到的資料,又稱為記數資料,所有這些資料全都是整數,而且不能再細分,也不能再進一步提高他們的精確度。

2.連續型資料: 變數可以在某個範圍內取任一數,即變數的取值可以是連續的, 如長度, 時間,質量值等,這類數通常是非整數,含有小數部分。

注: 記住,離散型資料是區間內不可分,連續型資料是區間內可分

搞清楚的待解決問題的目標值型別,我們就可以很快知道這一問題對應的機器學習演算法型別。

— 如根據識別貓狗,我們知道目標值是貓或者狗,是離散型資料,所以這就是分類問題

— 根據文章內容判斷文章型別,目標值是科技類,體育類等,是離散類,也是分類問題

— **房價股價等,目標值是**等,落在區間內均可為連續型資料,所以就是回歸問題

分類在於根據其特性將資料「分門別類」,所以在許多領域都有廣泛的應用

在銀行業務中, 構建乙個客戶分類模型,將客戶按照貸款風險的大小進行分類

影象處理中,分類可以用來檢測影象中是否有人臉出現,動物類別等

手寫識別中,分類可以用來識別手寫的數字

文字分類,文字可以是新聞報道,網頁,電子郵件,學術**等

房價**,根據某地歷史房價資料進行**

金融資訊,股價**等

機器學習演算法分類

這些演算法按照學習方式分類的分的話,可以分為一下幾類 1 監督式學習 從給定的訓練資料集中學習出乙個函式,當新的資料到來時,可以根據這個函式 結果。監督學習的訓練集需要包括輸入和輸出,也可以說是特徵和目標。訓練集中的目標是由人標註的。常見的監督式學習演算法包括回歸分析和統計分類。2 非監督式學習 與...

機器學習 分類演算法

最優化理論基礎 分類演算法詳解 簡單例項講解樸素貝葉斯分類演算法 機器學習實戰 樸素貝葉斯 機器學習實戰 python3 基於概率論的分類方法 樸素貝葉斯 機器學習入門之決策樹演算法 決策樹演算法的基本原理 機器學習實戰 python3 決策樹id3 機器學習實戰 基於資訊理論的三種決策樹演算法 i...

機器學習 分類演算法

根據特徵資料區分屬於哪一類 比如微博 發表文章判斷屬於哪一類,正向還是負向 類別 支援向量機 決策樹 本章具體描述決策樹 決策樹 將特徵進行劃分,進行一些列處理 例子 中午吃飯,兜裡錢是否大於20,此時繼續判斷錢是否大於25,如果大於吃黃燜雞 可樂,不大於黃燜雞。如果兜裡錢一開始就不大於20吃泡麵 ...