機器學習概述二

2021-09-02 22:22:52 字數 774 閱讀 9368

1.分類

通過分類模型,將樣本資料集中的樣本對映到某個給定的類別中

2.聚類

通過聚類模型,將樣本資料集中的樣本分為幾個類別,屬於同一類別的樣本相似性比較大

3.回歸

反映了樣本資料集中樣本的屬性值的特性,通過函式表達樣本對映的關係來發現樣本屬性值之間的依賴關係

4.關聯規則

獲取隱藏在資料項之間的關聯或相互關係,即可以根據乙個資料項的出現推導出其他資料項的出現頻率

1.資料收集

2.資料預處理

主要是:資料過濾,處理缺失值,處理異常值,合併多個資料來源,資料彙總。

對缺失值的處理一般有上取樣下取樣

在資料不均衡的情況,通過上取樣人為的製造比例偏小的資料以使資料分布比較均衡;下取樣就是抽取比例較大的資料以使數          據分布比較均衡;所謂均衡大概是維持在3:1~5:1之間。

3.特徵提取

特徵提取分為:特徵選擇特徵降維

特徵選擇是從總特徵中選出若干比較重要的特徵。

特徵降維是在原始特徵的基礎上,通過一定的規則在保持原有特徵維度不變情況下生成新的資料集,再從此基礎上選取若干比          較重要的特徵。

4.模型構建

5.模型測試與評估

6.投入使用(模型部署與整合)

7.迭代與優化

機器學習概述

什麼是機器學習?what is machine learning?machines can learning by ayalyzing large amouts of data.ml是一種重在尋找資料中的模式並使用這些模式來做出 的研究和演算法的門類。ml是ai的一部分,並且和知識發現與資料探勘有所...

機器學習概述

機器學習之父 卡內基梅隆大學計算機學院院長湯姆 公尺切爾 tom michael mitchell 在1997年給機器學習這樣的定義 對於乙個給定的任務t task 在合理的效能度量方案p performance 的前提下,某個計算程式可以自主學習任務t的經驗e experience 隨著提供合適的...

機器學習概述

在面對新來的事物做判斷時,傳統的方式會採用一長串負責的規則去進行判斷,如果新來的樣本符合我們規則,我們就可以準確的判斷樣本的好壞 品質等型別,當遇見我們規則不發匹配的時候,我們就無法正確做出判斷,以及隨後要更新我們已有的規則。在面對大資料 變化頻發的狀況下,傳統的方式不適合去使用。example e...