機器學習先關概念

訓練樣本的標記資訊是未知的，目標是為了揭露訓練樣本的內在屬性，結構和資訊，為進一步的資料探勘提供基礎。

###1.1 聚類

聚類通常是指，對於未標記訓練樣本，根據樣本的內在相似性，將樣本劃分為若干個不相交子集的學習演算法。

聚類涉及到資料點的分組。給定一組資料點，我們可以使用聚類演算法將每個資料點劃分為乙個特定的組。理論上，同一組中的資料點應該具有相似的屬性或特徵，而不同組中的資料點應該具有高度不同的屬性或特徵。聚類是一種無監督學習的方法，是許多領域中常用的統計資料分析技術。

包含演算法如下：

訓練樣本帶有資訊標記，利用已有的訓練樣本資訊學習資料的規律**未知的新樣本標籤

**的結果是離散的，例如**明天天氣-陰，晴，雨。分類是監督學習任務（帶label標籤）

分類問題是用於將事物打上乙個標籤，通常結果為離散值。

例如判斷一幅上的動物是乙隻貓還是乙隻狗，分類通常是建立在回歸之上，分類的最後一層通常要使用softmax函式進行判斷其所屬類別。分類並沒有逼近的概念，最終正確結果只有乙個，錯誤的就是錯誤的，不會有相近的概念。最常見的分類方法是邏輯回歸，或者叫邏輯分類。

**的結果是連續的，例如**明天的溫度，23，24，25度。回歸是監督學習任務（帶label標籤）

回歸問題通常是用來**乙個值

如**房價、未來的天氣情況等等，例如乙個產品的實際**為500元，通過回歸分析**值為499元，我們認為這是乙個比較好的回歸分析。乙個比較常見的回歸演算法是線性回歸演算法（lr）。另外，回歸分析用在神經網路上，其最上層是不需要加上softmax函式的，而是直接對前一層累加即可。回歸是對真實值的一種逼近**。

機器學習先關概念

遊戲先關20180307

機器學習概念

機器學習概念

機器學習先關概念

遊戲先關20180307

機器學習概念

機器學習概念

相關推薦