訓練樣本的標記資訊是未知的,目標是為了揭露訓練樣本的內在屬性,結構和資訊,為進一步的資料探勘提供基礎。
###1.1 聚類
聚類通常是指,對於未標記訓練樣本,根據樣本的內在相似性,將樣本劃分為若干個不相交子集的學習演算法。
聚類涉及到資料點的分組。給定一組資料點,我們可以使用聚類演算法將每個資料點劃分為乙個特定的組。理論上,同一組中的資料點應該具有相似的屬性或特徵,而不同組中的資料點應該具有高度不同的屬性或特徵。聚類是一種無監督學習的方法,是許多領域中常用的統計資料分析技術。
包含演算法如下:
訓練樣本帶有資訊標記,利用已有的訓練樣本資訊學習資料的規律**未知的新樣本標籤
**的結果是離散的,例如**明天天氣-陰,晴,雨。分類是監督學習任務(帶label標籤)
分類問題是用於將事物打上乙個標籤,通常結果為離散值。
例如判斷一幅上的動物是乙隻貓還是乙隻狗,分類通常是建立在回歸之上,分類的最後一層通常要使用softmax函式進行判斷其所屬類別。分類並沒有逼近的概念,最終正確結果只有乙個,錯誤的就是錯誤的,不會有相近的概念。最常見的分類方法是邏輯回歸,或者叫邏輯分類。
**的結果是連續的,例如**明天的溫度,23,24,25度。回歸是監督學習任務(帶label標籤)
回歸問題通常是用來**乙個值
如**房價、未來的天氣情況等等,例如乙個產品的實際**為500元,通過回歸分析**值為499元,我們認為這是乙個比較好的回歸分析。乙個比較常見的回歸演算法是線性回歸演算法(lr)。另外,回歸分析用在神經網路上,其最上層是不需要加上softmax函式的,而是直接對前一層累加即可。回歸是對真實值的一種逼近**。
遊戲先關20180307
遊戲發展歷史 世界上第一款遊戲是始於1958年,視屏遊戲網球,其後遊戲開始了他的成長之旅。1972年atari 雅達利 公司成立。1983年任天堂 nintedo 推出第一台自己家用遊戲主機 1986年勇者鬥惡龍1代上市 日系rpg遊戲首次登場 1989年世嘉在世界市場備受好評的遊戲機mega dr...
機器學習概念
recommendation engine 推薦引擎 dbr demographic based recommendation 基於人口統計學的推薦 cbr context basedrecommendation 基於內容的推薦 cf collaborative filtering協同過濾 ucf ...
機器學習概念
基本術語 定義 假設可以使用p來評估電腦程式在某類任務t上的效能,若乙個程式通過利用經驗e在t中任務上獲得效能提公升,就可以說關於t和p。該程式對e進行了學習。資料集 data set 一條記錄就是乙個事件或物件 乙個示例 instance 樣本 sample 物件某方面表現或性質 屬性 attri...