最常見的兩種機器學習演算法
- supervised learning
> 給演算法乙個資料集,其中包含 the right answer,即帶有標籤。演算法的目的進行**,給出更多的正確答案
> 包括回歸問題(regression problem)(eg房價**,設法**乙個連續值輸出)
分類問題(classification,設法**乙個離散值輸出,eg**腫瘤是良性or惡性)
- unsupervised learning
> 給演算法乙個資料集,不帶任何標籤,試從中找到某種結構。
> 包括聚類演算法clustering
(1)應用在基因組學中,在dna微陣列資料,給定一組不同個體,對於每個個體檢測他們是否擁有某個特定的基因,也就是檢測基因的表達程度,從而根據它將個體歸為不同的類or不同型別的人。
(2)應用在大型的計算機集群,哪些機器趨向於協同工作,從而把它們放在一起,讓集群更高效。
(3)社交網路的分析
(4)市場細分
2.其他機器學習演算法
reinforcement learning,recommender systerms
3.學會演算法並且要學會如何用這些演算法 機器學習常見基本概念筆記
監督學習和非監督學習 有監督學習的方法就是識別事物,識別的結果表現在給待識別資料加上了標籤。因此訓練樣本集必須由帶標籤的樣本組成。比如分類和回歸。而無監督學習方法只有要分析的資料集的本身,預先沒有什麼標籤。如果發現資料集呈現某種聚集性,則可按自然的聚集性分類,但不予以某種預先分類標籤對上號為目的。如...
機器學習概念
recommendation engine 推薦引擎 dbr demographic based recommendation 基於人口統計學的推薦 cbr context basedrecommendation 基於內容的推薦 cf collaborative filtering協同過濾 ucf ...
機器學習概念
基本術語 定義 假設可以使用p來評估電腦程式在某類任務t上的效能,若乙個程式通過利用經驗e在t中任務上獲得效能提公升,就可以說關於t和p。該程式對e進行了學習。資料集 data set 一條記錄就是乙個事件或物件 乙個示例 instance 樣本 sample 物件某方面表現或性質 屬性 attri...