讀書筆記(提煉理解總結)
首先我們需要有乙個由一組樣本組成的資料集
然後樣本中有屬於它自身的屬性元祖
補充個知識 : 資料集會分為訓練集和測試集
與有監督的學習 相反,無監督學習是資料集沒有設定真值。人們期望從資料中學習潛在的模式或規則,而不以預先定義的真值作為基準。
聚類(clustering):給定乙個資料集,可以根據資料集中樣本之間的相似性,將樣本聚集成組。
關聯(association):給定乙個資料集,關聯任務是發現樣本屬性之間隱藏的關聯模式。
簡單說就是找一組不帶標記的資料集進行學習訓練,從而實現模型進行**
輸入資料全部為不帶標記資料
適用範圍:資料集大,標記樣本少,可找到同時具備有監督和無監督學習的應用
通過將有監督和無監督的學習結合在乙個只有少量標記的資料集中,人們可以更好地利用資料集,並獲得比單獨應用它們更好的結果。
方法最好的一種 策略是首先將樣本聚類成組(無監督學習),然後對每個組分別應用有監督的學習演算法。第一階段的無監督學習可以幫助我們縮小學習的範圍,第二階段的有監督學習可以獲得更好的精度。
輸入資料 帶and不帶標記資料
監督學習和無監督學習 監督學習與非監督學習
監督學習 supervised learning 的任務是學習乙個模型,使模型能夠對任意給定的輸入,對其相應的輸出做出乙個好的 即 利用訓練資料集學習乙個模型,再用模型對測試樣本集進行 例如kaggle上的鐵達尼號比賽。官方提供旅客資料 資料集1 姓名,年齡,性別,社會經濟階層,是否生存等 要求參賽...
監督學習,無監督學習和半監督學習
監督學習 supervised learning 無監督學習 unsupervised learning 半監督學習 semi supervised learning 2 概念 監督學習 用一部分已知分類 有標記的樣本來訓練機器後,讓它用學到的特徵,對沒有還分類 無標記的樣本進行分類 貼標籤。一句話...
監督學習 非監督學習 半監督學習(主動學習)
統計學習通常包括監督學習 非監督學習 半監督學習以及強化學習,在機器學習的領域中前三種研究的比較多的,也是運用的比較廣泛的技術。監督學習的任務是學習乙個模型,使模型對給定的任意的乙個輸入,對其都可以對映出乙個 結果。這裡模型就相當於我們數學中乙個函式,輸入就相當於我們數學中的x,而 的結果就相當於數...