監督學習(supervised learning):叫監督學習的原因是因為我們告訴了演算法,我們想要**什麼。所謂監督,其實就是我們的意願是否能直接作用於**結果。典型代表:分類(classification)和回歸(regression)。
非監督學習(unsupervised learning):在非監督學習的資料中,沒有給出標籤(label,用於類別區分等)和目標值(target value,用於回歸**)。通常,如果我們如果想將具有相似性的資料項進行分組,這種行為就是「聚類」(clustering)。另外,如果我們想知道關於資料的一些概率數值,那麼這種行為就叫做「密度估計」(density estimation)。最後,非監督學習可能還會用於將多特徵(feature)的資料進行降維,剔除一些不重要的特徵,使得我們能在低維空間觀察資料。
開發機器學習應用程式的步驟:
1. 收集資料;
2. 準備輸入資料;
3. 分析輸入資料;
4. 輸入資料檢測,或者樣本預處理(剔除不良的資料);
5. 訓練樣本,得到模型;
6. 檢測模型,重要依**的準確度和精確度為依據;
7. 使用模型進行實際的應用。
機器學習的世界是乙個概率統計的世界,並且樣本可在不同的空間變換,以突顯某些特徵,簡化規則描述。
機器學習筆記(一) 了解機器學習
1 人工智慧是我們想要達成的目標,機器學習是想要達成目標的手段,深度學習就是機器學習的其中乙個方法。2 機器學習,根據你提供的資料尋找乙個function,如下圖,輸入一段語音知道是 how are you 輸入貓的知道是 貓 怎樣找出這個function呢?第一,要有一系列的function,即模...
機器學習筆記(一)
機器學習筆記 1,2課 一.線性回歸模型 1.數學模型 對於乙個具體的問題,x1,x2 是我們所選取的特徵,h x 是我們所建立的模型,其中有n 1個引數。我們希望所建立的數學模型可以很好的刻畫實際問題,而我們所擁有的就是訓練資料集。很自然的,我們希望數學模型可以較好的表述訓練資料集的情況。雖然對訓...
機器學習筆記(一)
統計學習三要素 模型 策略和演算法。模型分類有幾種,監督非監督,引數非引數等。監督學習又分為生成方法和判別方法。生成模型有 樸素貝葉斯和隱馬爾科夫。判別模型有 k近鄰,感知機,決策樹,邏輯回歸,em,svm,boost,crf.引數模型 引數個數固定,與訓練資料無關。非引數模型 引數個數依賴於訓練資...