機器學習,即人工智慧的乙個分支,人工智慧目前具有一定的限制,無法突破強人工智慧,即無法像人類一樣思考,感受等。機器學習其實就是通過大量的資料輸入,找出符合資料集的演算法模型,在輸入新的資料集時在進行判斷其屬性,是數學、計算機和統計學的集合。類似於人類的學習經驗,使用經驗判斷的過程。機器學習在於區分和訓練最優的模型,即不斷的讓機器增長經驗,從而判斷出新資料的型別。機器學習可以不斷的優化公式,但不太可能得出乙個萬能公式,為了不斷得出正確的結果就需要不斷進行訓練,不斷的擬合出最優的函式。機器會得到乙個輸入集和結果集,不斷找出其關係,隨著大量經驗的積累,程式的效能也會逐漸提高。
流程演算法:依據給出的資料特徵,選擇乙個比較合適的演算法
模型:使用資料和演算法構建出模型
評估:檢驗模型的效能,然後不斷迴圈到第一步優化演算法
相應的概念
擬合:構建符合給定資料的演算法
魯棒性:健壯性,演算法是否通用,是否能夠更好的擬合正常和異常資料
過擬合:演算法過於符合資料的特徵,即只能適合一定範圍的資料,通用性非常差,在實際過程中資料基本無法擬合
欠擬合:不符合樣本特徵,無法有效的進行擬合
分類:將具有相同特徵的資料分在一起
適用場景
推薦廣告,營銷,劃分,**建模,模式識別,資料探勘,統計學習,語言處理,語音識別
分類有監督學習,無監督學習,半監督學習。其區分標準在於是否將已具有某些特性的樣本作為訓練集,這些樣本是人工進行標註的(標籤)。
有監督學習
判別式模型:線性回歸、決策樹、支援向量機svm、k鄰近、神經網路
生成式模型:隱馬爾可夫模型hmm、樸素貝葉斯模型、高斯混合模型gmm、lda
生成式模型更加普適,關注資料如何產生,尋找資料分布模型;判別式模型更加直接,關注資料差異性,尋找資料分類面。
無監督學習
通過提取或者學習資料特徵,抽取主要的特徵資訊,常見的演算法有聚類,降維,文字處理等,一般作為有監督學習的前期處理,功能是從原始資料中抽取必要的標籤資訊。
這其中有不合適或者不正確的地方歡迎指正,我的qq號碼:2867221444(喬金明),謝謝,也可以相互交流下,備註資訊隨意,只要能看得出是開發者或者學習者即可。
機器學習簡介
機器學習簡介 機器學習是人工智慧的乙個分支。人工智慧的研究是從以 推理 為重點到以 知識 為重點,再到以 學習 為重點,一條自然 清晰的脈絡。顯然,機器學習是實現人工智慧的乙個途徑,即以機器學習為手段解決人工智慧中的問題。機器學習在近30多年已發展為一門多領域交叉學科,涉及概率論 統計學 逼近論 凸...
機器學習簡介
機器學習101 在這篇博文中,我們將從以下幾個方面簡要地向大家介紹一下機器學習。如果你不是這方面的專家,也不需要擔心,因為在這篇博文中談及的內容僅需要高中的數學知識就足夠了。什麼是機器學習?牛津詞典將機器學習定義為 the capacity of a computer to learn from e...
機器學習簡介
先說點廢話 我們先做一些模擬資料 我做的這些資料大致滿足y 3x,一共有50個資料點,在最開始的時候初始的引數可能是0.1,y 0.1x顯然是不能模擬這些資料的,學習的過程就是在不斷的調整引數至不斷接近3的過程,當擬合的差不多的時候,我們就有了乙個比較好的模型,假如現在有乙個新的x 20,我們可以大...