是英文名稱machine learning(簡稱ml)的直譯機器學習領域,又或者更大而化之的說人工智慧方向,因為「阿爾法狗」等一系列的熱門爆點話題,被推到了人前,受到越來越多人的關注~
無論你是什麼領域的工作者,都一定多多少少聽說過它的名號。
而與此同時,隨著機器學習領域理論的成熟,越來越多的相關技術被應用於生活實踐的方方面面,從事機器學習崗也成了很多計算機行業從業者的重點考慮。
因此接下來我會從我個人實際情況出發,帶大家對「機器學習」進行初入門了解~
這是 。。。
這張相信大家都很熟悉,沒錯就是windows phone上的語音助手cortana,當初微軟很晚才推出這款產品,他背後的核心技術理所當然的就是機器學習,它實現了人們一直想要的人機互動。如今各大手機平台上也有了類似的身影,大大方便了人們的日常生活!那它是怎樣像人類那樣學習互動的呢?其實相比傳統的命令式的程式,機器學習用的是使用者傳入的資料。類似於概率推算的過程
舉例說明:
例如你喜歡乙個女孩子,而她和你一直相處和諧,於是你決定去向她表達你的想法,這種情況下成功的機率是很大的;然而相反,如果你們初識或者平時也聊不怎麼來,那麼你就得考慮一下了。
這個過程其實就和機器學習是類似的,你只要把引數和變數傳入,機器來建立乙個模型,就很可能實現這一過程啦~
我們把機器學習的過程和人類對歷史經驗歸納的過程做個比對。
現在是不是對機器學習有了點興趣呢~
區別
監督學習:
顧名思意就好比有老師的教學,在已有知識背景條件下(老師教你的方法)去套用並訓練這些技能,最終得到這些知識的運用方法,當以後遇到類似的問題,也能用這些模型來處理和解決它;
無監督學習:
自然就是無老師,沒經驗的自學,那麼機器能做到嗎?其實我們日常生活中就無處不在。以我自己為例,平時我對電腦硬體方面很有興趣,算是一種個人愛好吧!當初的我對其還是一片空白是就好比無監督學習,但當我見過並用過許多硬體後,便在心裡產生了好壞的分類區別了,接下來便和監督學習類似了,像有了「模型」。
泛化能力(generalization ability)是指機器學習演算法對新鮮樣本的適應能力。
學習的目的是學到隱含在資料背後的規律,對具有同一規律的學習集以外的資料,經過訓練的網路也能給出合適的輸出,該能力稱為泛化能力。
通常期望經訓練樣本訓練的網路具有較強的泛化能力,也就是對新輸入給出合理響應的能力。應當指出並非訓練的次數越多越能得到正確的輸入輸出對映關係。網路的效能主要用它的泛化能力來衡量。
對比不同模型的泛化能力時,採用不同的度量方法,往往得到不同的結果,所以什麼樣的資料模型是好的,不僅取決於演算法和資料,還取決於任務需求。下面是回歸任務和分類任務常用的效能度量。
概念:
擬合的函式和訓練集誤差較大,我們稱這種情況為 =》欠擬合
擬合的函式和訓練集誤差較小,我們稱這種情況為 =》合適擬合
擬合的函式完美的匹配訓練集資料,我們稱這種情況為 =》過擬合
欠擬合:
合適擬合:(非完全擬合,和現實相近)
過擬合:(理想模型)
欠擬合問題,根本的原因是特徵維度過少,導致擬合的函式無法滿足訓練集,誤差較大。
欠擬合問題可以通過增加特徵維度來解決。
過擬合問題,根本的原因則是特徵維度過多,導致擬合的函式完美的經過訓練集,但是對新資料的**結果則較差。
解決過擬合問題,則有2個途徑:
1.減少特徵維度; 可以人工選擇保留的特徵,或者模型選擇演算法
2.正則化; 保留所有的特徵,通過降低引數θ的值,來影響模型
5.2.1概念和思維解讀
叉驗證的目的:在實際訓練中,模型通常對訓練資料好,但是對訓練資料之外的資料擬合程度差。用於評價模型的泛化能力,從而進行模型選擇。
交叉驗證的基本思想:把在某種意義下將原始資料(dataset)進行分組,一部分做為訓練集(train set),另一部分做為驗證集(validation set or test set),首先用訓練集對模型進行訓練,再利用驗證集來測試模型的泛化誤差。另外,現實中資料總是有限的,為了對資料形成重用,從而提出k-摺疊交叉驗證。
對於個分類或回歸問題,假設可選的模型為。k-摺疊交叉驗證就是將訓練集的1/k作為測試集,每個模型訓練k次,測試k次,錯誤率為k次的平均,最終選擇平均率最小的模型mi。
解讀,go=>
最後希望各位學得開心!,過好每一天~
python VTK 初入門學習
各位大佬手下留情呀?vtk 初入門,有很多東西,都是現學,現用的,其中不乏踩坑,踩了大約1,2,3,4.也記不得多少個了,反正,現在腿還瘸著呢,累的叉會腰?首先給大家推薦幾個 第乙個 oimagedata 這個 是vtk官網中一些關於函式和類的python 版本案例,可以從中學到很多的vtk函式 和...
機器學習門徑初窺
機器學習概述 1.什麼是機器學習呢?所謂機器學習,從我的理解來看就是指給定一些樣本資料,通過對樣本資料提取特徵 feature 通過對這些特徵進行分析並得到一些規律,然後通過這些規律來 一些未知的事情。2.機器學習的價值是什麼呢?個人認為機器學習的價值就在於通過對一大堆無序的資料抽取規律,並用於解釋...
初入機器學習(2)
今天先大致講下機器學習的理論基礎,基礎術語和一些概念性的定 釋等。首先是基礎術語 1 資料集 data sets 是乙個記錄關於乙個事件或者物件的集合,也就是我們的所需要的資料的乙個集合,包括特徵 feature 或者屬性 attribute 等,當然如果是監督學校的話也包括標籤 label 2 特...