本文是對《從機器學習談起》一文的讀書摘要,這片文章很詳細的介紹了機器學習,很適合入門新手讀(我就是)
機器學習是一種讓計算機利用資料
而不是指令
來進行各種工作的方法
機器學習方法是計算機利用已有的資料(經驗)
,得出了某種模型
,並利用此模型**未來
的一種方法
從廣義上來說,機器學習是一種能夠賦予機器學習的能力以此讓它完成直接程式設計無法完成的功能的方法。
從實踐的意義上來說,機器學習是一種通過利用資料
,訓練出模型
,然後使用模型**
的一種方法。
機器學習界「資料為王
」, 一般來說(不是絕對),資料越多,最後機器學習生成的模型**的效果越好
「訓練」產生「模型」,「模型」指導 「**」
模式識別
=機器學習 模式識別源自工業界,而機器學習來自於計算機學科
統計學習
近似等於機器學習
資料探勘
=機器學習+資料庫 大部分資料探勘中的演算法是機器學習的演算法在資料庫中的優化
計算機視覺
=影象處理+機器學習
語音識別
=語音處理+機器學習
自然語言處理
=文字處理+機器學習
線性回歸
處理的是數值問題,**出的結果是數字
「最小二乘法」 「數值計算」 「梯度下降」以及「牛頓法」
邏輯回歸
**結果是離散的分類
, 邏輯回歸只是對對線性回歸的計算結果加上了乙個sigmoid函式,將數值結果轉化為了0到1之間的概率
資料 「標籤」 「特徵」
也稱之為人工神經網路,ann, 分解與整合 生物科學成分
輸入層
,接收訊號
隱藏層
,對資料的分解與處理
輸出層
神經元
-> 層 -> 神經網路
神經元: 處理單元事實上就是乙個邏輯回歸模型
支援向量機演算法從某種意義上來說是邏輯回歸演算法的強化, 數學成分
高斯「核」 是一種特殊的函式 最典型的特徵就是可以將低維的空間對映到高維的空間。
k-means演算法
主要特徵是將資料從高維降低到低維層次
主要作用是壓縮資料與提公升機器學習其他演算法的效率
資料的視覺化
pca演算法(即主成分分析演算法)
推薦演算法較為特殊,既不屬於監督學習,也不屬於非監督學習,是單獨的一類
一類是基於物品內容
的推薦: 每個物品都需要貼標籤,因此工作量較大
一類是基於使用者相似度
的推薦
協同過濾演算法
按照訓練的資料有無標籤分類
監督演算法
:訓練資料都是包含標籤
無監督算
: 訓練資料都是不含標籤
監督學習演算法:
線性回歸,邏輯回歸,神經網路,svm
無監督學習演算法:
聚類演算法,降維演算法
大資料並不等同於機器學習,同理,機器學習也不等同於大資料。
大資料中包含有分布式計算,記憶體資料庫,多維分析等等多種技術
大資料也包含以下四種分析方法:
1.大資料,小分析
:即資料倉儲領域的olap分析思路,也就是多維分析思想。
2.大資料,大分析
:這個代表的就是資料探勘與機器學習分析法。
3.流式分析
:這個主要指的是事件驅動架構。
4.查詢分析
:經典代表是nosql資料庫。
分布式計算map-reduce
機器學習模型的資料越多,機器學習的**的效率就越好
成功的機器學習應用不是擁有最好的演算法,而是擁有最多的資料!
深度學習
:傳統的神經網路發展到了多隱藏層的情況
1.多隱層的神經網路具有優異的特徵學習能力,學習得到的特徵對資料有更本質的刻畫,從而有利於視覺化或分類;
2.深度神經網路在訓練上的難度,可以通過「逐層初始化」 來有效克服。
具有多個隱藏層的神經網路被稱為深度神經網路
,基於深度神經網路的學習研究稱之為深度學習
發展階段:從早期的機器學習推理,到中期的專家系統,現在的機器學習
智慧型是對生活的感悟,是對人生的積澱與思考
機器學習的思想:通過經驗獲取規律,指導人生與未來。沒有經驗就沒有智慧型。
深度學習屬於機器學習的子類, 機器學習是人工智慧子類
明意識 「吾日三省吾身」
潛意識
闡述乙個觀點時,用乙個事實,或者乙個故事,比大段的道理要好很多
機器學習的核心思想:統計和歸納
機器學習的真正應用不是通過概念或者思想的方式,而是通過實踐。只有當把機器學習技術真正應用時,才可算是對機器學習的理解進入了乙個層次。
參考:從機器學習談起
從機器學習談起
在本篇文章中,我將對機器學習做個概要的介紹。本文的目的是能讓即便完全不了解機器學習的人也能了解機器學習,並且上手相關的實踐。這篇文件也算是easypr開發的番外篇,從這裡開始,必須對機器學習了解才能進一步介紹easypr的核心。當然,本文也面對一般讀者,不會對閱讀有相關的前提要求。在進入正題前,我想...
《贏》讀書摘要01
使命和價值觀 使命 使命主要描述乙個問題,我們的業務如何才能贏?它要求公司在人員 資金以及其他資源等方面做出取捨 選擇,避免自己陷入盲目的出擊的陷阱中。它讓企業明白自己的優勢和劣勢,明白自己能夠在哪種競爭中贏得遊戲 有效的使命總是在可能的目標和不可能的目標之間尋求的一種平衡。它既要給大家清晰地方向,...
Rework的讀書摘要
rework 2.learning from mistakes is overrated 從錯誤中學到的東西被高估了 3.planning is guessing 計畫是幻想 takedown 準備 5.why grow?6.workaholism 工作狂?7.enough with entrepr...