機器學習怎麼入門 自學篇

2021-09-22 07:40:01 字數 2820 閱讀 1377

首先,闡明以下個人背景:211工科碩士,雙控工程畢業,有一定數學和人工智慧基礎。

接下來,我們就細細分析人工智慧的自學之路。

1.前提條件:個人學力(非學歷)要求

很多培訓班在進行培訓產品推介的時候,都會對學員的學歷背景做一定了解,是不是大學生?有沒有學過高數?是否了解統計學?甚至有的培訓班還會將英語水平作為乙個諮詢條件。

在我個人看來,培訓班這樣做,並非是做樣子,而是,在人工智慧的高階之路上,確實有一定的基礎知識和硬性條件,概括來講有以下幾點

(1)數學能力:分為高等數學、線性代數和統計學等領域。

舉個例子,很多機器學習/人工智慧培訓課的第一堂課,往往會將線性回歸。線性回歸的求解思路有兩種:線性代數矩陣求逆和梯度下降法,前者需要學生知道什麼矩陣,向量,轉置、求逆等基本知識,後者需要學生了解導數、偏導數,這些概念在高等數學的基礎上是,是很難直接領會的,跨專業跨行業自學的同學,如果您的大一大二基礎課不錯,相信入門應該會輕鬆很多。

為什麼要講統計學?這就要細緻的談到機器學習的知識體系,機器學習從監督角度來分,分為監督學習和無監督學習,有很多模型的基礎是直接**統計學,所以有時候大家會看到統計學習這個概念,就是這種原因。有一本比較好的入門書籍推薦給大家《統計學習方法》-李航編寫的,通俗易懂,開篇就給大家介紹了:統計學習是關於計算機基於資料構建概率統計模型並運用模型對資料進行**和分析的一門學科。書中提到的感知機、k近鄰等方法就不一一枚舉了。

綜合看來,數學方面的基礎能力,確確實實是學習機器學習的基礎,不可或缺。

(2)計算機能力:基本的計算機知識和適當的程式設計能力。

計算機能力的要求,應該是易於理解的,機器學習,必須是要驅動機器去學習,去對資料進行特徵提取,去代替人思考和判斷,連驅動機器的基本常識不具備,可能也會在這方面吃一些虧吧。

問題的關鍵在於應當如何定義計算機能力?

人工智慧需要計算機程式設計高手嗎?非也,計算機高手固然有優勢,但數學建模能力更重要。這裡討論機器學習最低門檻水平,我認為即是具備閱讀偽**的基本水平吧。

現如今,世界上的機器學習框架非常多,存在有以各種計算機語言為基礎的機器學習演算法庫,最為火爆的就是python,而python就是著名的膠水語言,其編碼行文邏輯非常類似人類語言,可以達到快速上手。創新導師李開復曾經說過:我那個時候學機器學習,但是沒什麼成果,為甚?因為沒有這麼多技術的支撐,個人能力非常有限,成果有效,但現在不一樣,大資料、機器學習的開源專案,總有一款適合你。

剩下英語能力,說到底還是高階需求,當學習到一定程度之後,你會發現大家都要從英文裡面找材料來學習,這裡暫且不討論。

2.確定學習目標

在經過自我判定,是否具備機器學習自學的條件後,我們需要定位自己的學習目標,沒有目標就沒有計畫,沒有計畫,自學將成為無稽之談。

那個人應該如何確定目標了?其實有個很簡單方法:上招聘**,看人工智慧相關崗位的崗責要求,崗責要求中對學歷、經驗、技能、理**底、都有非常明確的要求,可謂是明碼變價,後續,我將會就人工智慧崗位做乙個大資料分析,發表第一篇純技術應用型文章。

簡單來講,我們可以將目標定義為三類:

(1)初級小白:對人工智慧有一定了解的業外人士;

(2)中級工程師:能夠利用機器學習方法投入生產實踐的專業人士;

(3)技術領袖:在機器學習領域具備理論探索能力的神級人士;

在這裡,我們之**第二類,因為第二類是常人所能及,第一類相對簡單,順道就可以實現,而第三類那就是博士教授大大們的事情了,與凡人無關了(開個玩笑,只要你願意幹,都可以實現的)。

目前,我個人還在第一階段,跟著吳恩達的課程和周志華的西瓜書在學習,效果尚可,沒有很明顯的學習梯度。

4.想強調的話

企業在招聘人才的時候,相比於理論能力,更看重實踐能力,如果沒有機器學習實戰的同學,可以有以下幾條渠道刷經驗:

(1)加入開源專案(github上找),爭取成為contributer

(2)參加國內外機器學習競賽,拿名次,國內有天池、國外有kaggle

總之一句話,就是要多練。

補充,對於學生黨來講,可以**文,以下是機器學習高水平**期刊、會議名錄,摘自《機器學習》周志華

機器學習領域

國際會議:

國際機器學術會議:icml

國際神經資訊處理系統會議nips

國際學習理論會議colt

區域會議:

歐洲機器學習會議ecml

亞洲機器學習會議acml

國際期刊

journal of machine learning research

machine learning

人工智慧領域

重要會議

ijcai

aaai

重要期刊

artificial intelligence

journal of artificial intelligence research

資料探勘領域

重要會議

kddicdm

重要期刊

acm transactions on knowledge discovery from data

data mining and knowledge discovery

計算機與模式識別

重要會議

cvpr

重要期刊

ieee transactions on pattern analysis and machine intelligence

神經網路領域

重要期刊

neural computation

ieee transactions on neural networks and learning systems

統計領域

重要期刊

annals of statistics

國內:中國機器學習大會(ccml)兩年一次

機器學習機器應用(mla)

機器學習 1 概述入門篇

本週任務 1.python基礎的準備 本課程擬採用python做為機器演算法應用的實現語言,所以請確保 1 安裝好python開發環境,pycharm 或 anaconda等都可以,按個人習慣喜好。2 基本庫的安裝,如numpy pandas scipy matplotlib 3 具備一定的pyth...

機器學習方法篇 23 增強學習入門

別讓夢想的附屬品喧賓奪主。在小鬥去年五月份寫的 alphago技術剖析 揭開圍棋大腦的神秘面紗 這篇介紹alphago的文章中講到,alphago之所以能戰勝人類頂尖的圍棋手,主要是增強策略網路的功勞。而增強策略網路的核心技術,便是增強學習。那麼,增強學習到底是什麼?增強學習 reinforceme...

Python3入門機器學習 numpy篇

numpy是python的乙個支援矩陣 向量運算的庫,由於python自帶的list不僅效率低,也不會將陣列看作矩陣或者向量,因此在機器學習中,使用numpy來作為運算元組及矩陣的工具 x numpy.arange 10,3,5 x.ndim x的維度 x.shape x的各維度長度 x.size ...