摘錄 轉AI的一些建議

2021-09-18 01:59:50 字數 4362 閱讀 8965

注:本文**普通程式設計師如何轉向ai方向 - 計算機的潛意識 的部落格,感興趣的話可以多看看ta的博文喲!

我能做的就是在這基礎上,推薦了李航博士的《統計學習方法》

對普通程式設計師的定義是:擁有大學本科知識;平時工作較忙;自己能獲取的資料有限。

ai(人工智慧)並不僅僅包括機器學習;關於ai領域的發展歷史介紹推薦看周老師寫的《機器學習簡介》,ai不好跨的原因在於學習過程中要面對大量複雜的公式,在實際專案中會面對資料的缺乏,以及艱辛的調參等。因此需要制定要制定合適的學習方法。

學習方法的設定就是回答以下幾個問題:

首先了解這個領域,建立起全面的視野,培養起充足的興趣 :ai是什麼?它能做什麼事?它的價值在什麼地方?

關於機器學習是什麼,能做什麼,它與深度學習以及人工智慧的關係,可以看部落格從機器學習談起 -

線性代數:矩陣乘法;高數:求導;概率論:條件與後驗概率

資源查詢:

機器學習的第一門課程首推andrew ng的機器學習。這門課程有以下特點:難度適中,同時有足夠的實戰例子,非常適合初學者。cs229 史丹福大學-機器學習這門課程不推薦,原因有以下:

教學:ng在cs229 時候的教學稍顯青澀,有很多問題其實他都沒有講清楚,而且下面的人的提問其實也很煩躁,你往往不關心那些人的問題。在coursera上ng的教學水平大幅度改善了,他會對你循循善誘,推心置腹,由淺入深的教學,在碰到你不明白的單詞術語時也會叫你不要擔心,更重要的,推導與圖表不要太完善,非常細緻清晰,這點真是強力推薦;

字幕:cs229 的字幕質量比coursera上的差了一截。coursera上中文字幕翻譯經過了多人把關,質量很***;

作業:cs229 沒有作業,雖然你可以做一些,但不會有人看。這點遠不如coursera上每週有deadline的那種作業,而且每期作業提交上去都有打分。更重要的是,每期作業都有實際的例子,讓你手把手練習,而且能看到自己的成果,成就感滿滿!

機器學習的知識系統化,有相對經典的書。其中統計學習(代表svm)與整合學習(代表adaboost)是在實踐中使用非常多的技術。下面是相關資源:

推薦:機器學習(周志華)如果是在以前,機器學習方面的經典教材首推prml,但現在周老師的書出來以後,就不再是這樣了。首先推薦讀周老師的書。這本書有乙個特點,那就是再難的道理也能用淺顯精煉的語言表達出來。正如周老師的名言:「體現你水平的地方是把難的東西講容易了,而不是把容易的東西講難,想把乙個東西講難實在太簡單」;

推薦:統計學習方法-豆瓣評價

[提取碼: y5pz ]

統計學習又叫統計機器學習,和機器學習的重合內容多,但是公式推導非常清晰,強烈推薦!!!!

學習完了基礎課程,你對機器學習就有了初步了解。現在使用它們是沒有問題的,你可以把機器學習演算法當作黑盒子,放進去資料,就會有結果。在實戰中你更需要去關心如何獲取資料,以及怎麼調參等。如果有時間,自己動手做乙個簡單的實踐專案是最好的。需要選擇乙個應用方向:是影象(計算機視覺cv,computer version)、音訊(語音識別speech recognition),還是文字(自然語言處理nlp,natural language processing)。這裡推薦選擇影象領域,這裡面的開源專案較多,入門也較簡單,可以使用opencv做開發,裡面已經實現好了神經網路,svm等機器學習演算法。專案做好後,可以開源到 github 上面,然後不斷完善它。實戰專案做完後,你可以繼續進一步深入學習,這時候有兩個選擇,深度學習和繼續機器學習;

推薦deep learning (*****)  ,2023年nature上的**,由三位深度學習界的大牛(yann lecun, yoshua bengio & geoffrey hinton)所寫,讀完全篇**,給人高屋建瓴,一覽眾山小的感覺,強烈推薦。如果只能讀一篇**了解深度學習,我推薦此篇。這篇**有同名的中文翻譯;

推薦 neural networks and deep learning:這本書的作者非常擅長以淺顯的語言表達深刻的道理,雖然沒有翻譯,但是閱讀並不困難;

推薦 recurrent neural networks : 結合乙個實際案例告訴你rnn是什麼,整篇教程學完以後,會讓你對rnn如何產生作用的有很清晰的認識,而這個效果,甚至是讀幾篇相關**所沒有的;

不推薦,neural networks for machine learning - university of toronto | coursera:深度學習創始人教的課,最大的問題是太難,而且老先生的吐字有時不是很標準;

不推薦,deep learning (book):同樣也是由深度學習大牛所寫的書。很多內容都講了,但是感覺也沒講出什麼內容來,只是告訴你來自那篇**,但是可以把這本書當作**索引來用,可能直接閱讀**更合適。

不推薦,cs231n:李菲菲的課程,很有名,專門講cnn。但是這門課程有乙個最大的問題,就是沒有字幕,雖然有youtube的自動翻譯字幕,但有還不如沒有。

推薦機器學習(周志華)

不推薦pattern recognition and machine learning : 當前階段不推薦;prml是以貝葉斯的觀點看待很多機器學習方法,這也是它的一大特色。但對於初學者來說,這種觀點其實並無必要。而且此書沒有中文翻譯,當前階段硬啃很容易放棄;

當知識儲備較為充足時,學習可以再次轉入實踐階段。這時候的實踐仍然可以分兩步走,學習經典的開源專案或者發表高質量的**。開源專案的學習應該以盡量以優化為目的,單純為讀**而學習效果往往不太好。好的開源專案都可以在github 裡搜尋。這裡以深度學習為例。深度學習的開源優秀庫有很多,例如torch,theano等等,這裡列舉其中的兩個:

推薦 deeplearntoolbox :較早的乙個深度學習庫,用matlab語言撰寫,較為適合從剛學習的課程轉入學習。遺憾的是作者不再維護它了;

推薦 tensorflow :google的開源庫,時至今日,已經有40000多個star,非常驚人,支援移動裝置;

較好的課程都會推薦你一些**。一些著名的技術與方法往往誕生於一些重要的會議。因此,看往年的會議**是深入學習的方法。在這時,一些**中的內容會驅使你學習數學中你不擅長的部分。有時候你會覺得數學知識儲備不夠,因此往往需要學習一些輔助課程。當你看完足夠的**以後,在這個階段,如果是在校學生,可以選擇某個課題,以**文為目的來學習研究。一般來說,**是工作的產物。有時候一篇基於實驗的**往往需要你寫**或者基於開源專案。因此開源專案的學習與會議**的工作兩者之間是有相關的。兩者可以同時進行學習。關於在**看**,可以看一下ccf推薦排名; 

cvpr:與另兩個會議iccv和eccv合稱計算機視覺領域的三大會,注意會議每年的主頁是變動的,因此搜尋需要加上年份,例如cvpr2018;

nips :conference on neural information processing systems的簡稱,許多重要的工作發表在這上面,例如關於cnn的一篇重要**就是發表在上面;  點nips**集檢視!

本文的目的是幫助對ai領域了解不深,但又想進入的同學踏入這個門。這裡只說踏入,是因為這個領域的專精實在非常困難,需要數年的積累與努力。在進行領域學習前,充分認識自己的特點,制定合適的學習方法是十分重要的。首先得對這個領域進行充分了解,培養興趣。在學習時,保持著循序漸進的學習方針,不要猛進的學習過難資源;結合著學習與實踐相輔的策略,不要唯讀只看,實際動手才有成就感。學習某個資源時要有充分的目的,不是為了學開源專案而看**,而是為了寫開源專案而看;不是為了**文而寫**,而是為了做事情而寫**。如果乙個學習資源對你過難,並不代表一定是你的問題,可能是學習資源的演講或撰寫人的問題。能把難的問題講簡單的人才是真正有水平的人。所以,一定要學習優質資源,而不是不分青紅皂白的學習。最後,牢記以興趣來學習。學習的時間很長,過程也很艱難,而只有興趣才是讓你持之以恆,攻克難關的最佳助力。

謹以此文與在學海中乘舟的諸位共勉。我就是一名普通程式設計師,剛剛轉入ai領域,還有很多不足。希望此文可以幫助到大家。

Coders at Work一些摘錄

乙個哥們摘錄了,我再摘錄他的。這些高手們都不喜歡c 都非常崇尚熱情,乙個程式設計師沒有熱情,那真的很難達到高手級別的。很推崇表達能力,書寫能力,思維清晰很重要 但是總會有例外啊,陳景潤 應聘時候多談實際,而不是很懸的智力和數學測試,讓他寫 帶來引以為豪的 如果他兩眼放光的給你講他過去的專案經歷,那起...

直接摘錄一些文字

1.人也是這樣,有的人生來就具備成功的素質。2.一直以來,靠堅強和自信所以快樂又積極地活著,堅強和自信就是人生的頂樑之柱,真不敢想象如果那一天我失去他們了生活會怎樣。常常告訴自己要敢於面對所有的困難,常常安慰自己很多困難過去後再回首就覺得特別的有價值。前面的路尚未明了,命運依舊難卜,但自信依舊在。仔...

學習scanf的一些摘錄

scanf 函式是格式化輸入函式,它從標準輸入裝置 鍵盤 讀取輸入的資訊。其呼叫格式為 scanf 格式化字串 位址表 格式化字串包括以下三類不同的字元 1 格式化說明符 格式化說明符與printf 函式中的格式說明符基本相同。但和printf 函式中格式字串的用法有一些小區別。我們來看下面這個表。...