我的學習路徑與方法之機器學習匯入篇

2021-09-26 21:44:05 字數 3235 閱讀 5414

作為一名資訊與計算科學專業的畢業生,我學了許多數學方面的知識以及與計算機相結合的實踐。數學,這個現代科學的基石,大家又愛又恨的科目,是一門對數字以及相關的許多抽象概念不斷組合、把玩的學問。所謂「陰陽術數」,在中國古代,數字有特定的含義,奇數為陽,偶數為陰,在中藥、周易推演、風水評估等許多方面有應用。中藥裡,有時不是像現在西醫配方那樣以重量、體積來定一味成分的量,而是類似「蟋蟀一對」、「梅花三朵」這樣的描述來定量,不管蟋蟀、梅花的大小。在他們看來,個體數、數字本身即可計量,而

一、三、五、七之類的組合,就像周易或者公式一樣,代入之後就能產生一種「場」效。

中西對待數學的方式之別,其實反映了中西文化中應物御世的世界觀、方法觀之別。中國人以象為著眼點,所謂「大象無形」,不會去糾結具體的現象、演化步驟。比如中醫,從人體的氣機通暢,日常生活中五味平衡、六音協調、身體與外界之間陰平陽秘來調常,人最舒服,身體也最健康。西醫則要測量人的血壓、心跳,化驗人的血液、二便,得出一系列指標測量值,再在這些指標的取值範圍中確定位置。從根本上講,他們做的是同一件事,都是去感知人體的身體狀況、調節人的身心,只是前者從可見的現象,從人可直接感觸的地方入手,用人類與生俱來的感知判斷能力來進行診斷,對人的依賴性大。所以中醫有時顯得很玄,如同普通人與科學家之間的差距,高明的中醫人對人體的直觀了解能力是我們難以理解的,就像現在我們面對化驗單上的一系列指標一樣,高明的中醫可以從你的腳步聲、面色、行動姿態等細節精確感知到你的身體功能、血氣輸布情況。

對於科學技術,這個現代生產力的第一推動力量,在中國自古被認為是「奇技淫巧」,聖賢們推崇的是:虛其心、實其腹,無為而治。這其實是一種很高明的治理策略。科技發展到現在,不可謂不發達矣,但是科技本身是一把雙刃劍,全球化、科學化帶走了我們的豐富地域差異性以及對愛情等美好事物的純真想象,從某種意義上說也是樹立了一種新的信仰,乙個新的宗教。折騰了幾百年和無數的學者精英,在諸多領域取得了無數的成果與發明,對人來說最舒服的生活境界還是採菊東籬下的田園瀟灑、海上明月共潮生的耕漁愜意以及萬卷讀破詩愈美的靜謐喜悅;最理想的社群環境還是雞犬不相聞的寧謐和諧、夜不閉戶的民風樸素。因此中國人很早就先知般明智地棄科技取文學,起碼對於我們大多數人來講,看敘述性的文字比天書般的數學更加省力。

但現實的歷史終究要面對,西方文化船堅炮利,硬把我們從「**上國」的美夢中打醒了,我們的觀念、生活方式也大大地西化了,從此不再僅僅讀語文,還要學習數學、研究發明各種「奇技淫巧」來提公升我們的國力與生活,要探索一切可能,包括地外文明。到了我們這個年紀,數學也是學了不少的:從基礎的算數方程幾何,到高等代數、微積分、概率論、解析幾何。雖然學了這麼多的數學知識,一遇到現實問題,仍然是半瓶水晃蕩;看到數學公式,仍然頭暈、頭痛。這裡面有教育模式的問題,國內教育重知識灌輸而輕知識本身的發現、推演過程,對於知識在實際生活中的運用也重視不夠。 

學習是有不同的方法的,像我們以前是塞、填,九年的填鴨式學習讓我們喪失了自主發現、推演的能力以及動力。「為學日增、為道日減」。其實為學也可以從減入手,只有先放下已有的觀念,倒掉已有的水,才好裝進新的知識。如何做減法因人而異,就比如我(在真正的休息,比如坐禪或者睡完一覺之後),用初生嬰兒般的好奇、不帶先入概念地看這個世界,就會有很多平時忽略了的發現。佛家道家電影以及武裝劇中常有「無字天書」之說,在我看來無字天書就是我們能接觸到的一切資訊,包括我們這個身體(人的身體其實很奇妙,細細體會能夠發現很多道理,也能由此發明很多東西,比如太極,比如周易),以及我們周遭的人際、社會場景,每天看到的自然現象(太陽東昇西落、月盈月虧、潮漲潮落)。我們不需要像科學家那樣去一一細鑽,但是要像科學家那樣客觀,靜靜地體味天地、生活的美,並進而發現其中的各種規律,遷移到我們現在面對的難題上。

比如數學,許多大科學家都提倡不要記那麼多公式,用時知道在哪就好,所以平時看數學相關的書籍看得懂摸得透細節固然很好,但是搞不拎清時,知道有這麼個東西,從**找就可以。但作為技術男,有時就是要搞懂弄通許多複雜、艱澀的流程以及公式,這也是我常常面對的問題。古人云:讀書百遍,其義自現。現在這麼多公式、,讀是讀不了了,但是還可以抄,我的體會是抄個兩遍,我們會發現許多遺漏的細節,進而弄懂這些流程、公式。當然這也是有科學依據的,抄這個動作放慢了我們咀嚼資訊的速度,聰明如各位,反覆咀嚼,反芻消化,還有什麼是吃不透嚼不爛的呢。

不僅在學習、搬取已有知識上有古法可效,在新方案設計、難題攻克上,無字天書也能助我們一臂之力。譬如機器學習、人工智慧,這麼高大上的領域,我們能否在上面有自己的建樹與作為?可以!為什麼?機器學習其實是模仿人的學習,作為被模仿者的我們靜下心看看自己是怎麼學習的,回顧一下自己學習的經過歷程,便能找到許多機器學習的思路。舉個例子:人的學習有主動、被動,機器學習也由此分為有監督學習、無監督學習、半監督學習。人可以如鏡子般反照外相,吸收知識;也可以與外界互動,在互動中學習;延伸至機器學習,便有所謂強化學習的概念。

機器學習的作用是分類、回歸、**以及指導決策。那麼想一下,人是怎麼區分兩個同類事物的,比如兩個蘋果,有大小、色澤之別,咬一口還有水份、酸甜度之差別。在嘗試、對比了這一系列屬性綜合之後,便可以找到區分蘋果的一些重要特徵,在這些特徵上建立區分模型來給蘋果區分品種。比如聚類,就是按照各項指標相似度,相近者歸為同一類;如果事先已知蘋果的分類,我們可以走監督學習(如決策樹)的路子;如果僅僅知道一些大而泛的資訊,比如產地、光照,我們還可以走半監督層次聚類的路。

在已有蘋果(訓練集)上得到的結論在其他蘋果(測試集)試,從失敗中總結經驗,再次玩這個蘋果分類的遊戲,就是迭代。分了多次之後,我們成了這方面的專家,給我們乙個蘋果,我們都能直接說出它的品類產地,這款模型便足夠健壯,可以上線使用了。

以上是學習方法,那麼我學習的知識、內容範圍呢?我對數學、演算法體會較多,平時也在這些上面折騰較多,還喜歡看很多在別人看來很雜的書,包括產品、運營以及機器學習等等相關的書,用蘋果創始人喬幫主的一段話作為解釋:        

當時,我壓根兒沒想到這些知識會在我的生命中有什麼實際運用價值;但是10年之後,當我們設計第一款macintosh電腦的時候,這些東西全派上了用場。我把它們全部設計進了mac,這是第一台可以排出好看版式的電腦。如果當時我大學裡沒有旁聽這門課程的話,mac就不會提供各種字型和等間距字型。自從windows系統抄襲了mac以後,(鼓掌大笑)所有的個人電腦都有了這些東西。如果我沒有退學,我就不會去書法班旁聽,而今天的個人電腦大概也就不會有出色的版式功能。當然我在念大學的那會兒,不可能有先見之明,把那些生命中的點點滴滴都串起來;但10年之後再回頭看,生命的軌跡變得非常清楚。再強調一次,你不可能充滿預見地將生命的點滴串聯起來;只有在你回頭看的時候,你才會發現這些點點滴滴之間的聯絡。所以,你要堅信,你現在所經歷的將在你未來的生命中串聯起來。你不得不相信某些東西,你的直覺、命運、生活、因緣際會…… 正是這種信仰讓我不會失去希望,它讓我的人生變得與眾不同。

學習專業知識也是一樣,不要太功利化,要相信自己所學都會派上用場(不一定真的具體用該知識,知識是融會貫通的,跨界的知識往往能夠有創新),差異化才是優勢與潛力所在。

我的學習路徑

我從事雲計算網路開發已經超過一年了,今天從我個人的角度總結一下我的學習路徑。openstack是乙個開源的iaas infrastructure as a service,基礎設施即服務 雲計算平台,neutron作為它的網路元件,提供了雲計算環境下的虛擬網路功能,虛擬網路的主要特點是sdn sof...

我的機器學習之旅(一) 認識機器學習

機器學習顧名思義,計算機模擬人類學習行為,獲取學習規律改善自己。可以應用於資料的 任務。人類學習 外界現象 認知 推理判斷 歸納規律 計算機 給定樣本資料 學習規則 獲取資料的規律 根據新的資料進行 機器學習的物件 學習任務t,訓練經驗e,效能目標p 例子 學習任務 下象棋 效能目標 擊敗對手 勝率...

我的機器學習過程

我的理論學習過程 我在學習機器學習演算法的時候,有乙個主線,就是文字分類,我從網上找到了很多文字的資料集,我在學習大部分演算法的時候都用了機器學習演算法進行文字分類,比如貝葉斯,決策樹,lr,整合學習,lsa knn,plsa knn乃至後面的深度學習方法。做實驗時,比較各中演算法。這樣在乙個主線的...