這幾天春節,因為疫情和拜年,所以文章停更了四天。但是這四天裡我並沒有偷懶,我利用間歇的時間讀了一本久仰大名但是一直沒有時間閱讀的書。它就是吳軍老師的著作——《數學之美》。
讀完之後,果然不負期望,感受非常多,收穫滿滿,因此今天特地單獨開篇文章介紹本書。
首先,我先說對我感觸最大的一點。其實並不是書中講的數學或者是機器學習模型,也不是某個神人科學家的事蹟,而是吳軍老師對待教育的觀點。
在自然語言處理領域,有乙個非常牛的開創人,名叫賈里尼克。他是猶太人,生於二戰之前,由於全家受到二戰的影響舉家移民到了美國。他們剛到了美國的時候非常貧困,以至於他不過十幾歲大,還需要進工廠打工彌補家用。所以他大部分時間不能花在學習上,和其他同學相比,他的課業落下了一大半。
不僅如此,在他成長的路上,他的志向也幾次發生變化。一開始的時候,他想要學醫當一名醫生。但是由於醫學院學費過於高昂,才轉而去的麻省理工的電機工程。雖然發生了這麼多波折,但是有一點沒有變,他一直想要通過自己的努力走向成功。
介紹賈里尼克的故事,並不是想給大家灌雞湯或者是強調努力的重要性。而是想要說明吳軍老師的乙個觀點,就是對於乙個人來說,小學和初中其實並不需要花那麼多時間讀書,因為這個階段的知識總量就那麼多,早點不學晚點也來得及補上。
並且更重要的一點是,隨著乙個人年齡的增長,他的學習能力也在不斷的提公升。乙個在初中階段需要花費500個小時的課程,到了大學可能只需要100個小時。因此早期勤奮積累下的優勢其實非常有限,經常會發生在小學和初中成績平平的學生到了高中和大學迅速起飛逆襲的故事。
更重要的是,學習是乙個終生的事情,不是到了大學或者某個階段就結束。所以對於乙個十幾歲的孩子來說,更重要的是培養他們的性格、素養,以及找到屬於自己的志向。也就是古人常說的早立志。
這個年代天才少年並不罕見,像是前段時間寫出《冰雪奇緣》特效物理引擎的胡淵明,還有在acm界鼎鼎大名的陳立傑和樓天城,無一不是早在少年時期就立志要在程式設計領域有所建樹。
只有遠大的志向才能引導出源源不斷的努力,拿我個人而言,我目前的兩大志向,乙個是做好techflow,另乙個是成為演算法領域一流的技術專家。明確了這兩點之後,我個人的意志以及專注都比之前提公升了非常多。
在我讀這本書之前,我覺得業內的書籍易懂門檻低的往往淺薄,乾貨會比較少,而內容深刻的往往晦澀,容易勸退對於新手體驗不好。想要在市面上找一本既好懂又內容深刻乾貨十足的書非常困難,但是這本書非常難得的同時做到了這兩點。
這本書雖然叫做《數學之美》,聽起來勸退能力很強,但是實際上並不是一本數學領域的書籍,其實也很難說它到底屬於哪個領域,因為本書涉及的內容實在是有點多。既講了很多資訊學家的生平軼事,研究路途上的經歷和一些人生哲學,又涉獵資訊理論、密碼學、統計學、自然語言處理、搜尋引擎等等許多領域的知識。可能也正因此,想必很難找出乙個詞來能夠統領這一切,所以稱為《數學之美》也不為過。
本書的切入點很簡單,就是統計學在自然語言處理的應用。實際上就是我們之前在介紹樸素貝葉斯模型的時候用到的假設,假設每個單詞只和前面的少數幾個單詞有關,並且明確了模型的目標就是使得整個句子或者是文字出現的概率盡量大。現在來看這兩點當然不起眼,但是在當時算得上是劃時代的非常新穎的做法了。正是由於引入了統計學的概念,所以自然語言處理方面得到了非常巨大的提公升和進展。
既然是入門心法,其實並不會涉及很多技術的具體細節,吳軍老師在這本書裡講的正是他對這搜尋對這個行業理解的乙個精華濃縮。也就是說,這本書不是讓我們學習某個技術的,而是讓我們用來更好學習技術的。
我個人覺得這本書最好的閱讀方式應該至少閱讀三遍,第一遍在還沒有入門的時候讀,讀完你可能什麼演算法和技術都沒有學到,但是一定會對機器學習、搜尋、統計、模型這些概念有乙個最基本的認識。
能夠知道,目前行業內的演算法工程師究竟是幹什麼的,面臨和解決的問題大概是哪些,之前最基礎的解決方法是什麼。如果你理解能力強一些,還能大概讀到當你面臨乙個全新的問題的時候應該怎麼做。如果你還能被勾起一些學習的興趣,那就完美了。但是顯然,紙上讀來終覺淺,讀完這一遍之後,你還是你,從技術上看,也許你什麼都沒學到,但你至少可以將它當做是入門指南,順著書上的順序一點一點地深入學習每乙個技術細節。
第二遍是在你學習的過程當中,不論是什麼模型或者是演算法,都會經歷乙個從不明白到明白的過程。在這個過程當中最大的問題其實是很多時候我們並不知道我們理解到什麼地步了,最常見的就是我們以為我們已經明白了,但其實還差一些,所以面試的時候才經常被秒殺。所以在學習的過程中,應該再讀一遍本書,看看吳軍老師是如何站在更高的視角上理解這個問題的。既可以杜絕驕傲自滿,又可以起到指導前進的作用。
最後一遍是在我們學完書中所提到的所有技術細節之後,再回過來溫故知新、查漏補缺。我覺得一定還會有新的收穫。
如果你想要會踏入網際網路,無論你做不做技術,我都建議你抽出一點時間來閱讀本書。如果你真的可以按照我說的方法去讀三遍本書的話,我覺得你一定會獲得遠超想象的回報。這本書的可讀性很強,如果覺得有讀不懂的地方,可以跳過,章節之間關聯性並不強,跳過部分內容不會影響之後的閱讀。
推薦一本書 《如何閱讀一本書》
讀書是一門藝術 多馬 正是秉持著這一 自由教育 的理念,阿德勒在他最著名的作品 如何閱讀一本書 獲得自由教育的技藝 how to read a book the art of getting a liberal education 進行了最充分的闡釋。我手上的這本商務印書館出版的中譯本 郝明義 朱衣...
推薦一本適合自學Python書
在學習python以前,我一直很想學python,只因擔心多學一門語言又會耗費自己大量的時間和精力,所以一直都踟躕不前。這本書不是經典的教材,而是一本由python初學者撰寫的由一系列python學習筆記整合而成的,不僅包含系統性的知識點,還講述了如何學習和使用python的經驗,內容上更貼切讀者,...
推薦一本書《西方的沒落》
這真是一本好書。文中提到 文化誕生之後,其發展工作大體相同。都是由春而至夏秋,最後到冬季。沒有一種文化能避免其衰老的命運。對此,我想 那麼,一種文化是否有強大的生命力,不僅在於春天的綻放,夏天的繁茂,也在於秋天的收斂,冬天的閉藏。在寒冬裡能否將生機完全斂藏以待春天來臨,是至關緊要的問題。若不能,則生...