資料科學與R語言 關於我 Rer

2021-09-06 07:18:15 字數 1353 閱讀 2406

資料科學與r語言: 關於我

錢鍾書曾說,雞蛋好吃不一定要去認識下蛋的母雞。不過人類是社會化的動物,訪客和博主都希望有多一些的交流。在2023年元旦之即,寫下這篇短文算是我的簡介吧。

最早接觸的計算機還是一台386,那時作為geek的成就感來自於迅速的打下一連串dos命令,而windows出現後這種擊打的快感便消失了。所以當再接觸到r語言時,這種命令列的工作方式讓人非常親切。

上大學時很想選擇計算機專業,但未能如願。之後碩士階段學習經濟學,離原來的想法越來越遠。好在有遇到計量經濟學,金融學中也包括了很多統計學知識。所以在那時接觸了好些數學工具和資料分析軟體,包括matlab、mathematica、maple、spss、stata、minitab、eviews。接觸r語言則是在搗鼓linux的時候,想尋找該系統下的統計學工具,就這樣知道了r這個名字。

之後墜入貪欲的陷阱,花了很多時間想建立機械交易系統在市場中火中取栗,後來才意識到這只不過是永動機的翻版。不過這段程式設計的經歷仍有一定的價值。

對我而言,最有意義的時光是教書的那幾年。因為教一門課才能使你真正的理解它,講授統計學、計量經濟學、投資學、金融工程學使我在數學方法和資料分析方面打下了堅實的基礎。另外講課也很有成就感,在課堂上用簡單的excel就能做回歸分析、計算投資組合、期權定價、演示隨機漫步,這些小把戲總能得到學生的驚嘆。後悔的一點是當時沒有用r來而是用minitab來講授的統計學。

在中國,知識的**總是被低估,離開了學校後呆在乙個研究所裡面,研究所很無趣但所幸空閒尚多。對於時間上的安排,我總記得劉慈欣作品中的一句話,找乙個愛好沉下去,這輩子就很容易度過了。就這樣我建立了這個部落格來實踐這句話,此部落格的主題是資料科學與r語言的結合應用。我希望它作為乙個記錄、積累、交流和宣傳的平台,將邏輯、統計思維、資料和計算機工具融為一爐,使我們對身邊的資料形成更為深刻的理解,使更多的人能夠應用資料分析,撥開事物表面的迷霧而獲得真知。也許其中的內容不值識者一哂,just for fun。

古希臘人說過:閒暇產生智慧型。雖然並非數學或計算機專業出身,但日積月累下來,倒也有所收穫,興趣日漸濃厚。我很喜歡愛因斯坦的話,「我自己只求滿足於生命永恆的奧秘,滿足於覺察現存世界的神奇結構,窺見它的一鱗半爪,並且以誠摯的努力去領悟在自然界中顯示出來的那個理性的一部分,倘若真能如此,即使只領悟其極小的一部分,我也就心滿意足了。」

總結:乙個未留洋、未讀博

、非名校、

非名企、

沒經驗、

沒背景、不專業

、不年輕的人,保持著好奇心和閱讀的習慣,在探索這個世界。

my twitter and weibo: @xccds

my email: [email protected]

《資料科學 R語言實現》 1 2 建立R函式

r語言是函式的集合 使用者可以在專案中使用各個程式包中的內建函式,或者為專門的目的定義新的函式。在本教程中,我們會展示如何建立乙個r函式。執行下列步驟來建立你的第乙個r函式。1.在r控制台中鍵入下列 建立第乙個函式 2.使用下列命令,執行使用者定義的函式addnum 或者,你也可以不使用return...

《資料科學 R語言實現》 3 7 捨棄資料

在之前的教程中,我們介紹了如何修改和過濾資料集。這些步驟基本上涵蓋了資料預處理和資料準備的主要過程。但是,我們還想找出資料集中的壞資料。那些壞資料或者不想要的資料應該丟棄,避免生成誤導的結果。這裡,我們會介紹一些移除無用資料的實用方法。按照3.3節 轉換資料型別 教程,把匯入資料的每個屬性轉換成合適...

《資料科學 R語言實現》 3 8 合併資料

資料合併讓我們理解不同資料來源是如何相互關聯的。r中的merge操作與資料庫中的join操作類似,它使用兩個資料集中相同的值來連線兩個資料集。按照3.3節 轉換資料型別 教程,把匯入資料的每個屬性轉換成合適的資料型別。同時按照3.2節 重新命名資料變數 中的步驟,命名employees和salari...