粗略掃了一眼這個問題下的答案,發現大部分朋友要麼是從工作中意識到資料分析的重要性,從而轉到資料分析上來的,要麼是統計學專業的學生,很自然的從小規模的統計過渡到大規模的分析上來的。作為乙個基本靠自學拿到data mining phd position的學生,我想從計算機專業的角度來和大家分享一下我的經歷,希望能給其他計算機專業想要從事data mining相關工作的朋友們一些參考。
- 怎麼決定學資料分析的?
程式語言就是工具。計算機從業者只不過是把這個工具用在不同的場景和業務下面,於是有了web開發、移動端開發等等各個分支的程式設計師。資料分析也沒有什麼特別的,對於計算機出身的朋友來說,就是用程式設計來解決資料帶來的問題。其實走上這條路是很理所應當的。如果還要多說兩句原因的話,大概是覺得資料分析能夠挖掘出新的資訊和insight,是一件很有趣的事情。
- 如何學習的?
我覺得說自己的經歷有點太具體了,就說說自己見到的和體會到的,計算機出身的同學應該如何來學習資料分析:
1. 入門打基礎。
基礎就是程式設計。從計算機專業進入data mining這個領域和別的途徑有所不同,首先你的切入點很大程度上是工程向的。data mining這個領域,一小部分人在提供high level的idea,大部分人在實現和優化這些想法。作為乙個fresh data miner,是很難給出high level intuition的,因此包括我個人在內,都是先從實現和優化開始做起的:針對乙個具體問題,用已有的方法和手段,使其能夠發揮應有的作用,以及進一步地在工程上改進這些方法。這就需要你的程式設計功底非常好。很多人覺得data mining的理論知識非常重要,這是沒錯,但是也不要忽視良好的程式設計能力給你帶來的強大競爭力。有時候能夠乾淨整潔高效地實現一些現有的方法,就已經超過很多自稱是data scientist但是從來沒有真正在資料的泥潭裡掙扎過的紙老虎了。這個階段,多去打基礎,看別人的工作,實現別人的方法,優化別人的模型。強烈建議不要去拍腦袋想一些稀奇古怪的idea來實現,相信我,即使你覺得想到的idea很天才,多半也是不work或者早就有人想到了比你好得多的方法(我自己的臉都被打腫了)。對於不是計算機專業的朋友,我也向你們強烈建議,學好程式設計,學寫好看好用的code。知乎上很多人覺得自己會寫兩句python,會寫幾隻爬蟲就感覺良好的人不在少數,希望大家多多self-motivate一下。
2. 高階提公升。
高階就是machine learning。現在的資料越來越大越來越複雜,基本的統計分析已經不能滿足現在人民群眾日益增長的文化需求了。乙個典型的例子就是personalization。隨便翻一翻乙個data mining頂會的*****,基本上都是machine learning的模型。這個階段的要求就是,你要對所有常用的machine learning 模型熟到不能再熟了,隨便問你乙個模型的推導都要能夠信手拈來,給你乙個應用場景你要馬上反應到改用什麼模型什麼優化方法。很遺憾,我自己也做不到這個程度,不過和很多業界的大牛接觸過之後,我也深刻地體會到了這些人的功底之深厚。無他,唯手熟爾。能在machine learning方面做到非常熟練,你就已經是各大公司搶著要的人才了。而且大多數網際網路公司正經的資料崗位面試(某度用資料分析的title找一些做推廣的就不算了)都集中在這個層面。能做好這個方面,下半輩子財務自由還是很輕鬆的。
3. 創新。
最後多扯一點無關的,我自己從本科慢慢摸索到phd階段,已經推翻了自己太多次。每次都覺得自己的能力已經足夠勝任data mining的工作,直到現在已經不再去想這個問題。不管你是轉行過來的還是科班出身的,要時刻告訴自己,還有更大的世界更厲害的人你沒有發現,不要為自己的一點成就而沾沾自喜。希望能夠永遠求知若渴、虛心若愚。
資料分析入門 如何訓練資料分析思維?
發布。我們在生活中,會經常聽說兩種推理模式,一種是歸納 一種是演繹,這兩種思維模式能夠幫助資料分析師完成原始的業務邏輯積累,在此基礎上快速定位業務問題,提公升分析效率,但是對於剛入門的資料分析師,在專案經驗不足的前提下,如何快速完成專案的分析報告?這裡引進一種外展推理的思維模式,方便入門分析師的完成...
資料分析師 000 如何學習資料分析
2.2 技能點 2.3 商業知識 3 資料敏感 4 up的面經 手動反爬 如何學習資料分析 from 蠟蠟joanna 資料分析作為一種工具 只是一種工具 可以和很多其他能力結合,比如 da 產品 da 運營。只要行業中有足夠多的資料 前提 就能從資料中發現問題,並支援決策。2個主要的發展路線 up...
資料分析 資料探勘 如何成為資料分析師
最基本的資料分析 收集 和運用最常用的工具 熟練 然後 對付絕大部分的工作 要會在資料庫裡增刪訪問資料,大型資料分析必備技能 效率大大的提高 sudo service mysql start mysql u root主要的語法和邏輯 類似 create use create table insert...