資料科學專案為你在這個領域的深入研究提供了乙個基礎。通過實際應用,你不僅可以學習資料科學,也能夠寫在簡歷中提公升你的資歷。在這上邊花費的時間越多,你學到的知識就越多。
本文精選了24個資料科學專案,並囊括了各個領域和各種不同大小的資料集。另外,所有的資料集都是開源、可免費獲取的。
初級——這部分的資料集很容易處理,使用基礎的回歸/分類演算法就可以處理這些資料集。並且,這些資料集有足夠的教程供你學習。
中級——略微有點難度。包含了需要使用有點難度的模式識別技能來處理的大中型資料集。另外,特徵工程在這裡可以發揮作用了。
高階——包括神經網路、深度學習、推薦系統及高維資料等。
初級1.iris data
資料集(花的類別識別)
可能是模式識別領域
學習分類技術最基本
入門級的資料集,適合初學者
。該資料集
裡面包含了150行4列
個資料。
問題:根據已有特徵
**花的類別
。資源:資料集
| 教程
2.loan prediction
資料集(貸款**)
>>>閱讀全文
覆盤資料科學專案的五個問題
實習了九個月以後,最大的感觸就是一味地埋頭做事很簡單,但只有不停地覆盤與思考,才能取得快速的成長。為了覆盤之前做過的資料科學 機器學習專案,列了乙個問題大綱來引導自己的思考,可以作為參考 目標是什麼?需要解決的是什麼問題?該問題處於業務的哪一步?用了什麼方法完成目標?這裡可以進一步拆解成幾步 開發專...
資料科學家應知道的關於資料科學專案的四個關鍵方面
實用資料科學是乙個多維領域。機器學習演算法本質上是整個端對端資料科學驅動專案的一部分。我經常遇到一些年輕的資料科學愛好者,他們在剛開始的時候沒有乙個完整的計畫。在針對實際情況構建資料科學驅動產品的解決方案時,我們需要考慮多種實際情況,所以它不僅限於只考慮資料方面的事情 在資料科學驅動的專案中,一些更...
2023年,這5個資料科學專案能幫你找到工作
找個資料科學的工作不容易,不過我有個好主意能幫你找工作,這就是打造你自己的作品集,利用作品集展示你學到的技能,讓未來的老闆知道你有多大本事。你可以把這5個資料科學專案放到作品集裡,以此說明自己的能力 資料清洗 資料科學家往往要耗費高達80 的時間來清理新專案的資料,這是資料科學團隊最大的痛點。如果能...