24個終極資料科學專案 可免費獲取資源

2021-08-20 21:45:48 字數 741 閱讀 7556

資料科學專案為你在這個領域的深入研究提供了乙個基礎。通過實際應用,你不僅可以學習資料科學,也能夠寫在簡歷中提公升你的資歷。在這上邊花費的時間越多,你學到的知識就越多。

本文精選了24個資料科學專案,並囊括了各個領域和各種不同大小的資料集。另外,所有的資料集都是開源、可免費獲取的。

初級——這部分的資料集很容易處理,使用基礎的回歸/分類演算法就可以處理這些資料集。並且,這些資料集有足夠的教程供你學習。

中級——略微有點難度。包含了需要使用有點難度的模式識別技能來處理的大中型資料集。另外,特徵工程在這裡可以發揮作用了。

高階——包括神經網路、深度學習、推薦系統及高維資料等。

初級1.iris data

資料集(花的類別識別)

可能是模式識別領域

學習分類技術最基本

入門級的資料集,適合初學者

。該資料集

裡面包含了150行4列

個資料。

問題:根據已有特徵

**花的類別

。資源:資料集

| 教程

2.loan prediction

資料集(貸款**)

>>>閱讀全文

覆盤資料科學專案的五個問題

實習了九個月以後,最大的感觸就是一味地埋頭做事很簡單,但只有不停地覆盤與思考,才能取得快速的成長。為了覆盤之前做過的資料科學 機器學習專案,列了乙個問題大綱來引導自己的思考,可以作為參考 目標是什麼?需要解決的是什麼問題?該問題處於業務的哪一步?用了什麼方法完成目標?這裡可以進一步拆解成幾步 開發專...

資料科學家應知道的關於資料科學專案的四個關鍵方面

實用資料科學是乙個多維領域。機器學習演算法本質上是整個端對端資料科學驅動專案的一部分。我經常遇到一些年輕的資料科學愛好者,他們在剛開始的時候沒有乙個完整的計畫。在針對實際情況構建資料科學驅動產品的解決方案時,我們需要考慮多種實際情況,所以它不僅限於只考慮資料方面的事情 在資料科學驅動的專案中,一些更...

2023年,這5個資料科學專案能幫你找到工作

找個資料科學的工作不容易,不過我有個好主意能幫你找工作,這就是打造你自己的作品集,利用作品集展示你學到的技能,讓未來的老闆知道你有多大本事。你可以把這5個資料科學專案放到作品集裡,以此說明自己的能力 資料清洗 資料科學家往往要耗費高達80 的時間來清理新專案的資料,這是資料科學團隊最大的痛點。如果能...