資料科學家面臨的八大挑戰

2021-08-27 18:00:24 字數 1592 閱讀 8834

資料是乙個利潤豐厚的領域,而且對具有相關技能的人有大量需求。然而,任何職業都面臨著挑戰,資料科學也不例外。從資料科學領域和管理資料科學的人的角度**資料科學的真正挑戰。

需要專家而不是全才。最好的資料科學家不會試圖去做所有的事情。相反,他們將專業專注的範圍縮小到特定領域。「鼓勵新的專業人士認識到,資料科學有點像醫學,這是乙個寬泛而模糊的措辭,概括了同一事物迥然不同的做法。」optimove公司首席技術官塔爾·基達(tal kedar)表示,「資料科學家可以通過不同的平台和工具擁有各不相同的工程技能。」也就是說,當你初次學會如何成為一名資料科學家的時候,首先要掌握基礎知識,然後就可以對你感興趣的平台、工具以及領域進行更深入的研究。

業務情況了解的程度決定了你的選擇。作為一名資料科學家,不僅需要注重「如何做」,還要了解這麼做的「原因」;不僅要找出隨機資料的連線點,並且還要利用對各種業務情況的認知來建立可通過資料進行驗證或反駁的「心智模型」。snowflake公司資料分析總監斯科特·胡佛(scott hoover)表示,「在接觸任何資料之前為自己的目標建立心智模型是非常有價值的。與其漫無目的地搜尋資料中的訊號,不如像科學家一樣通過假設來進行思考,並以人類行為、經濟學、體系等為基礎構建形式化模型,然後對這些假設進行測試,讓資料科學應用更加有成效。」

具有跨領域的專業知識。從另乙個職業轉換過來?這對乙個資料科學家來說是一筆財富。塔爾·基達表示,「最好的資料科學家不僅僅是統計學家或機器學習專家,他們還是在領域或企業中掌握這些技能的權威。」斯科特·胡佛補充道,「資料科學家被認為是技術和非技術團隊之間的粘合劑。因此,除了擁有深厚的技術基礎,他們還必須在他們關注的任何部門或領域擁有專業知識,無論是產品、營銷、銷售還是財務。」

向非技術人員解釋技術概念。對於那些整天圍著技術術語轉的資料科學家來說,這可能是令人沮喪的原因。然而,資料團隊必須能夠有效地與其他部門、管理人員主管和涉眾進行溝通,他們可能不理解您工作的複雜性。然而,資料團隊能夠與其他部門可能不理解工作複雜性的高管及利益相關人員進行有效溝通是必要的。

花費大量時間處理原始資料。shape security公司研究資料科學家martin chen表示,「主要挑戰可能是我們如何使用資料,其中包括如何提取資料、如何清理資料、如何分析資料、如何從資料中獲得見解或構建模型。資料科學家應該在程式語言(包括sql、python和r)方面擁有廣泛的專業知識。」

協作是關鍵。由於多個部門通常在專案上共同工作,所以有必要進行協作、妥協,並設定明確的界限和期望。「在資料科學領域面臨的乙個共同挑戰是,促進部門之間在如何收集和解釋資料方面的合作。」snowflake高階資料分析師安德魯·塞茨(andrew seitz)表示,「**模型和歷史分析只有在團隊關於源資料的有效性達成一致時才能發揮作用。」

IBM 資料科學平台三大特性解決資料科學家協作問題

雖然資料科學是乙個比較火爆的話題,也受到越來越多重視,但是企業內部資料科學現狀卻是 不同資料分析人員使用著包括python r spark在內的多種開源產品,並且版本不一 不同開源技術的使用導致資料資產分散存在,形如散沙 最嚴重的是,當企業內部多位資料分析人員需要協同工作的時候,缺少乙個整合多語言 ...

IBM 資料科學平台三大特性解決資料科學家協作問題

雖然資料科學是乙個比較火爆的話題,也受到越來越多重視,但是企業內部資料科學現狀卻是 不同資料分析人員使用著包括python r spark在內的多種開源產品,並且版本不一 不同開源技術的使用導致資料資產分散存在,形如散沙 最嚴重的是,當企業內部多位資料分析人員需要協同工作的時候,缺少乙個整合多語言 ...

資料科學家的成長之路

背景 平凡之路 凡事預則立,不預則廢。結合國內外的行業現狀,和資料科學領域的培養模式,我把資料科學的學習過程分成以下四個級別 入門 初級 中級 高階。吃瓜群眾就是喜歡分級,哈哈哈 高階之上,我認為還有乙個級別 高階,強調跨學科的綜合能力,以及團隊協作能力。由於我不是科班出身,學得不夠系統,所以現在的...