像資料科學家一樣思考 12步指南(下)

2021-09-19 19:48:21 字數 3127 閱讀 4554

一旦產品構建完成,你仍然需要做一些事情來使專案更加成功並使你的未來生活更輕鬆。那麼我們如何完成資料科學專案呢?

10-交付

完成階段的第一步是產品交付。為了建立可以交付給客戶的有效產品,首先必須了解客戶的觀點。其次,你需要選擇最佳的方式將專案成果反饋給客戶。最後,你必須選擇要包含在產品中的資訊和結果以及要放棄的內容。在產品建立和交付過程中做出好的選擇可以大大提高專案的成功機會。

溝通媒介可以採取多種形式。在資料科學中,產品最重要的乙個方面是客戶是否積極參與產品並且能夠使用產品來回答多種可能的問題。具體的溝通媒介有很多方式: ·

向客戶提交結

果可能是最

簡單的選項

,其中包括文字、**、

圖表和其他資訊,

這些資訊可以解決你的

專案要回答的部分或全部問題。

·在一些資料科學

專案中,資料集的分析和

結果也可用

專案原始資料範

圍之外的資料,其中可能包括原始資料生成的資料、其他不同**的

類似資料、或由於某種原因尚未分析的其他資料。在

這種情況下,如果你可以為客

戶建立可以

執行分析新資料集並生成

結果的分析工具

對客戶有所幫

助。同時客

戶可以有效地使用此分析工具,並

繼續在將來和各種(但

類似的)資料集中回答他

們的主要

問題,這是最好的情況。 ·

如果你想提供比分析工具更好的

產品,你可能需要構建某種

型別的完整的應用程。如果你正在考

慮提供互動式圖形

應用程式,那麼你必

須設計,構建和部署它。通常,

這些都不是一項小任

務。如果你希望

應用程式具有

許多功能並且具有靈活性,那麼

設計它並構建它將

變得更加困難。

除了決定提供結果的媒介外,你還必須決定它將包含哪些結果。有些結果和內容可能是包含的明顯選擇,但對於其他資訊位,可能不那麼明顯。通常,你希望包含盡可能多的有用資訊和盡可能多的結果,但你希望避免客戶可能誤解或誤用你選擇包含的結果。在許多情況下,這可以是微妙的平衡,並且它在很大程度上取決於具體專案以及客戶和其他人對結果的知識和經驗。

11-進行修訂

產品交付後,我們會在初步反饋後繼續修改產品。一旦客戶開始使用該產品,就有可能出現一系列全新的問題。儘管你付出了最大努力,但你可能沒有預料到客戶使用產品的方式的各個方面。即使產品完成了它應該做的事情,你的客戶和使用者也可能不會做這些事情並且有效地完成這些工作。

通常很難從客戶、使用者或其他任何人那裡獲得建設性的反饋。因此一些資料科學家提供完產品後就會忘記它們,一些資料科學家提供產品後會選擇等待客戶提供反饋。進行產品修訂可能會非常棘手,找到合適的解決方案和實施策略取決於你遇到的問題型別以及你需要更改以解決問題的方法。如果在整個專案過程中,你始終保持對不確定性和許多可能結果的認識,那麼你發現自己現在面臨的結果與你之前預期的結果不同可能就不足為奇了。但是,如果你一直勤奮,問題很小,修復相對容易。

一旦你發現產品出現問題並弄清楚如何修復產品,仍然需要決定是否修復產品。一些人最初的傾向是每個問題都需要解決,這不一定是真的。如果有理由可以說服你不想進行修復問題,那就需要慎重考慮了,因為如果選擇盲目地修**現的每個問題,那一定會花費大量的時間和精力。

12-結束項

資料科學過程的最後一步是將其包裝起來。隨著資料科學專案的結束,似乎所有的工作都已完成,剩下的就是修復任何剩餘的錯誤,然後才能完全停止思考並繼續下乙個。但在完成專案除錯之前,你可以採取一些措施來增加未來成功的機會,無論是擴充套件同乙個專案還是完全不同的專案。

現在有兩種方法可以增加你未來成功的機會。一種方法是確保在將來的任何時候你都可以輕鬆地再次獲取該專案並重做、擴充套件或修改它。通過這樣做,你將增加在後續專案中獲得成功的機會,所以,你需要從現在開始開始挖掘專案材料和**並記下你用什麼做的或者你是怎麼做到的。最實用的方法是通過文件儲存

提高未來專案成功率的第二種方法是盡可能多地從這個專案中學習,並將這些知識帶到每個未來的專案中。通過進行專案分解,你可以從中梳理出有用的知識,這包括審查舊目標、舊計畫、技術選擇、團隊協作等。是否可以應用於未來專案,通過專案回溯在事後進行思考,可以幫助發現有用的知識,使你能夠以不同的方式做事,並在下次更好。

不確定性充斥在我們每個人工作的方方面面,記住過去給你帶來問題的所有不確定因素,可以防止類似的事情再次發生。從資料到分析再到專案目標,幾乎任何事情都可能在短時間內發生變化。了解所有可能性不僅是一項艱鉅的挑戰,而且幾乎是不可能的。良好的資料科學家和偉大的資料科學家之間的區別在於能夠預見可能出現的問題並做好準備。

資料科學仍然具有新領域的光環。它的大多數組成部分:統計學、軟體開發、基於證據的問題解決等等,這些可能是屬於舊領域的知識,但資料科學似乎是這些部分的新組合成新的東西。資料科學的核心並不關心特定的資料庫實現或程式語言,即使這些對於從業者來說是必不可少的,其核心應該是資料內容,給定專案的目標以及用於實現這些目標的資料分析方法之間的相互作用。

本文由阿里云云棲社群組織翻譯。

文章原標題《

how-to-think-like-a-data-scientist-in-12-steps

》james le

譯者:虎說八道 審校:袁虎

文章為簡譯,更為詳細的內容,請檢視原文

第2章 像科學家一樣思考

2.1作為科學家的經濟學家 不僅是經濟學家才需要像科學家一樣思考,我們思考問題的時候,應該像科學家一樣客觀分析思考問題 所有的科學不過是日常思考的結果 以科學家的眼光去觀察社會 2.1.1 科學的方法 觀察 推測 假設 證明 理論 進一步觀察,建立模型 2.1.2 模型 1 迴圈流量圖 這個模型直接...

瑞士科學家研發飛行夾克,使用者可以像鳥一樣任意飛翔

這套飛行夾克由一組柔軟的體外骨骼和一副控制手套組成,它能感知上半身的身體動作,然後與無人機同步發出操作指令。蝙蝠俠 超人 這些電影大家都看過,是不是很羨慕男主在天空任意馳翔?現在,你也可以體驗到那種感覺。近日,瑞士洛桑大學的科學家研發了一套特殊的飛行夾克,當使用者穿上它,戴上vr頭盔後,就可以像鳥一...

拋磚引玉 像資料科學家那樣思考

這個題目在素材庫中已經放了很久了,久久不敢動筆去寫。每次打好腹稿,列好提綱,卻不知該不該寫。之所以猶豫,原因是知道這個話題未來肯定會火。所以現在寫起來,需要謹慎,免得貽笑後人。像經濟學家那樣思考,是常常被人提起的。究其原因,是因為經濟學在社會科學領域有一統天下的趨勢,其研究正規化被社會學,心理學,甚...