對於乙個理應奇缺人才的領域,資料科學似乎在快速造就大批新專家。不久前,1600人出席了華盛頓大學(university of washington)機器學習教授卡洛斯 格斯特林(carlos guestrin)執掌的公司turi在舊金山主辦的一次資料科學峰會,表明資料科學引起的興趣是多麼的濃厚。
格斯特林提出,所有軟體應用在5年內都將需要內建的智慧型,使資料科學家——經過培訓,能夠對海量資料進行分析的人員——成為這一新興「認知」技術經濟中的關鍵工作者。
無論這種關於資料科學即將無處不在的**正確與否,目前已有一些核心的關鍵應用依賴機器學習,最主要的是推薦程式、欺詐探測系統、預報工具和旨在**顧客行為的應用。
把直到不久以前還專屬於研究科學家的技術納入生產級的業務應用程式,可能指向企業競爭力的一種深刻變化。在turi活動上炫耀資料科學和機器學習技能的公司——包括優步(uber)、pinterest和quora——都創立於數字時代。
拖累許多傳統公司的乙個因素,將是開展真正的機器學習運作的高成本。
許多創立時具有數字基因的公司——尤其是那些擁有海量實時客戶互動資料可以挖掘的網際網路公司——對資料科學的投入是不遺餘力的。例如,pinterest的首席科學家尤雷 萊斯科韋茨(jure leskovec)表示,該公司維護著逾100種可以應用到不同型別問題中去的機器學習模型,不斷處理熱切希望利用這些資源解決業務問題的經理們的請求。
人才是許多非科技公司的另乙個問題。儘管資料科學家正大量湧現出來,但有些技能十分短缺,尤其是在深度學習方面——這是最高形式的機器學習。戈德布盧姆說,在使用kaggle的自由職業電腦科學專家中,僅有大約1000人擁有深度學習技能,而可以運用其他機器學習方法的有10萬人。
他接著說,大公司經常不願調整自己的工資等級去聘用該領域的頂級人才,即便某個高薪專家開發的演算法可能對公司業務起到超出比例的效果。
然而,適應即將到來的「智慧型」應用時代的最大障礙,可能是文化上的。有些公司,比如通用電氣(ge),一直在矽谷打造自己的研發團隊,以吸引和開發他們將需要的數字技能。但是,他們將不得不把新的資料科學家和機器學習專家安排到運營部門中去,讓他們更接近部門經理,才能收穫全部好處。
科學與業務實踐之間的這種結合是至關重要的。不言而喻的是,從現在開始,所有的經理都將需要在資料引導下做出決策。但那需要思維模式的徹底改變,說來容易做來難。
戈德布盧姆說,這一挑戰已變得更為艱鉅,因為經理們被要求圍繞新的「智慧型應用」重新設計自己的工作流程,在一定程度上使他們自己失去存在的必要性。
儘管存在種種障礙,有些公司或許能處理好這一艱難的轉型。但是,那些在創立之時就把資料科學和機器學習作為業務核心的公司,很可能構成強大競爭。
***********************************=分割線******************************==
關注科學家
關注科學家是如何做到工作,家庭兩不誤的 關注錢學森 王選 摘自 王選主要著述 軟體設計方法 1992年4月清華大學出版社出版 王選文集 1997年2月北京大學出版社出版 王選談資訊產業 1999年3月北京大學出版社出版 錢老 錢學森 的書 摘自 工程控制論 物理力學講義 星際航行概論 論系統工程 關...
資料科學家Docker入門指南
摘要 docker容器那麼強大?可以應用道資料科學領域?看來學習一下!docker容器是通過虛擬化開發和部署應用程式的一種越來越流行的方式,它對資料科學家有用嗎?當然,本指南就會向你介紹它的作用,並手把手教你快速入門。docker是一種越來越流行的,使在容器中開發 部署和執行應用程式變得更容易的工具...
資料科學家面試如何準備?
編輯 april emma 專欄 九章演算法 資料科學家 data scientist 被 財富 雜誌譽為21世紀最 的職業。據調查顯示,僅僅在美國市場,2018年大資料和高階分析相關人才的缺口就將高達19萬。然而雖然現在很多人對這份職業躍躍欲試,但是卻對這份新興職業並不了解,更不知道應該如何準備面...