這個題目在素材庫中已經放了很久了,久久不敢動筆去寫。每次打好腹稿,列好提綱,卻不知該不該寫。之所以猶豫,原因是知道這個話題未來肯定會火。所以現在寫起來,需要謹慎,免得貽笑後人。
像經濟學家那樣思考,是常常被人提起的。究其原因,是因為經濟學在社會科學領域有一統天下的趨勢,其研究正規化被社會學,心理學,甚至歷史性借鑑,經濟學的思維方式,也可用到日常生活中,從而使得人們想變得想經濟學家那樣思考問題。類似的,資料科學這幾年也是火的不能再火了,過不了幾年,每家公司都會考慮增設cheif ai office,那麼如何像個資料科學家那樣思考,也會成為熱門話題的。
不願意寫這個題目的第二個原因,是在於這個題木下可以寫的思維方式真的很多,如果無法分清楚主次,那麼會變成名詞的羅列。然而「少則得,多則惑」,少年時看倚天**的第一章,寫小郭襄炫技式的展示十種不同的武功,但每一種都沒有精通,只覺得過癮。如今看來,金庸在用暗筆預示著未來峨嵋武功終究不及武當少林。思考方式不過是方**,不追求掌握的多,但追求收發自如。因此我也釋懷了,這裡的總結也不必追求全面了。本文中任何的一種思維方式,雖然只是一招一式,不成體系,但任何一招用好,都可以提公升自己的思維的敏銳性。
所以這篇文章我更希望是乙個拋磚引玉的起點,吸引更多的人來思考該如何讓資料科學的思維方式民主化,希望能開啟相關的討論。
下面開始正文。先放幾張圖,讓各位猜猜每張圖所代表的思維方法,算熱身。
第乙個圖對應的是抽象。相比於組合語言,c算是一種抽象;相比於c,python則更是一種抽象。每一種抽象,都提供了一種更快更易上手的高階工具。掌握抽象思維,意味著你能直接就站在巨人的肩膀上,直接站在前人的基礎上進行自己的創造。學會使用新出現的高階工具,還意味著你能趕上時代進步帶來的紅利,不必思考已經被科技進步的紅利已解決的問題。
抽象的思維方式,意味著你能擺脫細節,整合不同維度和場景的觀察。然而資料思維不等於統計,還需要找出規律,給出解釋。對資料的解讀,需要你具有要提到的第二種思維方式,即取捨。
有明處就有暗處,有得就有失。而資料能讓我們更清楚的看到這些暗處的得失,正是因為這些得失,我們才需要資料,這個不會被我們的情感和主觀好噁影響的參謀來幫我們做決策。然而只有意識到任何資料在解讀時都會包含取捨,我們才能更全面的解讀資料。也只有記住在面臨不同質事物的抉擇時記得需要搬出資料,才能避免只看到明處的當下的得,而沒有看到未來的失。而在需要說服別人去做出取捨時,也需用視覺化的資料來量化損益。
第三幅圖說的是隨機。資料思維不試圖追根究底問出具體的因果,而是承認隨機的力量,然後試圖通過重新類似的現象來**未來。蒙特卡羅就是這樣一種計算方式,而有一類演算法,則是基於隨機數的。隨機性的思維意味著接受不確定性,這方面有很多文章可以參考。例如 隨機生存的智慧型無常世界的生存聖經 (上)無常世界的生存聖經 (下)。
拋磚引玉 ERP
看了這個故事,估計你對erp enterprise resourses planning 企業資源計畫 有個大致的了解。妻子 當然可以,來幾個人,幾點來,想吃什麼菜?丈夫 6個人,我們7點左右回來,準備些酒 烤鴨 番茄炒蛋 冷盤 蛋花湯 你看可以嗎?商務溝通 妻子 沒問題,我會準備好的。訂單確認 妻...
接 拋磚引玉
接上次,考慮到轉datatable實際效能問題,我把本地linq複雜物件不轉成datatable,僅去掉中間的複雜物件.這樣list就可以在webservice中傳遞了.同樣拋磚引玉 1public static list tentity togenerallist tentity this ili...
拋磚引玉,說平台概念
今天看到史玉柱在說推遊戲創業平台,由此相到目前眾多的有實力的公司,都在用這樣的手法謀劃未來 大家都在講平台,阿里的saas,google在謀劃它的網路平台,它的眾多的基礎服務,gae及g2馬上推出還有和學習iphone的開發者分成模式,google有google的戰略 中移動,成立卓望互網,謀化sn...