我在做資料分析的時候,經常提醒自己,要多想一想,為什麼做這個資料分析?不要陷入使用工具的泥潭而不能自拔,不要為了做圖表而做圖表,不要為了寫報告而寫報告。
資料分析的工具只是實現目標的手段,我們可以利用工具去解決實際問題,特別是解決那些對業務有關鍵影響的問題,用資料去讓業務發展得更好。
不要只是把資料做成圖表,就直接提交上去,要站在業務的角度去思考,如何才讓業務發展得更好,用客觀的、合乎邏輯的方式說明:
(1)客觀情況是什麼?what
(2)為什麼會是這樣?why
(3)將來應該怎麼做?how
1. 解決問題,你需要「流程」
首先,有了流程,才能避免見到資料就立即動手,卻總是在原地打轉的情況。
解決問題的流程,從「明確目標」開始,然後找到「原因」,知道下一步需要採取哪些行動。
比如說,為了提高發貨效率,可以整理從「接到訂單」、到「確認庫存」、再到「聯絡顧客」和「提示發貨」、最後到「發貨」的流程圖,分析每乙個階段的效率情況。
再比如說,為了防止利潤繼續減少,可以用**「杜邦分析法」,針對關鍵指標進行假設分析。為了防止銷售業績繼續下滑,可以用「4 p 營銷理論」**的框架,從產品、渠道、**、**的角度提出假設,找到問題的關鍵點。
對領導布置的任務,不要就事論事地只看任務本身,要留意「任務背後的訴求」,試著從高出自己一兩個級別的水平進行思考,避免自己的視野過於狹窄,培養自己擴充套件思路的能力。
對於只看資料分析報告的老闆來說,他們看重的不是資料分析的方法和工具,而是結論。老闆不是要看資料分析師的「炫技」,而是要看資料分析師提出的建議能否解決實際的問題。
2. 分解資料,找到「問題的關鍵」
在明確目標並大致把握現狀之後,開始進入提出假設、確定問題關鍵的階段。
那麼,具體應該如何找到「問題的關鍵」呢?
比如說,銷售額可以分解為銷售數量與平均單價的乘積,銷售數量可以分解為新客戶的購買數量和老客戶的購買數量,對於老客戶,再次選擇「回頭客」比例作為「客戶忠誠度」,從產品、使用者年齡、職業、性別、時間等維度進行對比分析,最終找到影響問題的關鍵。這裡再舉乙個例子,林驥以前用 excel做過乙個動態杜邦分析模型,其中體現盈利能力的指標:銷售淨利率 = 淨利潤 / 銷售收入,淨利潤= 銷售收入 - 全部成本 + 其他利潤 - 所得稅,這樣把關鍵指標一層一層地進行分解,結合對比思維,如果某個資料的變化比較異常,那麼就可以進一步深入地進行分析,從而找到關鍵的影響因素。
(說明:圖中資料都是虛擬的)
3. 採用交叉視點,鎖定「原因」
在實際工作中,很多情況是,雖然通過細緻入微地分析,我們知道了現狀,但是,到了鎖定原因的階段,卻又用主觀的見解,來代替客觀的事實。
能否用資料說話,會導致後面的工作方法截然不同。
在解決實際問題的過程中,知道「是什麼」固然重要,但更重要的是,還要知道「為什麼」和「怎麼辦」。很多資料分析工作,一直停留在「是什麼」這個階段,是因為思維被限制在單個維度的範圍之內。
為了開啟資料分析的思路,我們可以運用「相關思維」,找到對最終目標具有關鍵影響的原因。
比如說,針對「銷售額」這個目標,找出「顧客滿意度」、「降價」、「產品質量」等可能影響的因素,分析這些因素與目標的相關程度,從而得知對銷售額產生劇烈影響的原因。需要主要的是,相關關係並不等於因果關係。
4. 制定對策,要依據「方程式」
了解相關程度的大小,對鎖定原因非常有效,但是只靠相關分析,卻無法知道這個原因對目標產生的影響有多大。
領導可能會問:那麼具體要採取哪些措施,要做到何種程度呢?
相關分析歸根到底還只是知道「為什麼」,而並不知道「怎麼做」。
通過回歸分析,可以將 2 個資料之間的相關關係,表現為具體的公式。
比如說,為了提高某設施的使用率,假設使用人數與使用滿意度之間存在相關關係,下一年度使用人數的目標為 2000 人,根據歷史資料進行回歸分析,可以得出下面的回歸方程序:2000 = 23.68 * 使用滿意度 + 174.7
從而計算出,使用滿意度 = (2000-174.7)/23.68 = 77 分,我們在散點圖中也能看出這個結果。
如果只是提出**「提高使用滿意度」的口號,我們還是無法採取具體的行動。於是,接下來要關注與使用滿意度高度相關的「使用方便程度」**,它是提高使用滿意度的更進一步原因。
類似地,對**「使用滿意度」與「使用方便程度」**進行回歸分析,再用回歸方程序反向計算出,想要使用滿意度達到 77 分,就要讓使用方便程度的分數達到約 66 分,從而比較明確地回答了上面「要做到何種程度」的問題。
5. 用資料講故事
有些人做的資料分析報告,會密密麻麻地寫滿詳細的文字或圖表,讓人抓不到重點,看不到關鍵的結論和建議,不知道到底想要說明什麼。這種「面面俱到」的做法,還是放棄為好。
我們在用資料講故事的時候,應該把主要的時間和精力,用來思考核心資訊是什麼?看報告的人想要知道什麼?
小結:面對資料,很多人不知道怎麼分析,花費大量時間和精力,製作出漂亮的圖表,卻並不能解決任何實際問題,也經不起推敲和質疑。
《如何用資料解決實際問題》這本資料分析的基礎入門書,主要是使用 excel 作為資料分析的工具,去解決業務實際中可能遇到的問題,全書沒有高深的理論和原理,也沒有複雜的工具和演算法,都是從實際工作中得來的經驗、技巧和方法。
根據不同的階段和水平,資料分析師所需的能力可以分為 4 種:
(1)解讀資料:掌握觀察資料的「視點」,這是駕馭資料的基礎。
(3)綜合技能:將各種方法或思維方式有機結合起來,形成具有整體一貫性的解決問題的故事。
(4)高階分析技能和 it 系統:掌握運用專業的高難度方法和高難度技術進行分析的能力。對於大多數人來講,具備(1)~(3)的技能就足夠了,而這本書主要就是在介紹基本的資料分析方法。
最後,如果你想進一步提高技能,建議你在大量實踐中積累經驗,面對每個工作任務的時候,都認真地加以思考和總結。
以上,希望能夠對你有所啟發。
mysql實際工作中的應用
記錄一下實際應用中mysql方面需要注意的地方 4 mysql大於等於 小於等於的寫法 5 按照漢字的拼音排序,用的比較多是在人名的排序中,按照姓氏的拼音字母,從a到z排序 如果儲存姓名的字段採用的是gbk字符集,那就好辦了,因為gbk內碼編碼時本身就採用了拼音排序的方法 常用一級漢字3755個採用...
Python字典在實際工作中的應用
在工作中遇到要為現有的資料庫表a新增大量資料,該資料與a表中某類資料相同,但是id不同,並且同時增加關聯該錶的其他 b c表 解決思路 通過python字典型別變數,轉換關聯表中原資料的id為對應新增資料的id。最後,通過下面程式生成對應新增的id,儲存到檔案中,然後上傳資料到資料庫。usr bin...
samba服務9 實際工作中的許可權控制
之前說過的samba配置檔案以及基本使用,如果只是簡單的實驗環境或者說幾個人使用,一步一步來沒什麼問題,但在實際的工作環境中,使用者眾多,目錄眾多,許可權交叉,會非常的複雜。比如說這樣 乙個共享目錄dir share,同乙個部門不同層級下的人對這個目錄的許可權是不一樣的,有些人能進入而且能看 rx ...