讀書筆記 《深入淺出資料分析》讀書筆記

2021-10-02 20:17:02 字數 4022 閱讀 1786

這本書呢它在每一章都安排了乙個企業問題,以解決乙個問題的形式去穿插知識點以及分析思路,可以快速掃讀了解一下分析思路還有思考一下課後問題。之前看見有些人推薦這本書,我才去看的,但是我並不推薦這本書,書裡的內容過於簡單,而且裡面的工具操作都落後了。

確定問題:

分解問題:將問題分解為更小的組塊

基準假設

評估:評估分解組塊,關鍵是:比較

針對問題觀察資料,做出明確假設,分析問題;用資料視覺化說明問題;看心智模型和資料真實情況是否吻合,重新評估;

決策:向客戶提出建議

將分析形成報表製成決策;

2023年2月13日 

「快辦法是做一切增進大腦活動 的事,尤其是不同型別 的大腦活動。」

2023年2月13日 

「慢慢讀。理解的內容越多,要記憶的內容越少。 」

2023年2月13日 

「忌死讀 。停一停,想一想,碰到書中的提問時,別直接翻看答案;想象真的有人在問你這個問題。強迫自己的大腦想得越深,學會、記住的概率就越大。」

2023年2月13日 

「我們安排了練習和筆記,但是,要是我們替你完成,就像讓別人替你鍛鍊身體一樣;只動眼不動手也不可取,要動動筆 。大量證據證明,學習時的身體動作能提高學習效率。

2023年2月13日 

「試著向別人大聲解釋這些知識。你會學得更快,可能還會發現一些閱讀時不曾發現的名堂。」

2023年2月13日 

「大腦需要知道事情是否重要 。讓自己融入各種場景,為**設想旁註,就連抱怨乙個並不好笑的玩笑,也比什麼感覺都沒有強。」

「資料分析就是仔細推敲證據」

2023年2月13日 

「所有的資料分析師最終都會被打造成能作出更好決策 的人才,你要學的就是在浩如煙海的資料中洞察先機,作出更好決策。」

2023年2月14日 

「客戶將幫助你確定問題」

2023年2月14日 

「動動筆

總體問題是我們需要提高銷量。為了更好地摸清這位首席執行官的真正意圖,你想問這位首席執行官什麼問題呢?寫出5個問題。」

2023年2月14日 

「把問題和資料分解為更小的組塊」

「將大問題劃分為小問題,你需要將問題劃分為可管理、可解決 的組塊。你面對的問題常常含糊不清 ,例如:

你無法直接回答大問題。但是,通過回答從大問題分解 出來的小問題,你就可以找到大問題的答案。」

2023年2月14日 

「你對外界的假設和你確信的觀點就是你的心智模型」

「心智模型有時助益良多,有時帶來麻煩。本書就是你妥善利用心智模型的速成班。重中之重是明確心智模型,並且像對待資料一樣嚴肅認真地對待心智模型。」

2023年2月14日 

「務必盡量明確你的心智模型。統計模型取決於心智模型」

2023年2月25日 

「世上沒有傻問題

問: 如果為了解決問題而需要獲得更詳細的資訊,我該做到什麼程度呢?是不是要親自去採訪客戶?

答: 對新資料的挖掘深度最終取決於你自己的最佳判斷,在這個例子中,你不斷摸索,終於找到了新的市場領域,這個發現足以讓你制定有說服力的銷售策略。我們將在後續章節中進一步討論何時該停止蒐集資料。

問: 看來,起初的錯誤心智模型是第一次分析失敗的罪魁禍首。

答: 是啊,最初的錯誤假設注定了分析會得出錯誤的答案,因此,從一開始就務必要基於正確的假設建立模型顯得如此重要,並且,要做好準備,一旦所得到的資料有違你的假設,就要立即回頭重新詳加思考。

問: 分析會有大結局嗎?我所追求的是定論。

答: 資料分析肯定會得出重大問題的答案,但絕不會料事如神,即使你今天無所不知,明天又[…]」

「動動筆

為了讓你的最優化模型重新產生效果,需要加入哪些假設條件?

動動筆解答

有沒有一種假設可以幫助你優化模型?

模型中沒有任何因素表明人們真正會購買此產品 。這個模型描述了時間、橡膠量、利潤,但得有人購買產品,模型才會生效。然而正如我們所見,實際情況並不是這樣,所以,我們需要增加乙個體現人們會買什麼產品的假設。」

2023年2月25日 

「世上沒有傻問題

問: 萬一不靠譜的假設成真,也就是人們什麼都樂意買,結果會怎麼樣呢?最優化方法會有效嗎?

答: 可能會。如果你可以假設 所生產的每一件產品都將賣掉,那麼,利潤最大化工作將主要圍繞調整產品組合展開。

答: 這是乙個很好的想法,但要記住你有約束條件。浴盆寶的聯絡人告訴過你,能夠生產的橡皮鴨和橡皮魚的數量既受時間的限制,也受橡皮**量的限制,這些都是你的約束條件。

問: 最優化聽起來很狹義。只有在你有乙個想實現最大化的數值,而且有一些稱手的等式[…]」

2023年2月25日 

「現實世界中的各種原因呈網路關係,而非線性關係」

2023年2月25日 

「世上沒有傻問題

問: 看來證偽法是一種分析形式很複雜的方法,真的有必要用這種方法嗎?

答: 這是一種了不起的辦法,可以克服人們專注於錯誤答案而無視於其他答案的天然傾向。通過強迫自己以完全正規的方式思考問題,會減少因忽視重要的特徵情況而犯錯誤的可能性。

問: 這類證偽法與統計學上的假設檢驗有何關係?

答: 你在統計課上(或在《深入淺出統計學》中)可能已經學過一種對候選假設(備擇假設)和基準假設(原假設)進行比較的方法,其目的是識別出一種情況:如果這種情況為真,則原假設幾乎不可能成立。

問: 那我們為什麼不用那種方法呢?

答: 這種方法有乙個優點,能讓你把品質各異的異質資料綜合起來,這是非常普通的證偽法,對於複雜的問題非常有用。但是[…]」

2023年2月25日 

「診斷性 是證據所具有的一種功能,能夠幫助你評估所考慮的假設的相對似然。如果證據具有診斷性,就能幫助你對假設排序。」

動動筆解答

最好選一種能夠把新資訊整合到你的主觀概率結構中的分析工具。你為什麼選擇該工具?

實驗設計?

設計一種可以得到更準確資料的實驗有點難,因為所有的分析師都在評估地緣事件,看起來他們所分析的每一條資料都是觀察資料。

最優化?

沒有可靠的數字資料!我們學過的最優化工具都是假設你手頭有數字資料和想要最大化和最小化的數字結果,而這裡沒有任何最優化資訊。

美觀的圖形?

美觀的資料圖形總是能派上用場。一旦我們修訂好主觀概率,肯定想畫一張新圖形;但眼前,我們需要的是能提供更可靠資料的工具。

假設檢驗?

2023年2月25日 

「啟發法  1. (心理學定義)用一種更便於理解的屬性代替一種難解的、令人困惑的屬性 。2. (電腦科學定義)一種解決問題的方法,可能會得出正確答案,但不保證得出最優化答案 。」

2023年2月25日 

「世上沒有 傻問題

答: 正如對待一切統計和資料分析問題一樣,想一想回歸是否有意義 。任何統計工具都不會無往不利,但只要嫻熟地使用這些工具,你就會知道它們能讓你在多大程度上接近平均值。調動你的一切判斷能力回答這個問題:「這個相關係數夠高嗎?足以證實我通過回歸線得出的結論嗎?」

問: 我怎樣才能斷定資料為線性分布?

答: 你該知道,有一些特別的統計工具可以用來定量分析散點圖的線性,但通常目測也是安全的。

問: 如果我展示出兩[…]」

2023年2月25日 

「世上沒有傻問題

問: 我怎麼知道人們為明天提出的目標會不會和今天已經得到的結果相似?

答: 這是回歸分析的乙個大問題。不僅要問「明天與今天會有幾分相似?」,而且要問「要是明天變個樣,我的業務會怎麼樣?」,答案是——你無法知道明天是否會像今天一樣。變化難免 會發生,有時還會天差地別。發生變化的可能性大小及其意義取決於問題型別。

問: 為什麼會這樣?

答: 喔,對比一下醫療資料和消費者偏好吧。人體明天突然改變生存方式的可能性有多大?可能性不是沒有,尤其是環境發生突變,但可能性不大;消費者偏好明天發生改變的可能性有多大?你可以打賭,消費者偏好會改變,大大改變。

問: 那為什麼還要勞神作**呢?

答: 舉個例子,在網路世界裡,優秀的回歸分析能在一段時間裡產生巨大利潤,哪怕明天就失去[…]」

筆記摘自: 麥可·公尺爾頓(michael milton). 「深入淺出資料分析。」 ibooks.

深入淺出資料分析 讀書筆記

本書是說明類的型別,主要內容是告訴我們該如何做資料分析。主要從一下幾個方面進行闡述 確定問題 分解問題 將乙個大問題分解為幾個小問題 評估 對每個問題使用資料評估 決策 迴圈執行這四個過程 驗證理論需要進行實驗對比,檢驗理論 要注意對照組的設定 列出各種可能。利用證據排所有的不可能的假設。證偽法。排...

《深入淺出資料分析》讀書筆記

最近看了head first系列,重讀了 深入淺出資料分析 發現這是一本很好的書,在思維上開闊的不錯,通過案例培養資料思維,把思路講的很清楚,現總結筆記如下 一 資料分析引言 分解資料 1 確定 分解 評估 決策 重在如何將乙個大問題分解成若干易行的小問題,將手頭的資料彙總為有用的格式。2 心智模型...

《深入淺出資料分析》讀書筆記

寒假看了一本資料分析的啟蒙書籍叫 深入淺出資料分析 這本書插圖很多,主要是通過舉實際例子來介紹資料分析的各種方法,非常通俗易懂。下面分享當時的讀書筆記 內容不多,覺得重要的才記下來 第一章 資料分析引言 分解資料 1 資料分析的固定基本流程 確定 分解 評估 決策 確定 第一步是了解問題 從你的客戶...