《深入淺出資料分析》讀書筆記

2021-08-22 07:27:16 字數 1527 閱讀 7812

最近看了head first系列,重讀了《深入淺出資料分析》,發現這是一本很好的書,在思維上開闊的不錯,通過案例培養資料思維,把思路講的很清楚,現總結筆記如下:

一、資料分析引言:分解資料

1、確定——分解——評估——決策

重在如何將乙個大問題分解成若干易行的小問題,將手頭的資料彙總為有用的格式。

2、心智模型:你對外界的假設和你確信的觀點。心智模型決定你的觀察結果。統計模型取決於心智模型。心智模型應當包括你不了解的因素。也就是說你以為這個世界是什麼樣子的,你就會看到什麼樣子的世界,不能以偏概全。

3、從原始資料中獲得資訊,從而深入挖掘資料。

二、實驗:檢驗你的理論

客戶調查

比較法:這個案例中運用了對比分析法、平均分析法、交叉分析法。

觀察研究法:被研究的人自行決定自己屬於哪個群體的一種研究方法。

混雜因素:研究物件的個人差異,他們不是你試圖進行比較的因素,最終會導致分析結果的敏感度變差。

控制組(對照組):一組體現現狀的處理物件,未經過任何新的處理。有比較就要有對照,就要有控制組和實驗組。

實驗是檢驗真理的唯一標準。

三、最優化:尋找最大值

約束條件:需要考慮的因素,c

決策變數:可以控制的因素,x

目標函式:p

任何最優化問題都有一些約束條件和乙個目標函式

可行區域:約束條件範圍內的區域

「一切模型都是錯誤的,但其中一些是有用的」

詳細的假設條件,以幫助優化模型。

四、資料圖形化

散點圖:散點圖是探索性資料分析的工具,x軸自變數,y軸因變數。可以用r建立散點圖

五、假設檢驗:假設並非如此

變數之間正相關/負相關

假設檢驗的核心是證偽。只需要剔除無法證實的假設

六、貝葉斯統計

條件概率:以一件事情發生為前提的另一件事發生的概率。

p(+|l):表示在患流感的前提下,試驗結果為陽性的概率。

基礎概率:又叫事前概率。

貝葉斯規則:

七、主觀概率:信念數位化

主觀概率:用乙個數字形式的概率表示自己對某事的確認程度。是對分歧內容和分歧大小的一種精確規範。

標準偏差:分析點與資料集平均值的差距。excel裡計算標準差的公式是stdev

八、啟發法:憑人類的天性作分析

啟發法:一種解決問題的方法,可能會得出正確的答案,但不保證得出最優化的答案。

快省樹:描述啟發法的圖形。快:完成這個過程費時不多;省:不需要大量認知資源。

九、直方圖

直方圖:顯示資料點在數值範圍內的分布情況

深入淺出資料分析 讀書筆記

本書是說明類的型別,主要內容是告訴我們該如何做資料分析。主要從一下幾個方面進行闡述 確定問題 分解問題 將乙個大問題分解為幾個小問題 評估 對每個問題使用資料評估 決策 迴圈執行這四個過程 驗證理論需要進行實驗對比,檢驗理論 要注意對照組的設定 列出各種可能。利用證據排所有的不可能的假設。證偽法。排...

《深入淺出資料分析》讀書筆記

寒假看了一本資料分析的啟蒙書籍叫 深入淺出資料分析 這本書插圖很多,主要是通過舉實際例子來介紹資料分析的各種方法,非常通俗易懂。下面分享當時的讀書筆記 內容不多,覺得重要的才記下來 第一章 資料分析引言 分解資料 1 資料分析的固定基本流程 確定 分解 評估 決策 確定 第一步是了解問題 從你的客戶...

讀書筆記 《深入淺出資料分析》讀書筆記

這本書呢它在每一章都安排了乙個企業問題,以解決乙個問題的形式去穿插知識點以及分析思路,可以快速掃讀了解一下分析思路還有思考一下課後問題。之前看見有些人推薦這本書,我才去看的,但是我並不推薦這本書,書裡的內容過於簡單,而且裡面的工具操作都落後了。確定問題 分解問題 將問題分解為更小的組塊 基準假設 評...