從0到1
回顧:在第一關作業毫無壓力,因為都是總結一下自己的目標和現成的資料名詞解釋
我自己設定的目標也比較簡單
就是把所有關卡的作業按時完成
兩天內進入了第二關 結果。。。。
第二關就已經有點兒吃力了
先把live聽了一遍
然而。。。沒聽明白
隨後看看了其他同學和優秀學員的作業與總結
似乎有點兒明白於是趕緊乘勝追擊,又細細的聽課一遍粗略的做也一些筆記
連續聽了三遍之後才有點兒小感悟。
以下我個人理解
描述統計分析概要:
對大量的資料進項歸納
簡化複雜的資料,簡化成為能起到關鍵作用(代表作用)的數字
我們通常把描述資料分為4個指標
1平均值
2四分位數
3標準差
4標準分
1.平局值:
總數/個數 (這裡是我個人理解的寫法,請參考標準公式)
例如:4人年收入 a 10w b 11w c 12w d 13w
平局值=(a+b+c+d)/4
平局值缺點:對於異常數值不敏感,當數值中有異常數值時,平均值的描述是不準確的。
2.中位數:
簡單的說就是資料集從小到大排序取中間位置的數字
資料數目用n表示
如果n為奇數,那麼取中間的數
舉例:12345 中間數為3 則取3位中位數
如果n為偶數,則取中間兩個資料數之和的平均值
舉例:1234 取2+3/2 中位數就是2.5
3. 四分位數:
a.先求出中位數
同樣真個資料集按照從小到大排序
最左側(最小值)為下界
最右側(最大值)為上界
中位數最左邊都小於中位數,反之中位數最右側都大於中位數
各佔50%
b.求出下四分位數和上四分位數
下四分位數表示中位數左邊邊的中位數
上四分位數表示中位數右邊邊的中位數
於是就把整個資料集分成4等份,每份佔資料集總數的25%
從而我們得出5個數值從左到右依次為:
a 下界(最小數)
b 下四分位數常用 q1表示
c 中位數 常用 q2表示
d 上四分位數 常用 q3
e 上界 (最大數)
如果我們把這些名詞所對應的數值已箱線影象的形式表示
那麼我們將更好的去理解 如圖:
箱線圖的應用環境:
箱線圖常用與比較不同類別資料集的情況
異常值:
在四分位數的應用中,可以識別出可能的異常值
有時候資料中包含乙個或多個非常大或非常小的數值
我們稱之為異常值。
異常值的處理方法:
從資料中找出可能存在的異常值,找出異常值後進行檢查,確定為異常值
確定異常值後我們
1. 核對並修正異常值
2. 不符合當前資料集的正常情況,發現刪掉
3. 反常的異常數值,但符合正常情況 應該保留
四分位數識別異常值的方法稱為:tukey』s test
我們通過計算最小估計值和最大估計值後與此對應識別
超過最大估計值或最小估
計值範圍的數值就可能是異常值
計算方式:
最小估計值:q1-k(q3-q1)
最大估計值:q3+k(q3-q1)
k=1.5 表示中度異常
k=3 表示極度異常
四分位數雖能計算出較為準確的均值,但是不能衡量資料的波動大小
標準差:
優點可以衡量資料的波動大小
離散程度=變異性=波動大小
標準差=波動大小
資料集:x1 x2 x3
平均值:μ
(x1-μ)²+(x2-μ)²+(x3-μ)²
n為什麼要減去平均值做平方
數量變化與平均值是反向偏離的,也就是負數,平方後和消除負號
這樣處理平均值是才不會被正負抵消
最優要把平均值開方
標準差的單位與計算出的單位是相同的
標準差大一點好還是小一點好?根據實際情況兒定
標準分相對排名,距離平均值多少個標準差
你想從該資料中分析出那些問題?
根據購買時間的不同了解客戶購買產品是否與節日季節性有所關聯
時間能很直觀的判斷出客戶是否在某個特殊時間段需求量增加
該特殊時間段的銷量與總的標準分距離多少個標準差
以上
MATLAB數值計算 0
目錄format 表示格式 help format 可以查詢format幫助 format short 把輸出的格式改為預設設定 format rat 顯示為分數 format long e 顯示長精確度並用科學計數法 format long 並沒有重計算,把顯示數字的有效位5 15位 format...
C 字串數值前加0將1轉化成01
string str1 1 string str2 01 在我們的主觀感受裡這兩個在進行數值比較時都是1,應該是等價的,但進行字元比對時則不盡然 str1 convert.todouble str1 tostring 00 首先將字串轉化成double數值型別 其次在將數值轉化回字串時,指定資料顯示...
Sql Server中將數值型別的末尾0去掉
select convert float,isnull a.value,0 from work info as a where a.注意 convert float,xx 雖然可以去掉小數點後末尾0,但是,當整數部不大於15位數時,小數部顯示個數 15 整數部個數 當整數部大於15位數時,小數部會四...