本文簡單介紹正態分佈正態分佈簡介
正態分佈關鍵引數:均值&&標準差
正態分佈曲線如何繪製
正態分佈曲線現象解釋
reference
正態分佈(normal distribution),又名高斯分布(gaussian distribution),又因其曲線酷似鐘形,得名鐘形曲線。
還是以上篇提到的測量身高為例,上圖正態分佈曲線x軸表示人群身高,y軸表示某個身高對應的概率;
上圖綠圈部分,極端矮小或者極端高大的身高都是少數,概率相對低,曲線矮;
上圖藍圈部分,大部分人身高都處於均值身高附近,概率相對大,曲線高。
不同正態分佈主要區別在曲線的寬度(標準差控制)和曲線中心位置(均值控制);
例,上圖為新生兒(左圖)和**(右圖)身高的兩個正態分佈,新生兒身高均值為20英吋,**身高均值為70英吋。
看圖說話:
正態分佈總是以均值為中心,從圖中大約可見新生兒身高主要分布在19~21英吋,**身高主要分布在60~80英吋;
新生兒正態分佈曲線比**正態分佈曲線高很多,這是因為新生兒身高落在相對高身高的概率比**更大,粗暴理解為前者只有19~21英吋可選,後者有60~80英吋相對寬的範圍可選,可選範圍越小,落在某個具體的身高上概率就越高;
正態分佈曲線寬度由標準差(standard deviation)決定,越大越寬,左圖為0.6,右圖為4,效果一目了然;
正態分佈曲線繪製時,使得95%的測量值落在均值±標準差的範圍內,所有左右圖紅圈分別為20±2x0.6及70±2x4所得,直接回答了正態分佈曲線寬度由標準差說了算~~~;
看圖說話:
要繪製乙個標準正態分佈曲線,第乙個關鍵引數為均值,決定曲線的中心位置;
第二個關鍵引數為標準差,決定曲線寬度,間接決定曲線高度,曲線越寬越矮,越窄越高。
正態分佈曲線在自然界中非常常見,如人的身高、體重、上下班時間等等,對資料統計非常有用,那是什麼導致了正態分佈的現象了,請看下篇中心極限定理(the central limit theorem).
統計學之正態分佈檢驗
本次主要是對資料集資料進行正態分佈檢驗,資料集位址為 主要包括三列資料,體溫 f 性別 1 男,2 女 心率 次 分鐘 1.資料統計 usr bin env python coding utf 8 import requests import pandas as pd import numpy as...
征服統計學06 統計模型 抽樣分布是什麼?
本文介紹統計模型和抽樣分布基本知識。統計模型描述變數之間的關係,如上圖的黑色直線就是乙個描述小鼠體格和體重關係的線型模型 模型是對真實資料的近似估計,如上圖y軸方向的虛線長表示模型估計與真實資料之間距離 我們用大量實驗資料去驗證模型是否健壯。實際生活中,常常無法直接研究總體,需要隨機抽取樣本代以研究...
在統計學中 正態分佈在統計學裡是怎樣的存在
正態分佈 normal distribution 是統計學裡最常見的分布之一。in probability theory,the normal or gaussian or gauss or laplace gauss distribution is a very common continuous...