python 如何判斷一組資料是否符合正態分佈

2021-10-23 10:25:08 字數 1323 閱讀 6914

若隨機變數x服從有個數學期望為μ,方差為σ2 的正態分佈,記為n(μ,σ)

其中期望值決定密度函式的位置,標準差決定分布的幅度,當υ=0,σ=0 時的正態分佈是標準正態分佈

判斷方法有畫圖/k-s檢驗

#匯入模組

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

%matplotlib inline

#構造一組隨機資料

s = pd.dataframe(np.random.randn(1000)+10,columns = ['value'])

#畫散點圖和直方圖

fig = plt.figure(figsize = (10,6))

ax1 = fig.add_subplot(2,1,1) # 建立子圖1

ax1.scatter(s.index, s.values)

plt.grid()

ax2 = fig.add_subplot(2,1,2) # 建立子圖2

s.hist(bins=30,alpha = 0.5,ax = ax2)

s.plot(kind = 'kde', secondary_y=true,ax = ax2)

plt.grid()

結果如下:

#匯入scipy模組

from scipy import stats

"""kstest方法:ks檢驗,引數分別是:待檢驗的資料,檢驗方法(這裡設定成norm正態分佈),均值與標準差

結果返回兩個值:statistic → d值,pvalue → p值

p值大於0.05,為正態分佈

h0:樣本符合

h1:樣本不符合

如果p>0.05接受h0 ,反之

"""s = pd.dataframe(np.random.randn(1000)+10,columns = ['value'])

u = s['value'].mean() # 計算均值

std = s['value'].std() # 計算標準差

stats.kstest(s['value'], 'norm', (u, std))

結果是kstestresult(statistic=0.01441344628501079, pvalue=0.9855029319675546),p值大於0.05為正太分

python 如何判斷一組資料是否符合正態分佈

正態分佈 判斷方法有畫圖 k s檢驗 畫圖 匯入模組 import numpy as np import pandas as pd import matplotlib.pyplot as plt matplotlib inline 構造一組隨機資料 s pd.dataframe np.random....

語言的基礎是一組記號和一組規則

是用於編寫電腦程式的語言。語言的基礎是一組記號和一組規則。根據規則由記號構成的記號串的總體就是語言。在程式語言中,這些記號串就是程式。程式語言包含三個方面,即語法 語義和語用。語法表示程式的結構或形式,亦即表示構成程式的各個記號之間的組合規則,但不涉及這些記號的特定含義,也不涉及使用者。語義表示程式...

特徵工程 判斷一組資料的分布形態

思考 輸入到nn模型中的特徵要做歸一化處理,我看到airbnb對特徵歸一化的方式因特徵而異,這點驚訝到我,我當前的工作中,對特徵歸一化處理方式是同一種。然而並不知道特徵服從什麼分布,或許選擇了乙個大家通用的歸一化方法?這個不得而知。言歸正傳,airbnb根據不同特徵做不一樣的歸一化,因為他們對資料進...