資料分析的統計基礎5

2022-08-09 21:33:29 字數 1083 閱讀 5284

當樣本容量很大時,樣本比例的抽樣分布可用正態分佈近似當樣本容量很大時,樣本比例的抽樣分布可用正態分佈近似

棣莫弗-拉普拉斯中心極限定理:設\(x_1,x_2,...x_n,...\)是獨立同分布(independently identically distribution)的隨機變數,\(x_i\)的分布是\(p(x_i=1)=p\),\(p(x_i=0) = 1- p\),$ 0 < p < 1$。

則對任何實數\(x\),有

\[\lim_ p\left( \frac^x_i - np}} \leq x \right) = \phi(x)

\]單個\(x_i\)服從伯努利分布,可以理解為屬於某個特徵和不屬於某個特徵,其滿足\(\mu = p,\sigma^2 = p(1-p)\)。\(e(\sum \limits_^x_i) = np,var(\sum \limits_^x_i) = np(1-p)\)。上式(證明從略),又表明當\(n \to \infty\)時,\(\sum \limits_^近似服從正態分佈,\)

\(\sum \limits_^x_i) \sim n(np,np(1-p))\),上式還可以改寫為:

\[\lim \limits _p\left(\frac} \leq x \right) = \phi(x)

\]對於\(n\)個伯努利隨機變數,\(\bar x = n^\sum \limits_^x_i\)的實際意義即為\(x_i\)為"\(1\)" 類的佔比。

說明:\[\frac \sim \chi_^2 , \frac \sim \chi_^2

\]根據\(f​\)分布的定義,上式相除有:

有了上表,我們分別構造了估計總體引數\(\mu\),\(\pi\),\(\tau\),\(\sigma^2\)的估計量\(\bar x\),\(p\),\(t=n\bar x\),\(s^2\),如果我們知道總體的方差,則可以給出對應的估計的標準誤差,當總體方差未知時,我們可以通過標準誤的估計來估計總體的方差。

資料分析統計

select count 0 sum oi.aunt 10 to char oi.cre date,yyyy mm dd hh24 d count to char oi.crea date,yyyy mm dd hh24 c from eall.orer ite oi where oi.cratda...

《從零高階!資料分析的統計基礎》 1 資料分析概述

目錄 第一章 資料分析概述 1.什麼是資料分析 2.資料分析的六個步驟 1.明確分析目的和內容 2.資料收集 3.資料處理 4.資料分析 5.資料展現 6.報告撰寫 3.資料分析方法簡介 統計分析方法 資料探勘方法 4.統計分析與資料探勘的區別和聯絡 1.統計分析與資料探勘的聯絡 2.資料分析與資料...

《資料分析的統計基礎》學習筆記(一) 資料分析概述

1.1 什麼是資料分析 客觀 從行業的角度看,資料分析是基於某種行業目的,有目的地進行收集,整理,加工,和分析資料,提煉有價值資訊的乙個過程。本質 a.目標,資料分析的關鍵在於設立目標,專業上叫做 有針對性 b.方法,包括統計分析和資料探勘 c.結果,資料分析最終要得出分析結果,結果對目標解釋的強弱...