選舉中,我想知道男人和女人都給某些候選人的佔比是否有顯著不同?
男性中 投給某候選人的佔比為p1,不投給這個候選人的佔比為1-p1. 投給此候選人為1,不投給此候選人為0.
女性中 投給這個候選人的佔比為p2,不投給這個候選人的佔比為1-p2. 投給此候選人為1,不投給此候選人為0.
這兩個都是伯努利分布。
男:均值=p1,方差=p1*(1-p1)
女:均值=p2,方差=p2*(1-p2)
所求:p1 和 p2 是否有顯著差異?也就是 p1 - p2的分布。
我們希望求出乙個95%的置信區間,為此我們調查了1000個男性 和 1000個女性投票者。
樣本男:642投了此候選人,記為1 358未投此候選人,記為0. p1 = 0.642 方差=0.6420.358
樣本女:591投了此候選人,記為1 409未投此候選人,記為0. p2 = 0.591 方差=0.5910.409
由於樣本容量大,所以隨機抽樣分布 接近 正太分布:
隨機抽樣均值分布男 總體均值=樣本均值=0.642 總體方差=方差=0.6420.358/1000(大容量樣本下 我們用樣本方差估計總體方差)
隨機抽樣均值分布女 總體均值=樣本均值=0.591 總體方差=方差=0.5910.409/1000(大容量樣本下 我們用樣本方差估計總體方差)
隨機抽樣均值差分布 分布均值=0.642-0.591=0.051 方差=0.6420.358/1000 + 0.5910.409/1000=0.022x0.022
差值分布95%的置信區間 查表可知 z=1.96 d=1.96x0.022=0.043
所以 有95%機率均總體佔比之差落在樣本佔比之差左右0.043範圍內 即:p1-p2的95%置信區間是 0.008到0.094
假設檢驗:
零假設:投票男女佔比無差別 即總體差值 p1-p2 = 0
備擇假設:投票男女佔比有差別 即總體差值 p1-p2 != 0
使用顯著性水平5%進行檢驗
零假設下:總體差值分布的均值為0,樣本差值=0.051,求出0.051距離0有幾個標準差?
查z表可知:正太分布下,2.5%的z值=1.96。如果0.051距離0的標準差數》1.96,說明樣本概率小於5%,這樣就可以拒絕零假設。
零假設下:p1=p2,方差有更好的估計值,即 方差=2p(1-p)/1000 p=(642+591)/2000 則標準差=0.0217
0.051/0.0217=2.35
2.35>1.96,所以我們拒絕零假設。
sql 累計佔比 製作有累積和佔比的銷售統計表
現有這樣的產品月銷售明細表 希望按下面的樣子,按類別分組統計各產品銷售額,銷售額從高到低排序,並增加組內累積及佔比。資料檔案 產品銷售明細.xls 製作報表過程 1 開啟潤幹報表工具並新建空白報 2 設定報表的資料集為 excel 檔案 3 繪製報表,包括樣式 報表單元格的表示式等 其中表示式部分 ...
sql 累計佔比 sql統計佔比和統計數量
在工作中經常遇到統計佔比的需求,有時候還要把沒有值得統計為0,如何寫sql呢?下面寫乙個小例子,作為參考,方便以後查閱.資料準備 create table t group id number not null,name varchar2 100 alter table t group add pri...
sql 累計佔比 MSSQL 讀寫佔比分析方法分享
為了精準分析當前系統的讀寫佔比,我們可以通過以下sql語句,獲取指定資料庫的db檔案的讀寫情況,通過這些情況,我們可以為系統提速做下一步的操作,例 如果讀多於寫,那麼需要做讀寫分離 如果寫非常多,那麼需要對業務場景的後台進行重新部署,分庫分表,等提速操作,以下指令碼將展示,監控mssql 檔案的讀寫...