獨立性檢驗

2022-01-24 01:39:03 字數 4276 閱讀 9487

\(h_0:\)先假設兩個變數\(a\),\(b\)是無相關關係的,\(\chi^2\)的觀測值\(k_0\)越大,則與之對應的假設事件\(h_0\)成立的概率越小,那麼\(h_0\)不成立的概率越大,即兩個變數相關的概率越大。

獨立性檢驗中的**的解讀:

案例1,比如\(\chi^2=\cfrac\)

\(=\cfrac\)

\(=\cfrac\)

\(=\cfrac\)

\(=\cfrac\)

\(=\cfrac\)

\(=\cfrac=6.11\)

案例2,比如\(\chi^2=\cfrac\)

分子分母約去\(100\),分子的平方項下約去\(10\),則分母位置必須約去\(100\),得到:

\(\chi^2=\cfrac\)

分子分母約去\(100\),得到:

\(\chi^2=\cfrac\)

分子分母約去\(100\),得到:

\(\chi^2=\cfrac\)

分子分母約去\(5\),得到:

\(\chi^2=\cfrac\)

分子分母約去\(16\),得到:

\(\chi^2=\cfrac\)

分子分母約去\(4\),得到:

\(\chi^2=\cfrac\)

分子分母約去\(2\),得到:

\(\chi^2=\cfrac\)

\(\chi^2=\cfrac\)

「網購」已經成為我們日常生活中的一部分,某地區隨機調查了 \(100\) 名男性和 \(100\) 名女性在「雙十一」活動中用於網購的消費金額,資料整理如下表,

男性消費金額頻數分布表:

消費金額

\(0\sim500\)

\(500\sim1000\)

\(1000\sim1500\)

\(1500\sim2000\)

\(2000\sim3000\)

人數\(15\)

(1).試分別計算男性、女性在此活動中的平均消費金額;

解: 由**知男性平均消費金額為:

\(\bar=0.15\times250+0.15\times750+0.2\times1250+0.3\times1750+0.2\times2500\)

\(=1425\)(元);

由頻率分布直方圖知女性平均消費金額為:

\(\bar=(2.5\times0.3+7.5\times0.2+12.5\times0.2+17.5\times0.15+22.5\times0.1+27.5\times 0.05)\)

\(\times100=1100\)(元);

(2).如果分別把男性、女性消費金額與中位數相差不超過 \(200\) 元的消費稱作理性消費,試問是否有 \(50\%\) 以上的把握認為理性消費與性別有關?

參考公式:附 \(\chi^2=\cfrac;\)

\(p(\chi^2\geqslant k_0)\)

\(0.50\)

\(0.40\)

\(0.25\)

\(0.15\)

\(0.10\)

\(0.05\)

\(k_0\)

\(0.455\)

\(0.708\)

\(1.323\)

\(2.072\)

\(2.706\)

\(3.841\)

解析:由(1)知女性的消費中位數為 \(1000\) 元[利用等分面積線來計算中位數],則理性消費區間為 \([800,1200]\) 元,人數為 \(0.04\)

\(\times4\)

\(\times\)

\(100\)

\(=\)

\(16\) 個,男性的消費中位數為 \(1500\) 元[利用等分面積線來計算中位數],則理性消費區間理性消費區間為 \([1300,1700]\) 元,人數為 \(0.20\times\cfrac\times 100\)

\(+\)

\(0.30\times\cfrac\times100\)

\(=\)

\(20\)個 ,又由於本題目涉及兩個變數 「消費特點」和「性別」,其中「消費特點」的值域為理性消費和非理性消費,性別的值域為男和女,故製作填寫 \(2\times2\) 列聯表如下:

女性男性

合計理性消費

\(16\)

\(20\)

\(36\)

非理性消費

\(84\)

\(80\)

\(164\)

合計\(100\)

\(100\)

\(200\)

由於 \(0.5420>0.455\),所以有 \(50\%\) 以上的把握認為理性消費與性別有關.

【2017全國卷2文科19題理科18題高考真題】海水養殖場進行某水產品的新、舊網箱養殖方法的產量對比,收穫時各隨機抽取了100個網箱,測量各箱水產品的產量(單位:kg), 其頻率分布直方圖如下:

(1)記\(a\)表示事件「舊養殖法的箱產量低於50kg」,估計\(a\)的概率;

分析:本題實質是考查用頻率估計概率,所以要會根據頻率分布直方圖計算頻率。

由於「舊養殖法的箱產量低於50kg」的頻率為\((0.012+0.014+0.024+0.034+0.040)\times 5=0.62\),

故所求概率\(p(a)=0.62\)。

同理得到「新養殖法的箱產量低於50kg」的頻率為\((0.004+0.020+0.044)\times 5=0.34\)

(2)填寫下面列聯表,並根據列聯表判斷是否有99%的把握認為箱產量與養殖方法有關,參考資料**如下:

\(\begin

p(\chi^2\ge k_0) & 0.050 &0.010 &0.001 \\

\hline

k_0 & 3.841 & 6.635 & 10.828

\end\)

分析:由上問可知,「舊養殖法的箱產量低於50kg」的頻數為\(100\times 0.62=62\),

則「舊養殖法的箱產量不低於\(50kg\)」的頻數為\(100-62=38\),

「新養殖法的箱產量低於\(50kg\)」的頻數為\(100\times 0.34=34\),

則「新養殖法的箱產量不低於\(50kg\)」的頻數為\(100-34=66\),由此得到二列聯表如下:

箱產量箱產量\(\ge 50kg\)

總計舊養殖法

\(62(a)\)

\(38(b)\)

\(100(a+b)\)

新養殖法

\(34(c)\)

\(66(d)\)

\(100(c+d)\)

總計\(96(a+c)\)

\(104(b+d)\)

\(200(a+b+c+d)\)

由上表計算得到\(\chi^2=\cfrac\)

\(=\cfrac=15.705>6.635\)

故有99%以上的把握認為,二者有關聯。

(3)根據箱產量的頻率分布直方圖,對這兩種養殖方法的優劣進行比較。

分析:本題目的難點有:到底從哪些角度進行比較?每乙個角度下的數值的計算方法。

資料的極差:舊,\(25-70\);新,\(35-70\),極差反映了資料的取值範圍和資料的幾種程度,當然誤差是有的;

資料的眾數:舊,\(47.5\);新,\(52.5\),眾數反映了出現次數最多,

資料的平均數:舊,\(47.1\);新,\(52.35\),平均數反映了一組資料的平均水平,

資料的方差(標準差):比較精確的反映了資料的分散和集中程度,將這種程度數量化了。

本題目從運算量和問題出發,可以從資料的範圍和資料的中位數(或均值)兩個角度作答。

「舊養殖法」的資料分布在\(25-70\)之間,「新養殖法」的資料分布在\(35-70\)之間,

故從資料範圍來看,新養殖法的資料更集中,優於舊養殖法;

「舊養殖法」的平均數(中位數)分布在\(40-45\)之間,「新養殖法」的平均數(中位數)分布在\(50-55\)之間,

從平均數(中位數)角度來看,新養殖法也優於舊養殖法。

結構的獨立性

設計考慮的是最終需要什麼,最終我們要提供的呼叫介面是什麼,我們所直接需要的某個有價值的,直接存在的,直接可以接觸的結構是什麼,而不是它所依據的原理是什麼,不是它的具體構造過程或者構造方法是什麼。比如說我們在程式中完全不需要內建map這一結構,因為它可以通過列表等結構組合構建出來,但是很顯然,map這...

統計獨立性和統計相關性

在隨機訊號分析中,不相關 正交 統計獨立等是非常重要的,這裡進一步討論各自的嚴格概念和相互關係。當兩個隨機過程保持統計獨立時,它們必然是不相關的,但反過來則不一定成立,即不相關的兩個隨機過程不一定能保持統計獨立,唯有在高斯隨機過程中才是例外。這就是說,從統計角度看,保持統計獨立的條件要比不相關還要嚴...

5 5 2 條件概率與獨立性

1.條件概率 b事件發生以後a事件的概率 p a b p ab p b 理解 b事件已然發生,樣本空間由s縮小為b,a的有利場合由a縮小為ab事件的交集 也可以理解為由必然發生的b事件的概率來對ab事件進行歸一化 不太懂 2.條件概率的乘法公式形式 p ab p b p a b 理解 積事件的概率等...