\(h_0:\)先假設兩個變數\(a\),\(b\)是無相關關係的,\(\chi^2\)的觀測值\(k_0\)越大,則與之對應的假設事件\(h_0\)成立的概率越小,那麼\(h_0\)不成立的概率越大,即兩個變數相關的概率越大。
獨立性檢驗中的**的解讀:案例1,比如\(\chi^2=\cfrac\)
\(=\cfrac\)
\(=\cfrac\)
\(=\cfrac\)
\(=\cfrac\)
\(=\cfrac\)
\(=\cfrac=6.11\)
案例2,比如\(\chi^2=\cfrac\)
分子分母約去\(100\),分子的平方項下約去\(10\),則分母位置必須約去\(100\),得到:
\(\chi^2=\cfrac\)
分子分母約去\(100\),得到:
\(\chi^2=\cfrac\)
分子分母約去\(100\),得到:
\(\chi^2=\cfrac\)
分子分母約去\(5\),得到:
\(\chi^2=\cfrac\)
分子分母約去\(16\),得到:
\(\chi^2=\cfrac\)
分子分母約去\(4\),得到:
\(\chi^2=\cfrac\)
分子分母約去\(2\),得到:
\(\chi^2=\cfrac\)
\(\chi^2=\cfrac\)
「網購」已經成為我們日常生活中的一部分,某地區隨機調查了 \(100\) 名男性和 \(100\) 名女性在「雙十一」活動中用於網購的消費金額,資料整理如下表,
男性消費金額頻數分布表:
消費金額
\(0\sim500\)
\(500\sim1000\)
\(1000\sim1500\)
\(1500\sim2000\)
\(2000\sim3000\)
人數\(15\)
(1).試分別計算男性、女性在此活動中的平均消費金額;
解: 由**知男性平均消費金額為:
\(\bar=0.15\times250+0.15\times750+0.2\times1250+0.3\times1750+0.2\times2500\)
\(=1425\)(元);
由頻率分布直方圖知女性平均消費金額為:
\(\bar=(2.5\times0.3+7.5\times0.2+12.5\times0.2+17.5\times0.15+22.5\times0.1+27.5\times 0.05)\)
\(\times100=1100\)(元);
(2).如果分別把男性、女性消費金額與中位數相差不超過 \(200\) 元的消費稱作理性消費,試問是否有 \(50\%\) 以上的把握認為理性消費與性別有關?
參考公式:附 \(\chi^2=\cfrac;\)
\(p(\chi^2\geqslant k_0)\)
\(0.50\)
\(0.40\)
\(0.25\)
\(0.15\)
\(0.10\)
\(0.05\)
\(k_0\)
\(0.455\)
\(0.708\)
\(1.323\)
\(2.072\)
\(2.706\)
\(3.841\)
解析:由(1)知女性的消費中位數為 \(1000\) 元[利用等分面積線來計算中位數],則理性消費區間為 \([800,1200]\) 元,人數為 \(0.04\)
\(\times4\)
\(\times\)
\(100\)
\(=\)
\(16\) 個,男性的消費中位數為 \(1500\) 元[利用等分面積線來計算中位數],則理性消費區間理性消費區間為 \([1300,1700]\) 元,人數為 \(0.20\times\cfrac\times 100\)
\(+\)
\(0.30\times\cfrac\times100\)
\(=\)
\(20\)個 ,又由於本題目涉及兩個變數 「消費特點」和「性別」,其中「消費特點」的值域為理性消費和非理性消費,性別的值域為男和女,故製作填寫 \(2\times2\) 列聯表如下:
女性男性
合計理性消費
\(16\)
\(20\)
\(36\)
非理性消費
\(84\)
\(80\)
\(164\)
合計\(100\)
\(100\)
\(200\)
由於 \(0.5420>0.455\),所以有 \(50\%\) 以上的把握認為理性消費與性別有關.
【2017全國卷2文科19題理科18題高考真題】海水養殖場進行某水產品的新、舊網箱養殖方法的產量對比,收穫時各隨機抽取了100個網箱,測量各箱水產品的產量(單位:kg), 其頻率分布直方圖如下:
(1)記\(a\)表示事件「舊養殖法的箱產量低於50kg」,估計\(a\)的概率;
分析:本題實質是考查用頻率估計概率,所以要會根據頻率分布直方圖計算頻率。
由於「舊養殖法的箱產量低於50kg」的頻率為\((0.012+0.014+0.024+0.034+0.040)\times 5=0.62\),
故所求概率\(p(a)=0.62\)。
同理得到「新養殖法的箱產量低於50kg」的頻率為\((0.004+0.020+0.044)\times 5=0.34\)
(2)填寫下面列聯表,並根據列聯表判斷是否有99%的把握認為箱產量與養殖方法有關,參考資料**如下:
\(\begin
p(\chi^2\ge k_0) & 0.050 &0.010 &0.001 \\
\hline
k_0 & 3.841 & 6.635 & 10.828
\end\)
分析:由上問可知,「舊養殖法的箱產量低於50kg」的頻數為\(100\times 0.62=62\),
則「舊養殖法的箱產量不低於\(50kg\)」的頻數為\(100-62=38\),
「新養殖法的箱產量低於\(50kg\)」的頻數為\(100\times 0.34=34\),
則「新養殖法的箱產量不低於\(50kg\)」的頻數為\(100-34=66\),由此得到二列聯表如下:
箱產量箱產量\(\ge 50kg\)
總計舊養殖法
\(62(a)\)
\(38(b)\)
\(100(a+b)\)
新養殖法
\(34(c)\)
\(66(d)\)
\(100(c+d)\)
總計\(96(a+c)\)
\(104(b+d)\)
\(200(a+b+c+d)\)
由上表計算得到\(\chi^2=\cfrac\)
\(=\cfrac=15.705>6.635\)
故有99%以上的把握認為,二者有關聯。
(3)根據箱產量的頻率分布直方圖,對這兩種養殖方法的優劣進行比較。
分析:本題目的難點有:到底從哪些角度進行比較?每乙個角度下的數值的計算方法。
資料的極差:舊,\(25-70\);新,\(35-70\),極差反映了資料的取值範圍和資料的幾種程度,當然誤差是有的;
資料的眾數:舊,\(47.5\);新,\(52.5\),眾數反映了出現次數最多,
資料的平均數:舊,\(47.1\);新,\(52.35\),平均數反映了一組資料的平均水平,
資料的方差(標準差):比較精確的反映了資料的分散和集中程度,將這種程度數量化了。
本題目從運算量和問題出發,可以從資料的範圍和資料的中位數(或均值)兩個角度作答。
「舊養殖法」的資料分布在\(25-70\)之間,「新養殖法」的資料分布在\(35-70\)之間,
故從資料範圍來看,新養殖法的資料更集中,優於舊養殖法;
「舊養殖法」的平均數(中位數)分布在\(40-45\)之間,「新養殖法」的平均數(中位數)分布在\(50-55\)之間,
從平均數(中位數)角度來看,新養殖法也優於舊養殖法。
結構的獨立性
設計考慮的是最終需要什麼,最終我們要提供的呼叫介面是什麼,我們所直接需要的某個有價值的,直接存在的,直接可以接觸的結構是什麼,而不是它所依據的原理是什麼,不是它的具體構造過程或者構造方法是什麼。比如說我們在程式中完全不需要內建map這一結構,因為它可以通過列表等結構組合構建出來,但是很顯然,map這...
統計獨立性和統計相關性
在隨機訊號分析中,不相關 正交 統計獨立等是非常重要的,這裡進一步討論各自的嚴格概念和相互關係。當兩個隨機過程保持統計獨立時,它們必然是不相關的,但反過來則不一定成立,即不相關的兩個隨機過程不一定能保持統計獨立,唯有在高斯隨機過程中才是例外。這就是說,從統計角度看,保持統計獨立的條件要比不相關還要嚴...
5 5 2 條件概率與獨立性
1.條件概率 b事件發生以後a事件的概率 p a b p ab p b 理解 b事件已然發生,樣本空間由s縮小為b,a的有利場合由a縮小為ab事件的交集 也可以理解為由必然發生的b事件的概率來對ab事件進行歸一化 不太懂 2.條件概率的乘法公式形式 p ab p b p a b 理解 積事件的概率等...