我們在做a/b試驗評估的時候需要借助p_value,這篇文章記錄如何利用python計算兩組資料的顯著性。一、**
# ttest.py
# -*- coding: utf-8 -*-
'''# created on 2020-05-20 20:36
# ttest.py
# @author: huiwenhua
'''## import the packages
import numpy as np
from scipy import stats
def get_p_value(arra, arrb):
a = np.array(arra)
b = np.array(arrb)
t, p = stats.ttest_ind(a,b)
return p
if __name__ == "__main__":
get_p_value([1, 2, 3, 5, ], [6, 7, 8, 9, 10])
二、t檢驗:兩樣本t檢驗
兩樣本t檢驗是比較兩個樣本所代表的兩個總體均值是否存在顯著差異。除了要求樣本來自正態分佈,還要求兩個樣本的總體方差相等也就是「方差齊性」。
檢驗原假設:樣本均值無差異(μ=μ0)
python命令stats.ttest_ind(data1,data2)
當不確定兩總體方差是否相等時,應先利用levene檢驗檢驗兩總體是否具有方差齊性stats.levene(data1,data2)如果返回結果的p值遠大於0.05,那麼我們認為兩總體具有方差齊性。如果兩總體不具有方差齊性,需要加上引數equal_val並設定為false,如下。
stats.ttest_ind(data1,data2,equal_var=false) // ttest中預設是具有方差齊性
三、結果解釋
當p值小於某個顯著性水平α(比如0.05)時,則認為樣本均值存在顯著差異,具體的分析要看所選擇的是雙邊假設還是單邊假設(又分小於和大於)注意stats.ttest_ind進行雙側檢驗。
當t值大於0,則有((1-p)* 100)%的把握認為認為第一組資料好與第二組資料。例如p=0.05,那麼我們有95%的把握認為第一組資料好於第二組資料。
兩組資料一起排序的python程式
excel裡的排序功能很強大,它能使得所有列的資料按照某一列的公升序或者降序統一實現排序。這個功能用程式設計如何實現呢?本人給出了一段用python實現這一功能的程式。本程式中,資料以列表形式儲存,將用於排序的那一組資料稱為主動排序資料,將跟隨主動排序資料而變動的資料稱為被動排序資料。程式設計的核心...
Python基礎練習(一) 兩組數的差異
解題思路 解題 給出兩組相同數量的整數,求這兩組整數的差異估算,即 對應數差值平方之和。第一組為a1,a2 an 第二組為b1,b2 bn 求 a1 b1 2 an bn 2 兩行,每行是一組整數,用空格隔開。乙個整數。1 21 2 時間限制 500ms記憶體限制 32000kb 該題用陣列結構解決...
兩組資料告訴你什麼叫 海量
第一組 如果對全球陸地進行可見光正射航空遙感成像,按照15cm pixel的解析度,那麼將得到約22pb的資料。第二組 如果對全球陸地進行15cm pixel解析度的可見光正射航空遙感成像,對街景按照2cm pixel解析度進行可見光遙感成像,對建築物室內進行0.5cm pixel解析度可見光遙感成...