相信大家在做資料分析,需要用到統計學的知識的時候,應該都會遇到第p百分位數
百分位數,統計學術語,如果將一組資料從小到大排序,並計算相應的累計百分位,則某一百分位所對應資料的值就稱為這一百分位的百分位數,以pk表示第k百分位數。看到上面的描述,也大概是一知半解,不過只需關注這個核心句子:pk表示至少有k%的資料小於或等於這個數,而同時也有(100-k)%的資料大於或等於這個數。pk表示至少有k%的資料小於或等於這個數,而同時也有(100-k)%的資料大於或等於這個數。
p25=q1
p50=q2
p75=q3
p50稱為中位數
p75與p25的差稱為四分位距
相信都理解都差不多了,也就是看這個數的在全部的排好序(小->大)的位置,那麼我們再看看求法:
求法:那麼我們看看例子吧若一群資料的個數為n,且由小到大排列,設n×k%=a
假設資料是:
栗子1
1,2,3,4,5,6,7,8,9,10
total :10
那麼第p(25)百分位數是多少:3----------------->10 25% = 2.5 取第3個數 也就是3
第p(50)百分位數是多少:5.5---------------------->1050% = 5 整數 取 5個和第5+1個的平均值
第p(75)百分位數是多少:8----------------------->10*75%=7.5 取第8個數
栗子2
6,7,15,36,39,40,41,42,43,47,49
那麼第p(25)百分位數是多少:15
第p(50)百分位數是多少:40
第p(75)百分位數是多少:43
栗子3
7,15,36,39,40,41
那麼第p(25)百分位數是多少:15
第p(50)百分位數是多少:37.5
第p(75)百分位數是多少:40
栗子4
1,2,3,4
那麼第p(25)百分位數是多少:1.5
第p(50)百分位數是多少:2.5
第p(75)百分位數是多少:3.5
相信看到這裡大家都理解得差不多,就算不是很理解,起碼這個百分位數也是會算了吧
也從幾個栗子看出來,第50百分位數明顯就是中位數,所以有時候我們在算中位數的時候就可以使用第p百分位數進行計算。
python 計算動態時點的百分位數
說明 1.動態時點 每次計算的資料框為截止於當前行的資料,即累計行 多次計算 2.靜態時點 當前時間 計算的資料框為所有行 一次計算 test pd.dataframe np.random.randint 1,10,size 10 columns value 生成 1,10 的隨機整數 test p...
統計學中p值計算公式 統計學中的P值應該怎麼計算
誰浮誇了年華 2019 12 10 18 36 p 值即概率,反映某一事件發生的可能性大小。統計學根據顯著性檢驗方法所得到的p 值,一般以p 0.05 為顯著,p 0.01 為非常顯著,其含義是樣本間的差異由抽樣誤差所致的概率小於0.05 或0.01。實際上,p 值不能賦予資料任何重要性,只能說明某...
統計學中p值計算公式 簡單談談基礎的統計學知識
統計學可以分為 描述統計學與推斷統計學 一 描述統計學 使用特定的數字或圖表來體現資料的集中程度和離散程度。運用的工具有 平均數 中位數 眾數 幾何平均數 調和平均數 方差 標準差等。例如箱線圖就可以很好反映其中部分重點統計值。二 推斷統計學 根據樣本資料推斷總體的資料特徵。相比描述統計學,大家對推...