非引數統計 釋意

2022-09-06 07:03:11 字數 2490 閱讀 5506

非引數統計是應用統計學的重要分支之一。非引數統計區別於傳統的引數統計的基本 特點是:非引數統計分析模型通常對模型和資料的假定更為寬鬆 。一般而言,非引數統計是對資料分布的具體形式不做細緻假定,盡量從資料本身獲得資料的結構關係,逐漸建立對研究物件的數學模型和統計模型的方法。

非引數統計是 19 世紀 40 年代以後興起的。 1942 年, j.wolfowitz 首先使用非引數統計一詞,早期的非引數統計主要是擴充引數檢驗的內容,以使得傳統的檢驗過程可以應用於小樣本和不同型別和分布的資料,比如常用的非引數檢 驗有符號檢驗、雙樣本 wilcoxon 檢驗,多樣本 kruskal-wallis 檢驗、 檢驗等,主要利用的工具有秩和格點概率分析等,這些檢驗方法至今仍然在各個領域廣泛應用。近年來,由於統計理論的進一步發展和計算機收集處理資料能力的提 高,使得發展隨資料結構不同而靈活變化的模型成為可能。在統計研究領域一些非常有意義的新的研究方向正成為研究熱點,非引數統計也是其中之一,非引數密 度、非引數回歸以及非引數學習等內容正在成為新的研究和應用主題,研究人員利用統計逼近理論突破引數回歸和模型估計原有理論框架,利用各種演算法改進模型的 計算過程,通過調整**偏差和方差的比例來發展適應性更強,解釋更為精練、擬合優度適中和計算更為有效的模型。從非引數研究角度來看,今天的非引數統計是 統計和計算的交叉產物。非引數將模型建立在堅實的資料基礎上的建模觀點,使得非引數統計有著更廣泛的應用前景。

如果在乙個統計問題中,其總體分布不能用有限個實引數來刻畫,只能對它作一些諸如分布連續、有密度、具有某階矩等一般性的假定,則稱之為非引數統計 問題。例如,檢驗「兩個總體有相同分布」這個假設,若假定兩總體的分布分別為正態分佈n(μ1,σ2)和n(μ2,σ2),則問題只涉及三個實引數 μ1,μ2,σ2,這是引數統計問題。若只假定兩總體的分布為連續,此外一無所知,問題涉及的分布不能用有限個實引數刻畫,則這是非引數統計問題。又如, 估計總體分布的期望μ,若假定總體分布為正態 n(μ,σ2),則問題是引數性的;若只假定總體分布的期望值存在,則問題是非引數性的。不過引數統計與非引數統計之間並沒有涇渭分明的界線。有的統計問 題,從不同的角度,可以理解為引數性的,也可以理解為非引數性的。例如線性回歸(見回歸分析)問題,若關心的是估計回歸係數,它只是有限個實引數,因而可 以看成是引數性的。但是,如果對隨機誤差的分布型別沒有作任何假定,則從問題的總體分布這個角度看,也可以看成是非引數性的。

重要的非引數統計方法   秩方法是基於秩統計量(見統計量)的一類重要的非引數統計方法。設有樣本x1,x2,…,xn,把它們由小到大排列,若xi在這個次序中佔第ri個位置 (最小的佔第1個位置), 則稱xi的秩為ri(i=1,2,…,n)。2023年f.威爾科克森提出的"兩樣本秩和檢驗"是乙個有代表性的例子。設x1,x2,…,xm和 y1,y2,…,yn分別是從分布為 f(x)和 f(x-θ)的總體中抽出的樣本,f連續但未知,θ也未知,檢驗假設 h:θ=0,備擇假設為θ>0(見假設檢驗)。記yi在混合樣本(x1,x2,…,xm,y1,y2,…,yn)中的秩為ri,且為諸秩的和,當w >c時,否定假設h,這裡c決定於檢驗的水平。這是乙個效能良好的檢驗。秩方法的乙個早期結果是c.斯皮爾曼於2023年提出的秩相關係數。設 (x1,y1),(x2,y2),…,(xn,yn)是從二維總體(x,y)中抽出的樣本,ri為xi在(x1,x2,…,xn)中的秩,qi為yi在 (y1,y2,…,yn)中的秩,定義秩相關係數為(ri,qi)(i=1,2,…n)的通常的相關係數(見相關分析)。它可以作為x、y之間相關程度的 度量,也可用於檢驗關於x、y獨立性的假設。

次序統計量和u 統計量在非引數統計中也有重要應用。前者可用於估計總體分布的分位數(見概率分布)、檢驗兩總體有相同的分布及構造連續總體分布的容忍限和容忍區間(見區 間估計)等。後者主要用於構造總體分布的數字特徵的一致最小方差無偏估計(見點估計)及基於這種估計的假設檢驗。

蘇聯數學家α.η.柯爾莫哥洛夫和β.и.斯公尺爾諾夫在20世紀30年代的工作開闢了非引數統計的乙個方面,他們的方法基於樣本x1,x2,…,xn 的經驗分布函式fn(x)(見樣本)。柯爾莫哥洛夫考察 fn(x)與理論分布f(x)的最大偏差墹n,當墹n超過一定限度時,否定這個理論分布f(x)。這就是柯爾莫哥洛夫檢驗。斯公尺爾諾夫則考察由兩個分布為 f(x)和g(x)的總體中抽出的樣本x1,x2,…,xm和y1,y2,…,yn計算其經驗分布fm(x)和gn(x)的最大偏差墹mn,當墹mn超過 一定限度時,否定「f與g相等」這個假設。這就是斯公尺爾諾夫檢驗。

在非引數性估計方面,有關於估計分布的對稱中心、概率密度函式和回歸函式等比較重要的成果。

非引數統計的特點  非引數統計問題中對總體分布的假定要求的條件很寬,因而針對這種問題而構造的非引數統計方法,不致因為對總體分布的假定不當而導致重大錯誤,所以它往往 有較好的穩健性(見穩健統計),這是乙個重要特點。但因為非引數統計方法需要照顧範圍很廣的分布,在某些情況下會導致其效率的降低。不過,近**論證明 了:一些重要的非引數統計方法,當與相應的引數方法比較時,即使在最有利於後者的情況下,效率上的損失也很小。

由於非引數統計中對分布假定要求的條件寬,因而大樣本理論(見大樣本統計)佔據了主導地位。第二次世界大戰前,非引數統計的大樣本理論已有了一些結 果,從20世紀50年代直到現代,更有了顯著的進展,尤其是關於秩統計量與u 統計量的大樣本理論,及基於這種理論的大樣本非引數方法,研究成果很多。

非引數統計

非引數統計 nonparametric statistics 隱藏 編輯 非引數統計是統計學的乙個重要分支,它在實踐中有著廣泛的應用。所謂統計推斷,就是由樣本觀察值去了解總體,它是統計學的基本任務之一。若根據經驗或某種理論我們能在推斷之前就對總體作一些假設,則這些假設無疑有助於提高統計推斷的效率。這...

非引數統計的Python實現 HL 檢驗

調整秩和檢驗 aligned ranks test 也稱為 hodges lehmmann 檢驗,簡記為 hl 檢驗。當隨機完全區組設計的區組數較大或處理組數較小是,friedman 檢驗的效果就不是很好了,因為 friedman 檢驗的編秩是在每乙個區組內進行的,這種編秩的方法僅限於區組內的效應,...

非引數統計的Python實現 符號檢驗

符號檢驗 sign test 是非引數統計中最古老的檢驗方法之一,僅通過符號 和 的個數來檢驗分位數。現有28位學生某門課程的成績資料,為 95 89 68 90 88 60 81 67 60 60 60 63 60 92 60 88 88 87 60 73 60 97 91 60 83 87 81...