失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > R语言与非参数检验之单样本位置检验

R语言与非参数检验之单样本位置检验

时间:2021-06-29 01:06:26

相关推荐

R语言与非参数检验之单样本位置检验

学习笔记

学习书目:《统计学:从数据到结论》–吴喜之

非参数检验

啥是非参数检验

很多检验都假定总体的背景分布,但也有些检验没有假定总体分布的具体形式,这些检验多根据数据观测值的相对大小建立检验统计量,然后找到在零假设下这些统计量的分布,并且看这些统计量的数据实现是否在零假设下属于小概率事件。这种和数据本身的总体分布无关的检验称为非参数检验。

非参数检验的优越性

在分布未知时,如果还假定总体有诸如正态分布那样的己知分布,在进行推断性统计时,就可能产生错误甚至灾难。非参数检验总是比传统检验安全,但在总体分布形式已知时,非参数检验就不如传统方法效率高,这是因为非参数的方法利用的信息要少一些,往往在传统方法可以拒绝零假设的情况下,非参数检验无法拒绝。但非参数统计在总体分布未知时,效率要比假定了错误总体分布时的传统方法要高,有时要高很多.

关于单样本位置检验

符号检验

符号检验,它是对位置参数中位数的检验,而且不需要任何关于总体的假定。当然,对于像正态分布或ttt分布那样的对称分布,总体中位数就是总体均值.这时,对中位数的检验等价于对均值的检验.

检验一般以两种形式出现,一种是看中位数或α\alphaα分位数是否是某个事先认定的值(零假设),一种是大于(或小于)某数的观测值是否为一个事先认定的比例(零假设).

符号秩检验的原理是这样的,有样本x1,x2,...,xnx_1,x_2,...,x_nx1​,x2​,...,xn​,如果零假设为中位数m=m0m=m_0m=m0​,则需要计算在n个差xi−m0(i=1,2,...,n)x_i-m_0(i=1,2,...,n)xi​−m0​(i=1,2,...,n)中有多少正负符号,即可利用二项分布的概率来计算ppp值,进而判断是否拒绝原假设。

Wilcoxon符号秩检验

符号检验利用了观察值和零假设的中位数之差的符号来进行检验,但是它并没有利用这些差的绝对值大小所包含的信息,不同的符号仅仅代表了在中位数的哪一边,而差的绝对值的秩的大小代表了距离中心的远近。如果把这两者结合在一起,自然比仅仅利用正负号的数目要更有效。这也是马上要引入的Wilcoxon符号秩检验的宗旨,它把差的绝对值的秩分别按照不同的符号相加作为其检验统计量。

与符号检验不同,Wilcoxon符号秩检验对数据总体分布有一点了解,它要求假定样本点来自连续对称总体分布,而符号检验不需要知道任何总体分布的性质。

Wilcoxon符号秩检验的原理是这样的,假定x1,x2,...,xnx_1,x_2,...,x_nx1​,x2​,...,xn​为来自连续对称总体的一个样本,如果零假设为中位数m=m0m=m_0m=m0​, 则需要把∣xi−m0∣|x_i -m_0|∣xi​−m0​∣排序,得到∣xi−m0∣|x_i -m_0|∣xi​−m0​∣的秩,然后把xi−m0x_i-m_0xi​−m0​的符号加到相应的秩上面。于是,可以得到既有带正号的秩,又有带负号的秩.对带负号的秩的绝对值求和.即把满足xi−m0<0x_i-m_0<0xi​−m0​<0 的∣xi−m0∣|x_i -m_0|∣xi​−m0​∣的秩求和,并用W−W^-W−表示;类似地,对带正号的秩的绝对值也求和,即把满足xi−m0>0x_i-m_0>0xi​−m0​>0 的∣xi−m0∣|x_i -m_0|∣xi​−m0​∣的秩求和,并用W+W^+W+表示.如果m0m_0m0​的确是中位数,那么W−W^-W−和W+W^+W+应该大体上差不多。如果W−W^-W−或W+W^+W+过大或过小,则怀疑中位数m=m0m=m_0m=m0​的零假设. 令W=min(W−,W+)W=min(W^-, W^+)W=min(W−,W+),则当WWW太小时,应该拒绝零假设,这个WWW就是Wilcoxon符号秩检验统计量。

R语言实现

我们现在有一个样本量为40的样本(假设总体分布是对称的):

74.3 78.8 68.8 78.0 70.4 80.5 80.5 69.7 71.2 73.579.5 75.6 75.0 78.8 72.0 72.0 72.0 74.3 71.2 72.075.0 73.5 78.8 74.3 75.8 65.0 74.3 71.2 69.7 68.073.5 75.0 72.0 64.3 75.8 80.3 69.7 74.3 73.5 73.5

经过计算,样本中位数为73.5,现在我做出如下零假设:

H0:m=74H1:m<74H_0:m=74 \\H_1:m <74 H0​:m=74H1​:m<74

现在我用上面学过的两种方法进行检验。

符号检验:

> pbinom(sum(new_data>74), 40, 0.5)[1] 0.4373147

Wilcoxon符号秩检验:

> wilcox.test(new_data, m=74, alternative = "less")Wilcoxon signed rank test with continuity correctiondata: new_dataV = 360, p-value = 0.2527alternative hypothesis: true location is less than 74

可以看到,虽然两个检验都不能拒绝原假设,但是Wilcoxon符号秩检验的ppp值要比符号检验的ppp值小很多。所以,当数据来自对称分布时,Wilcoxon符号秩检验比符号检验效率要高。

如果觉得《R语言与非参数检验之单样本位置检验》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。