【通俗向】假设检验（二）：μ检验

xiaoxiao2021-03-25 202

还是看一个栗子：

小明想了想在企业里上班没啥意思，还是出来报效祖国当兵吧，于是告别了心爱的小花，去了某陆军学校准备深造。但是看到当兵要求，发现非常严格的指明体重只要90kg以下，上下不能超过2kg，小明看了看自己的体重，95kg感觉没戏了，但是天无绝人之路，对于当兵的体重只是抽查，因为也实在没有那么多精力进行一个一个排查。小明准备滥竽充数一下。毕竟整体新入学的人有1000人，小明想了想，抽到自己的概率也就是1/1000，远远小于1%，可以认为是不可能事件。

然而上级突然想要开始巡查体重了，但是也是抽样调查，但是这次一次抽取50个人，直接放到一个特别大的秤上一起站着秤，然后取50个人的均值就可以，这个活动每周进行一次。

以上就是μ检验的一个案例。

简单来说，就是对样本均值的一个估计，看是否和总体均值相等的一个检验。之前的约会案例其实是简单的对于某一个事件进行估计，看这件事情的概率是大还是小，而现在是对样本的均值进行估计，看样本均值等于总体均值的概率是大还是小。本质是一样的，可以认为样本均值=需要检测的值；总体均值=锚定值。

那么问题来了，样本均值和总体均值之间有什么关系呢？答案是抽样估计的均值呈现以总体均值为均值（绕口令get），总体方差/n为方差的正态分布，即中心极限定理。

举个例子，还是二项分布的例子（正态分布是二项分布N趋向于无穷的连续近似）；

1、比如抛4次硬币，其中有n面向上的二项分布图：

代码

x<-0:4 y<-dbinom(x,4,prob=0.5) barplot(y,x,width = 1,space = 0)

对于这个二项分布，均值为2，方差为1。

五组数据和对应概率如下：

n p 0 0.0625 1 0.2500 2 0.3750 3 0.2500 4 0.0625

2、如果这时候我随便抽取4个数据，只能是有五种情况：

情况一：n=(0,1,2,3)，均值=1.5 情况二：n=(0,1,2,4)，均值=1.75 情况三：n=(0,1,3,4)，均值=2 情况四：n=(0,2,3,4)，均值=2.25 情况五：n=(1,2,3,4)，均值=2.5

刚才提到总体均值为2，方差为1，则如果按照中心极限定理进行均值为2，方差为1/根号4，也就是0.5的正态分布进行画图得到：

那么在n=4抽样的结果中，可以看到我们要对五种情况1.5/1.75/2/2.25/2.5进行检验，也就是回到了小明的问题变种，比如检验样本一：均值1.5：

如果女神平均四次会出来2次，那么和我约了她四次，出来1.5次（暂且认为有1.5次）的话，我是不是和别人不一样？

其实不用检验也知道其实是一样的，但是如果用正态分布检验的话，就是常说的μ检验。

R中可以看到95分位数

qnorm(mean=2,sd=0.5,0.95)=2.82

也就是说在单侧下，并且5%的置信区间内，只有样本均值>2.82才认为是小于5%的小概率事件。

对于样本均值这个正态曲线的标准差=总体标准差/根号n这个公式可以用开头的案例说明：

比如就抽取了小明一个人，那么n=1，总体标准差是2，所以需要按照数量进行标准差的减小；同时，如果所有人，全部抽取，那么标准差和总体标准差没有区别；因为标准差是样本与总体均值的差异，换算到这里，就是样本均值和总体均值的差异了

转载请注明原文地址: https://ju.6miu.com/read-1013.html

技术

最新回复(0)