还是看一个栗子:
小明想了想在企业里上班没啥意思,还是出来报效祖国当兵吧,于是告别了心爱的小花,去了某陆军学校准备深造。但是看到当兵要求,发现非常严格的指明体重只要90kg以下,上下不能超过2kg,小明看了看自己的体重,95kg感觉没戏了,但是天无绝人之路,对于当兵的体重只是抽查,因为也实在没有那么多精力进行一个一个排查。小明准备滥竽充数一下。毕竟整体新入学的人有1000人,小明想了想,抽到自己的概率也就是1/1000,远远小于1%,可以认为是不可能事件。
然而上级突然想要开始巡查体重了,但是也是抽样调查,但是这次一次抽取50个人,直接放到一个特别大的秤上一起站着秤,然后取50个人的均值就可以,这个活动每周进行一次。
以上就是μ检验的一个案例。
简单来说,就是对样本均值的一个估计,看是否和总体均值相等的一个检验。之前的约会案例其实是简单的对于某一个事件进行估计,看这件事情的概率是大还是小,而现在是对样本的均值进行估计,看样本均值等于总体均值的概率是大还是小。本质是一样的,可以认为样本均值=需要检测的值;总体均值=锚定值。
那么问题来了,样本均值和总体均值之间有什么关系呢?答案是抽样估计的均值呈现以总体均值为均值(绕口令get),总体方差/n为方差的正态分布,即中心极限定理。
举个例子,还是二项分布的例子(正态分布是二项分布N趋向于无穷的连续近似);
1、比如抛4次硬币,其中有n面向上的二项分布图:
代码
x<-0:4 y<-dbinom(x,4,prob=0.5) barplot(y,x,width = 1,space = 0)对于这个二项分布,均值为2,方差为1。
五组数据和对应概率如下:
n p 0 0.0625 1 0.2500 2 0.3750 3 0.2500 4 0.0625
2、如果这时候我随便抽取4个数据,只能是有五种情况:
情况一:n=(0,1,2,3),均值=1.5 情况二:n=(0,1,2,4),均值=1.75 情况三:n=(0,1,3,4),均值=2 情况四:n=(0,2,3,4),均值=2.25 情况五:n=(1,2,3,4),均值=2.5
刚才提到总体均值为2,方差为1,则如果按照中心极限定理进行均值为2,方差为1/根号4,也就是0.5的正态分布进行画图得到:
那么在n=4抽样的结果中,可以看到我们要对五种情况1.5/1.75/2/2.25/2.5进行检验,也就是回到了小明的问题变种,比如检验样本一:均值1.5:
如果女神平均四次会出来2次,那么和我约了她四次,出来1.5次(暂且认为有1.5次)的话,我是不是和别人不一样?
其实不用检验也知道其实是一样的,但是如果用正态分布检验的话,就是常说的μ检验。
R中可以看到95分位数
qnorm(mean=2,sd=0.5,0.95)=2.82也就是说在单侧下,并且5%的置信区间内,只有样本均值>2.82才认为是小于5%的小概率事件。
对于样本均值这个正态曲线的标准差=总体标准差/根号n这个公式可以用开头的案例说明:
比如就抽取了小明一个人,那么n=1, 总体标准差是2,所以需要按照数量进行标准差的减小;同时,如果所有人,全部抽取,那么标准差和总体标准差没有区别;因为标准差是样本与总体均值的差异,换算到这里,就是样本均值和总体均值的差异了