# 基本概念
原假设:H0,是被检验的假设,或称零假设
备择假设:H1,与原假设互斥,不一定要和原假设对立
简单假设:假设中θ 的取值只有一个参数
复合假设:假设中θ 的取值为区间
由于做检验 = 怀疑,我们更关注于啥时候拒绝原假设,因此记:
- 当x∈W(拒绝域):就拒绝H0,认为H1 成立;
- 当x∈Wc(接受域):接受H0,认为H0 成立
检验函数:
φ(x)={1,0,x∈Wx∈/W
当φ(x)=1 时,拒绝H0;否则接受H0
第一类错误:弃真,其概率为:
α(θ)=Pθ{x∈W},θ∈Θ0
第二类错误:取伪,其概率为:
β(θ)=Pθ{x∈/W}=1−Pθ{x∈W},θ∈Θ1
检验的势(power) 为:H0 不成立时拒绝它的概率,
换句话说就是 ——“我拒绝对了” or “杀伐果断,我杀对了”
γ(θ)=Pθ{x∈W}=1−β(θ),θ∈Θ1
Neyman-Pearson 检验原理就是控制犯第一类错误的概率在给定的范围内,寻找检验使得犯第二类错误的概率尽可能的小(等价于让检验的势尽可能的大)——
我本来就因为怀疑才检验,所以 **“宁可错杀三千,绝不放过一个”**
这样就是给定一个较小的数α(0<α<1),一般取为 0.01,0.05,0.1 等,然后寻找一个更大的势;我们将α 称为显著性水平
因此,我们捏出一个函数称为势函数,含义为无论哪个假设真正成立,拒绝它的可能性
g(θ)=Eθ(φ(x))={α(θ), γ(θ), θ∈Θ0θ∈Θ1
当原假设成立,势函数就是我们要控制的显著性水平;当备择假设成立,势函数就是势的大小
# 似然比检验
# 俩等于问题
检验问题:
H0:θ=θ0H1:θ=θ1
计算似然比:
λ(x)=p(x1,x2,...,xn,θ0)p(x1,x2,...,xn,θ1)
λ(x) 较大时,拒绝原假设H0;拒绝域为W={x:λ(x)≥c}
# 俩区间问题
检验问题:
H0:θ∈Θ0H1:θ∈Θ1
计算似然比(其中Θ0∪Θ1=Θ):
λ(x)=supθ∈Θ0{p(x1,⋯,xn,θ)}supθ∈Θ{p(x1,⋯,xn,θ)}
λ(x) 较大时,拒绝原假设H0;拒绝域为W={x:λ(x)≥c}
- 对于μ,σ2 未知的正态分布,极大似然估计结果:
μ=xˉ,σ2=n1i=1∑n(xi−xˉ)2
- 已知μ=μ0,σ2 的极大似然估计为:
σ02=n1i=1∑n(xi−μ0)2
# 最优势检验(MPT)
在 俩等于问题 中,在显著性α 上界一定的情况下,势最大的检验函数
问题是否存在 MPT,怎么构造,需要用到 N-P 引理:
我们会用到似然比,计算方式:
L(x)=p(x,θ0)p(x,θ1)
规定:
-
当p(x,θ0)=0,p(x,θ1)>0 时,L(x)=∞;
-
当p(x,θ0)=p(x,θ1)=0 时,L(x)=0
(1)存在常数k≥0 及检验函数满足:
φ(x)={1,0,L(x)>kL(x)<k
则检验φ(x) 是水平α 的 MPT
且Eθ0(φ(x))=α(第一类错误概率取上界)
(2)如果φ(x) 是水平为α 的 MPT,则必存在常数k≥0,使得φ(x) 满足(1)中的式子;若φ 的势满足Eθ0(φ(x))<1,则φ(x) 满足Eθ0(φ(x))=α
当L(x) 为离散随机变量时,MPT 的检验统计量为:
φ(x)=⎩⎨⎧1,Pθ0{L(x)=k}α−Pθ0{L(x)>k},0,L(x)>kL(x)=kL(x)<k
其中常数k 由以下公式决定:
Pθ0{L(x)≥k}≥α≥Pθ0{L(x)>k}
永远记住α 由大于和等于两种情况组成
我们首先考虑大于情况,用尽量大的 k 占据α;然后在最边界的等于情况下,我们抛一个不均匀骰子,把α 剩余的值匀进去
我不会把 “等于情况” 的所有概率都塞进第一类错误中,那就爆仓了,大于α 了;我选取了 “等于情况” 的概率的一部分,最后塞到显著性为α 就停
# 一致最优势检验(UMPT)
UMPT=MPT 俩区间版
显著性一定,在任何拒绝域,UMPT 检验函数的势都最大!
# 无解情况
首先说一下没有 UMPT 的检验问题:
H0:θ=θ0H1:θ=θ0
以教科书的例子,正态分布的μ 等于或不等于μ0 为例
H0:μ=μ0H1:μ=μ0
书上用了反证法:
- 取类似常数函数的φ(x)≡α,含义就是不管咋样,我就抛硬币 ——
没划分接受域拒绝域、不管原假设备择假设,
拒绝原假设的概率均为α;
那么显著性和势大小均为α;那么 UMPT 检验的势在拒绝域都要≥α
- 该问题的 UMPT 应该也是以下问题的 MPT——
H0:μ=μ0H1:μ=μ1(μ1>μ0)
该问题的 MPT 在上一节有解过,MPT 检验函数为:
φ(x)=⎩⎨⎧1,0,xˉ≥μ0+nσu1−αxˉ<μ0+nσu1−α
且该 MPT 检验函数的势函数为
Eμ(φ∗(x))=Φ(σn(μ−μ0)+uα)
这里注意一个逻辑,我们是通过特殊情况推出了 UMPT 的形式,按理说无论μ1 大于还是小于μ0,都是这个检验函数,都是这个势函数
这个势函数是根据μ 严格单调增的
- 当μ=μ0,势函数取值α;
- μ<μ0,势函数小于α;
- μ>μ0,势函数大于α
- 问题我们的拒绝域包含μ<μ0 和μ>μ0,在步骤 1 中我们还推出来 UMPT 的势始终大于等于α
矛盾
其实这个反证的本质就是 ——
- 备择假设μ=μ1<μ0,MPT 拒绝域为{x:xˉ≤μ0+nσu1−α}
- 备择假设μ=μ1>μ0,MPT 拒绝域为{x:xˉ≥μ0+nσu1−α}
相应 MPT 拒绝域与备择假设有关,因此 UMPT 就不一定存在
# 单边检验
⎩⎨⎧H0:H0:H0:H0:θ=θ0;θ=θ0;θ≤θ0;θ≥θ0;H1:H1:H1:H1:θ>θ0θ<θ0θ>θ0θ<θ0
对单边检验问题:
H0:θ≤θ0H1:θ>θ0
如果样本x1,x2,...,xn 的联合密度p(x,θ) 是单参数的,
并可表示为:
p(x,θ)=d(θ)h(x)exp{c(θ)T(x)}
其中c(θ) 是关于θ 的严格单调增函数,则有:
(1)水平为α 的 UMPT 存在,其检验函数为
φ∗(x)=⎩⎨⎧1,r,0,T(x)>cT(x)=cT(x)<c
其中常数c 和r∈[0,1] 由Eθ0(φ∗(x))=α 确定(和 N-P 引理一样)。
(2)水平为α 的 UMPT 的势函数Eθ(φ∗(x)) 是θ 增函数。
(3)如果定理中的c(θ) 是θ 的严格单减函数,则只需要将φ∗(x) 条件中的不等号改变方向。
基于此,我们进行以下附加转换:
- 对假设检验问题:H0:θ=θ0;H1:θ>θ0,定理依然成立
- 剩下两种情况靠负号转换,依然可求 UMPT
# 双边检验
⎩⎨⎧H0:H0:H0:θ=θ0;θ1≤θ≤θ2;θ≤θ1 or θ≥θ2;H1:H1:H1:θ=θ0,θ<θ1 or θ>θ2θ1<θ<θ2
对双边检验问题:
H0:θ≤θ1 or θ≥θ2H1:θ1<θ<θ2
如果样本x1,x2,...,xn 的联合密度p(x,θ) 是单参数的,
并可表示为:
p(x,θ)=d(θ)h(x)exp{c(θ)T(x)}
其中c(θ) 是关于θ 的严格单调增函数,则有水平为α 的 UMPT 存在,其检验函数为:
φ∗(x)=⎩⎨⎧1ri0c1<T(x)<c2T(x)=ci,i=1,2T(x)<c1 or T(x)>c2
其中四个常数ri,ci(i=1,2),由Eθ1(φ∗(x))=Eθ2(φ∗(x))=α 确定。
# 最优势无偏检验(UMPUT)
剩下还有两列双边检验没解决:
H0:θ=θ0;H0:θ1≤θ≤θ2;H1:H1:θ=θ0,θ<θ1 or θ>θ2
# 无偏检验
对于俩区间检验问题:
H0:θ∈Θ0H1:θ∈Θ1
如果检验函数的势函数满足:
{g(θ)≤αforallθ∈Θ0g(θ)≥αforallθ∈Θ1
那么称该检验函数为水平为α 的无偏检验
由于常数函数φ(x)≡α 的存在,UMPT 肯定都是 UMPUT
那么对于剩下的两类双边检验,有解决方法了 ——
检验函数池打个补丁,除了显著性水平位α,还要求都是无偏检验,
那么池子中势最大的检验即为最优势无偏检验(UMPUT)
# 闭区间或否问题
对双边检验问题:
H0:θ1≤θ≤θ2H1:θ<θ1 or θ>θ2
如果样本x1,x2,...,xn 的联合密度p(x,θ) 是单参数的,
并可表示为:
p(x,θ)=d(θ)h(x)exp{c(θ)T(x)}
其中c(θ) 是关于θ 的严格单调增函数,则有水平为α 的 UMPUT 存在,其检验函数为:
φ∗(x)=⎩⎨⎧1ri0T(x)<c1 or T(x)>c2T(x)=ci,i=1,2c1<T(x)<c2
其中四个常数ri,ci(i=1,2),由Eθ1(φ∗(x))=Eθ2(φ∗(x))=α 确定。
# 等或不等问题
对双边检验问题:
H0:θ=θ0H1:θ=θ0
如果样本x1,x2,...,xn 的联合密度p(x,θ) 是单参数的,
并可表示为:
p(x,θ)=d(θ)h(x)exp{c(θ)T(x)}
其中c(θ) 是关于θ 的严格单调增函数,则有水平为α 的 UMPUT 存在,其检验函数为:
φ∗(x)=⎩⎨⎧1ri0T(x)<c1 or T(x)>c2T(x)=ci,i=1,2c1<T(x)<c2
其中四个常数ri,ci(i=1,2),由下式确定:
Eθ0(φ∗(x))=αEθ0(Tφ∗(x))=αEθ0(T)