# 基本概念

原假设H0H_0,是被检验的假设,或称零假设

备择假设H1H_1,与原假设互斥,不一定要和原假设对立

简单假设:假设中θ\theta 的取值只有一个参数

复合假设:假设中θ\theta 的取值为区间

由于做检验 = 怀疑,我们更关注于啥时候拒绝原假设,因此记:

  • xWx\in W拒绝域):就拒绝H0H_0,认为H1H_1 成立;
  • xWcx\in W^c接受域):接受H0H_0,认为H0H_0 成立

检验函数

φ(x)={1,xW0,xW\varphi(x)=\begin{cases}1,&x\in W\\0,&x\notin W&\end{cases}

φ(x)=1\varphi(x)=1 时,拒绝H0H_0;否则接受H0H_0

#

第一类错误:弃真,其概率为:

α(θ)=Pθ{xW},θΘ0\alpha(\theta)=P_\theta\{x\in W\},\theta\in \Theta_0

第二类错误:取伪,其概率为:

β(θ)=Pθ{xW}=1Pθ{xW},θΘ1\beta(\theta)=P_\theta\{x\notin W\}=1-P_\theta\{x\in W\},\theta\in\Theta_1

检验的势(power) 为:H0H_0 不成立时拒绝它的概率,
换句话说就是 ——“我拒绝对了” or “杀伐果断,我杀对了”

γ(θ)=Pθ{xW}=1β(θ),θΘ1\gamma(\theta)=P_\theta\{x\in W\}=1-\beta(\theta),\theta\in\Theta_1

Neyman-Pearson 检验原理就是控制犯第一类错误的概率在给定的范围内,寻找检验使得犯第二类错误的概率尽可能的小(等价于让检验的势尽可能的大)——

我本来就因为怀疑才检验,所以 **“宁可错杀三千,绝不放过一个”**

这样就是给定一个较小的数α\alpha0<α<10<\alpha<1),一般取为 0.01,0.05,0.1 等,然后寻找一个更大的势;我们将α\alpha 称为显著性水平

因此,我们捏出一个函数称为势函数,含义为无论哪个假设真正成立,拒绝它的可能性

g(θ)=Eθ(φ(x))={α(θ), θΘ0γ(θ), θΘ1g(\theta)=E_\theta(\varphi(x))= \begin{cases} \alpha(\theta),~ & \theta \in \Theta_{0} \\ \gamma(\theta),~ & \theta \in \Theta_{1} \end{cases}

当原假设成立,势函数就是我们要控制的显著性水平;当备择假设成立,势函数就是势的大小

# 似然比检验

# 俩等于问题

检验问题:

H0:  θ=θ0H1:  θ=θ1\begin{align*} &H_0:\;\theta=\theta_0&\\ &H_1:\;\theta=\theta_1& \end{align*}

计算似然比:

λ(x)=p(x1,x2,...,xn,θ1)p(x1,x2,...,xn,θ0)\lambda(x)=\dfrac{p(x_1,x_2,...,x_n,\theta_1)}{p(x_1,x_2,...,x_n,\theta_0)}

λ(x)\lambda(x) 较大时,拒绝原假设H0H_0;拒绝域为W={x:λ(x)c}W = \{ x: \lambda(x) \geq c \}

# 俩区间问题

检验问题:

H0:θΘ0H1:θΘ1\begin{align*} H_0:\theta\in\Theta_0\\ H_1:\theta\in\Theta_1 \end{align*}

计算似然比(其中Θ0Θ1=Θ\Theta_0 \cup \Theta_1 = \Theta):

λ(x)=supθΘ{p(x1,,xn,θ)}supθΘ0{p(x1,,xn,θ)}\lambda(x)=\dfrac{\sup_{\theta\in\Theta}\{p(x_1,\cdots,x_n,\theta)\}}{\sup_{\theta\in\Theta_0}\{p(x_1,\cdots,x_n,\theta)\}}

λ(x)\lambda(x) 较大时,拒绝原假设H0H_0;拒绝域为W={x:λ(x)c}W = \{ x: \lambda(x) \geq c \}

  • 对于μ,σ2\mu,\sigma^2 未知的正态分布,极大似然估计结果:

μ^=xˉ\widehat\mu=\bar xσ^2=1ni=1n(xixˉ)2\widehat\sigma^2=\dfrac{1}{n}\sum\limits^n_{i=1}(x_i-\bar x)^2

  • 已知μ=μ0\mu=\mu_0σ2\sigma^2 的极大似然估计为:

σ^02=1ni=1n(xiμ0)2\widehat\sigma_0^2=\dfrac{1}{n}\sum\limits^n_{i=1}(x_i-\mu_0)^2

# 最优势检验(MPT)

俩等于问题 中,在显著性α\alpha 上界一定的情况下,势最大的检验函数

问题是否存在 MPT,怎么构造,需要用到 N-P 引理

  • 基础

我们会用到似然比,计算方式:

L(x)=p(x,θ1)p(x,θ0)L(x) = \dfrac {p(x, \theta _1)} {p( x, \theta _0) }

规定:

  1. p(x,θ0)=0,p(x,θ1)>0p(x,\theta_0)=0,p(x,\theta_1)>0 时,L(x)=L(x)=\infty

  2. p(x,θ0)=p(x,θ1)=0p(x,\theta_0)=p(x,\theta_1)=0 时,L(x)=0L(x)=0

  • 引理内容

(1)存在常数k0k\geq0 及检验函数满足:

φ(x)={1,L(x)>k0,L(x)<k\varphi(x)=\begin{cases}1,&L(x)>k\\0,&L(x)<k\end{cases}

则检验φ(x)\varphi(x) 是水平α\alpha MPT

Eθ0(φ(x))=αE_{\theta_0}(\varphi(x))=\alpha(第一类错误概率取上界)

(2)如果φ(x)\varphi(x) 是水平为α\alpha 的 MPT,则必存在常数k0k\geq0,使得φ(x)\varphi(x) 满足(1)中的式子;若φ\varphi 的势满足Eθ0(φ(x))<1E_{\theta_0}(\varphi(x))<1,则φ(x)\varphi(x) 满足Eθ0(φ(x))=αE_{\theta_0}(\varphi(x))=\alpha

  • 离散特殊情况

L(x)L(x)离散随机变量时,MPT 的检验统计量为:

φ(x)={1,L(x)>kαPθ0{L(x)>k}Pθ0{L(x)=k},L(x)=k0,L(x)<k\varphi(x)= \begin{cases} 1,&L(x)>k\\ \dfrac{\alpha-P_{\theta_0}\{L(x)>k\}}{P_{\theta_0}\{L(x)=k\}},&L(x)=k\\ 0,&L(x)<k \end{cases}

其中常数kk 由以下公式决定:

Pθ0{L(x)k}αPθ0{L(x)>k}P_{\theta_0}\{L(x)\geq k\} \geq \alpha \geq P_{\theta_0}\{L(x)> k\}

永远记住α\alpha 由大于和等于两种情况组成

我们首先考虑大于情况,用尽量大的 k 占据α\alpha;然后在最边界的等于情况下,我们抛一个不均匀骰子,把α\alpha 剩余的值匀进去

我不会把 “等于情况” 的所有概率都塞进第一类错误中,那就爆仓了,大于α\alpha 了;我选取了 “等于情况” 的概率的一部分,最后塞到显著性为α\alpha 就停

# 一致最优势检验(UMPT)

UMPT=MPT 俩区间版

显著性一定,在任何拒绝域,UMPT 检验函数的势都最大!

# 无解情况

首先说一下没有 UMPT 的检验问题:

H0:  θ=θ0H1:  θθ0\begin{align*} &H_0:\;\theta=\theta_0&\\ &H_1:\;\theta\neq \theta_0& \end{align*}

以教科书的例子,正态分布的μ\mu 等于或不等于μ0\mu_0 为例

H0:  μ=μ0H1:  μμ0\begin{align*} &H_0:\;\mu=\mu_0&\\ &H_1:\;\mu\neq \mu_0& \end{align*}

书上用了反证法:

  1. 取类似常数函数的φ(x)α\varphi(x)\equiv \alpha,含义就是不管咋样,我就抛硬币 ——

没划分接受域拒绝域、不管原假设备择假设,
拒绝原假设的概率均为α\alpha
那么显著性和势大小均为α\alpha;那么 UMPT 检验的势在拒绝域都要α\ge \alpha

  1. 该问题的 UMPT 应该也是以下问题的 MPT——

H0:  μ=μ0H1:  μ=μ1(μ1>μ0)\begin{align*} &H_0:\;\mu=\mu_0&\\ &H_1:\;\mu=\mu_1&(\mu_1>\mu_0) \end{align*}

该问题的 MPT 在上一节有解过,MPT 检验函数为:

φ(x)={1,xˉμ0+σnu1α0,xˉ<μ0+σnu1α\varphi(x)=\begin{cases} 1,&\bar x\ge \mu_0+\dfrac{\sigma}{\sqrt n}u_{1-\alpha}\\ 0,&\bar x< \mu_0+\dfrac{\sigma}{\sqrt n}u_{1-\alpha} \end{cases}

且该 MPT 检验函数的势函数为

Eμ(φ(x))=Φ(nσ(μμ0)+uα)E_\mu(\varphi^*(x))=\Phi\Big(\dfrac{\sqrt n}{\sigma}(\mu-\mu_0)+u_{\alpha}\Big)

这里注意一个逻辑,我们是通过特殊情况推出了 UMPT 的形式,按理说无论μ1\mu_1 大于还是小于μ0\mu_0,都是这个检验函数,都是这个势函数

这个势函数是根据μ\mu 严格单调增的

  • μ=μ0\mu=\mu_0,势函数取值α\alpha
  • μ<μ0\mu<\mu_0,势函数小于α\alpha
  • μ>μ0\mu>\mu_0,势函数大于α\alpha
  1. 问题我们的拒绝域包含μ<μ0\mu<\mu_0μ>μ0\mu>\mu_0,在步骤 1 中我们还推出来 UMPT 的势始终大于等于α\alpha

矛盾

其实这个反证的本质就是 ——

  1. 备择假设μ=μ1<μ0\mu=\mu_1<\mu_0,MPT 拒绝域为{x:xˉμ0+σnu1α}\{x:\bar x\le \mu_0+\dfrac{\sigma}{\sqrt n}u_{1-\alpha}\}
  2. 备择假设μ=μ1>μ0\mu=\mu_1>\mu_0,MPT 拒绝域为{x:xˉμ0+σnu1α}\{x:\bar x\ge \mu_0+\dfrac{\sigma}{\sqrt n}u_{1-\alpha}\}

相应 MPT 拒绝域与备择假设有关,因此 UMPT 就不一定存在

# 单边检验

{H0:θ=θ0;H1:θ>θ0H0:θ=θ0;H1:θ<θ0H0:θθ0;H1:θ>θ0H0:θθ0;H1:θ<θ0\begin{cases} H_0{:}&\theta=\theta_0;&H_1{:}&\theta>\theta_0\\ H_0{:}&\theta=\theta_0;&H_1{:}&\theta<\theta_0\\ H_0{:}&\theta\leq\theta_0;&H_1{:}&\theta>\theta_0\\ H_0{:}&\theta\geq\theta_0;&H_1{:}&\theta<\theta_0 \end{cases}

对单边检验问题:

H0:  θθ0H1:  θ>θ0\begin{align*} &H_0:\;\theta\le\theta_0&\\ &H_1:\;\theta> \theta_0& \end{align*}

如果样本x1,x2,...,xnx_1,x_2,...,x_n 的联合密度p(x,θ)p(x,\theta) 是单参数的,
并可表示为:

p(x,θ)=d(θ)h(x)exp{c(θ)T(x)}p(x,\theta)=d(\theta)h(x)exp\{c(\theta)T(x)\}

其中c(θ)c(\theta) 是关于θ\theta 的严格单调增函数,则有:

(1)水平为α\alpha 的 UMPT 存在,其检验函数为

φ(x)={1,T(x)>cr,T(x)=c0,T(x)<c\varphi^*(x)=\begin{cases}1,&T(x)>c\\r,&T(x)=c\\0,&T(x)<c\end{cases}

其中常数ccr[0,1]r\in[0,1]Eθ0(φ(x))=αE_{\theta_0}(\varphi^*(x))=\alpha 确定(和 N-P 引理一样)。

(2)水平为α\alpha 的 UMPT 的势函数Eθ(φ(x))E_{\theta}\left(\varphi^{*}(x)\right)θ\theta 增函数。

(3)如果定理中的c(θ)c(\theta)θ\theta 的严格单减函数,则只需要将φ(x)\varphi^*(x) 条件中的不等号改变方向。

基于此,我们进行以下附加转换:

  1. 对假设检验问题:H0:  θ=θ0;H1:  θ>θ0H_0{:}\;\theta=\theta_0;\quad H_1{:}\;\theta>\theta_0,定理依然成立
  2. 剩下两种情况靠负号转换,依然可求 UMPT

# 双边检验

{H0:θ=θ0;H1:θθ0,H0:θ1θθ2;H1:θ<θ1 or θ>θ2H0:θθ1 or θθ2;H1:θ1<θ<θ2\begin{cases} H_0{:}&\theta=\theta_0;&H_1{:}&\theta\neq\theta_0,\\ H_0{:}&\theta_1\leq\theta\leq\theta_2;&H_1{:}&\theta<\theta_1\text{ or }\theta>\theta_2\\ H_0{:}&\theta\leq\theta_1\text{ or }\theta\geq\theta_2;&H_1{:}&\theta_1<\theta<\theta_2 \end{cases}

对双边检验问题:

H0:  θθ1 or θθ2H1:  θ1<θ<θ2\begin{align*} &H_0:\;\theta\leq\theta_1\text{ or }\theta\geq\theta_2\\ &H_1:\;\theta_1<\theta<\theta_2 \end{align*}

如果样本x1,x2,...,xnx_1,x_2,...,x_n 的联合密度p(x,θ)p(x,\theta) 是单参数的,
并可表示为:

p(x,θ)=d(θ)h(x)exp{c(θ)T(x)}p(x,\theta)=d(\theta)h(x)exp\{c(\theta)T(x)\}

其中c(θ)c(\theta) 是关于θ\theta 的严格单调增函数,则有水平为α\alpha 的 UMPT 存在,其检验函数为:

φ(x)={1c1<T(x)<c2riT(x)=ci,  i=1,20T(x)<c1 or T(x)>c2\varphi^*(x)=\begin{cases} 1&c_1<T(x)<c_2\\ r_i&T(x)=c_i,\;i=1,2\\ 0&T(x)<c_1\mathrm{~or~}T(x)>c_2 \end{cases}

其中四个常数ri,ci(i=1,2)r_i,c_i(i=1,2),由Eθ1(φ(x))=Eθ2(φ(x))=αE_{\theta_1}(\varphi^*(x))=E_{\theta_2}(\varphi^*(x))=\alpha 确定。

# 最优势无偏检验(UMPUT)

剩下还有两列双边检验没解决:

H0:  θ=θ0;H1:  θθ0,H0:  θ1θθ2;H1:  θ<θ1 or θ>θ2\begin{align*} &H_0:\;\theta=\theta_0;&H_1{:}&\;\theta\neq\theta_0,\\ &H_0:\;\theta_1\leq\theta\leq\theta_2;&H_1{:}&\;\theta<\theta_1\text{ or }\theta>\theta_2 \end{align*}

# 无偏检验

对于俩区间检验问题:

H0:θΘ0H1:θΘ1\begin{align*} H_0:\theta\in\Theta_0\\ H_1:\theta\in\Theta_1 \end{align*}

如果检验函数的势函数满足:

{g(θ)αfor  all  θΘ0g(θ)αfor  all  θΘ1\begin{cases} g(\theta)\le\alpha\quad for\;all\;\theta\isin\Theta_0\\ g(\theta)\ge\alpha\quad for\;all\;\theta\isin\Theta_1 \end{cases}

那么称该检验函数为水平为α\alpha 的无偏检验

由于常数函数φ(x)α\varphi(x)\equiv \alpha 的存在,UMPT 肯定都是 UMPUT

那么对于剩下的两类双边检验,有解决方法了 ——

检验函数池打个补丁,除了显著性水平位α\alpha,还要求都是无偏检验,
那么池子中势最大的检验即为最优势无偏检验(UMPUT)

# 闭区间或否问题

对双边检验问题:

H0:  θ1θθ2H1:  θ<θ1 or θ>θ2\begin{align*} &H_0:\;\theta_1\leq\theta\leq\theta_2\\ &H_1:\;\theta<\theta_1\text{ or }\theta>\theta_2 \end{align*}

如果样本x1,x2,...,xnx_1,x_2,...,x_n 的联合密度p(x,θ)p(x,\theta) 是单参数的,
并可表示为:

p(x,θ)=d(θ)h(x)exp{c(θ)T(x)}p(x,\theta)=d(\theta)h(x)exp\{c(\theta)T(x)\}

其中c(θ)c(\theta) 是关于θ\theta 的严格单调增函数,则有水平为α\alpha 的 UMPUT 存在,其检验函数为:

φ(x)={1T(x)<c1 or T(x)>c2riT(x)=ci,  i=1,20c1<T(x)<c2\varphi^*(x)=\begin{cases} 1&T(x)<c_1\mathrm{~or~}T(x)>c_2\\ r_i&T(x)=c_i,\;i=1,2\\ 0&c_1<T(x)<c_2 \end{cases}

其中四个常数ri,ci(i=1,2)r_i,c_i(i=1,2),由Eθ1(φ(x))=Eθ2(φ(x))=αE_{\theta_1}(\varphi^*(x))=E_{\theta_2}(\varphi^*(x))=\alpha 确定。

# 等或不等问题

对双边检验问题:

H0:  θ=θ0H1:  θθ0\begin{align*} &H_0:\;\theta=\theta_0&\\ &H_1:\;\theta\neq \theta_0& \end{align*}

如果样本x1,x2,...,xnx_1,x_2,...,x_n 的联合密度p(x,θ)p(x,\theta) 是单参数的,
并可表示为:

p(x,θ)=d(θ)h(x)exp{c(θ)T(x)}p(x,\theta)=d(\theta)h(x)exp\{c(\theta)T(x)\}

其中c(θ)c(\theta) 是关于θ\theta 的严格单调增函数,则有水平为α\alpha 的 UMPUT 存在,其检验函数为:

φ(x)={1T(x)<c1 or T(x)>c2riT(x)=ci,  i=1,20c1<T(x)<c2\varphi^*(x)=\begin{cases} 1&T(x)<c_1\mathrm{~or~}T(x)>c_2\\ r_i&T(x)=c_i,\;i=1,2\\ 0&c_1<T(x)<c_2 \end{cases}

其中四个常数ri,ci(i=1,2)r_i,c_i(i=1,2),由下式确定:

Eθ0(φ(x))=αEθ0(Tφ(x))=αEθ0(T)E_{\theta_0}(\varphi^*(x))=\alpha\\ E_{\theta_0}(T\varphi^*(x))=\alpha E_{\theta_0}(T)

此文章已被阅读次数:正在加载...更新于

谢谢你请我喝[茶]!(๑OvO๑)♪

柳小寒寒子 微信支付

微信支付