# 基础知识

# 概念

对多变量总体,一次同时观测pp 个变量,
我们将每次观测的结果称为一个样品nn 个样品形成一个样本

随机向量pp 个随机变量组一块,X=(X1,X2,,Xp)TX=(X_1, X_2, \cdots, X_p)^T

独立:联合分布函数 =\prod 各自分布函数;或联合分布密度 =\prod 各自分布密度

pp 个随机变量相互独立    \implies 任何两个随机变量相互独立
反之不能推出!!!

# 数值特征

# 均值

定义均值向量μ\mu (要求所有E(Xi)E(X_i) 存在):

E(X)=[E(X1)E(X2)E(Xp)]=[μ1μ2μp]=μE(X)=\begin{bmatrix}E(X_1)\\E(X_2)\\\vdots\\E(X_p)\end{bmatrix}=\begin{bmatrix}\mu_1\\\mu_2\\\vdots\\\mu_p\end{bmatrix}=\mu

  • E(AX)=AE(X)E(AX)=AE(X)
  • E(AXB)=AE(X)BE(AXB)=AE(X)B

# 方差

pp 维随机向量XX协方差阵

Σ=cov(X,X)=E[(XEX)(XEX)T]=D(X)=[D(X1)cov(X1,X2)cov(X1,Xp)cov(X2,X1)D(X2)cov(X2,Xp)cov(Xp,X1)cov(Xp,X2)D(Xp)]=(σij)\begin{align*} \varSigma &= \text{cov}(X, X) = E[(X - EX)(X - EX)^T] = D(X) \\\\ &= \begin{bmatrix} D(X_1) & \text{cov}(X_1, X_2) & \cdots & \text{cov}(X_1, X_p) \\ \text{cov}(X_2, X_1) & D(X_2) & \cdots & \text{cov}(X_2, X_p) \\ \vdots & \vdots & \ddots & \vdots \\ \text{cov}(X_p, X_1) & \text{cov}(X_p, X_2) & \cdots & D(X_p) \end{bmatrix} \\\\ &= (\sigma_{ij}) \end{align*}

称行列式cov(X,X)\vert \text{cov}(X, X) \vertXX广义方差

  1. D(AX)=AD(X)AT=AΣATD(AX) = AD(X)A^T = A\varSigma A^T
  2. cov(AX,BY)=Acov(X,Y)BT\text{cov}(AX, BY) = A\text{cov}(X, Y)B^T
  3. E(XTAX)=tr(AΣ)+μTAμE(X^T AX) = tr(A\varSigma) + \mu^T A\mu

随机向量X=(X1,X2,,Xp)TX=(X_1, X_2, \cdots, X_p)^T, 其协方差阵Σ\varSigma 都是对称阵,同时总是半正定的,大多数情形下是正定的。

半正定:所有特征值大于等于 0,所有的主子式(即行列式的前几个小矩阵)必须都不小于 0

正定:所有特征值大于 0,所有的主子式必须都严格大于 0

随机向量XX相关阵

R=corr(X,X)=[1corr(X1,X2)corr(X1,Xp)corr(X2,X1)1corr(X2,Xp)corr(Xp,X1)corr(Xp,X2)1]\begin{align*} R &= \text{corr}(X, X) \\\\ &= \begin{bmatrix} 1 & \text{corr}(X_1, X_2) & \cdots & \text{corr}(X_1, X_p) \\ \text{corr}(X_2, X_1) & 1 & \cdots & \text{corr}(X_2, X_p) \\ \vdots & \vdots & \ddots & \vdots \\ \text{corr}(X_p, X_1) & \text{corr}(X_p, X_2) & \cdots & 1 \end{bmatrix} \\\\ \end{align*}

为克服不同指标量纲的影响,我们对变量做标准化

Xj=XjE(Xj)D(Xj),j=1,2,,pX=(X1,X2,,Xp)TX_j^* = \dfrac{X_j - E(X_j)}{\sqrt{D(X_j)}}, \quad j = 1, 2, \cdots, p\\\\ X^* = (X_1^*, X_2^*, \cdots, X_p^*)^T

此时E(X)=0E(X^*) = 0D(X)=E[XXT]=corr(X)=RD(X^*) = E[X^* X^{*T}] = \text{corr}(X) = R

对于抽样出来的样本,则有:

Σ=cov(X,X)=1n1(XXˉ)(XXˉ)T\begin{align*} \varSigma &= \text{cov}(X, X) \\\\ &= \frac{1}{n-1}(X-\bar X)(X-\bar X)^T\\ \end{align*}

iijj 列的位置,恰好是对应的乘积

此时:

R=1n1XXTR= \frac{1}{n-1}X^*{X^*}^T

# 多元正态分布

# 概念

XXpp 维正态随机变量,即XNp(μ,V)X \sim N_p(\mu, V) 时,其密度函数为:

f(x1,x2,,xp)=1(2π)p2V12exp{12(Xμ)TV1(Xμ)}f(x_1, x_2, \cdots, x_p) = \frac{1}{(2 \pi)^{\frac{p}{2}} |V|^{\frac{1}{2}}} \exp \left\{ -\frac{1}{2} (X - \mu)^T V^{-1} (X - \mu) \right\}

其中μ\mu 是均值向量,VV 是协方差矩阵,且V>0V>0
V=0|V| = 0 时,XX 的分布维度退化,即这pp 个随机变量线性相关

换个定义方式:若对任何非零向量aRpa \in R^pXX 的线性组合aTXa^T X 服从一元正态分布N(aTμ,aTVa)N(a^T \mu, a^T V a),则称XX 服从pp 元正态分布Np(μ,V)N_p(\mu, V)

# 性质

  1. pp 维正态分布由其均值向量和协方差阵唯一确定
  2. 对于任一 pp 维向量μ\mupp 阶非负定矩阵VV,必存在pp 维正态随机向量XNp(μ,V)X \sim N_p(\mu, V).
  3. XNp(μ,V)X \sim N_p(\mu, V)AAm×pm \times p 常数矩阵, bbmm 维向量, 若令Y=AX+bY = AX + b, 则YNp(Aμ+b,AVAT)Y \sim N_p(A\mu + b, AVA^T).
  4. XXpp 维正态随机向量的充要条件为对任一pp 维向量cccTXc^TX 是一维正态随机变量(书上写的,别纠结于零向量了)
  5. X=(X1T,X2T)TX=(X_1^T, X_2^T)^T 为多维正态随机向量, 则X1X_1X2X_2 互不相关的充要条件是X1X_1X2X_2 相互独立(多元正态分布的随机向量中,元素不相关就是独立)
  6. XNp(μ,V)X \sim N_p(\mu, V), 则rank(V)=mrank(V)=m 的充要条件是存在m×pm \times p 的矩阵B(BBT=V)B(BB^T = V) 使得X=BY+μX = BY+\mu, 其中YNm(0,Im)Y \sim N_m(0, I_m)
  7. XNp(μ,V)X \sim N_p(\mu, V), 且V0\vert V\vert\neq0, 则 η(Xμ)TV1(Xμ)χ2(p)\eta \triangleq (X - \mu)^T V^{-1}(X - \mu) \sim \chi^2(p)(半正定矩阵满秩,那么该矩阵正定)

# 多元正态条件分布

将多元正态分布的随机向量分块:X=(X1X2)X=\begin{pmatrix}X_1\\X_2 \end{pmatrix},长度分别为kkpkp-k

则可得到:

μ=(μ1μ2),  V=(V11V12V21V22)\mu=\begin{pmatrix}\mu_1\\\mu_2 \end{pmatrix},\;V=\begin{pmatrix}V_{11}&V_{12}\\V_{21}&V_{22}\end{pmatrix}

给定X2X_2 时,X1X_1 的条件分布为Nk(μ12,V112)N_k(\mu_{1\cdot2},V_{11\cdot2}),其中:

μ12=μ1+V12V221(X2μ2)V112=V11V12V221V21\begin{align*} \mu_{1\cdot2}=&\mu_1+V_{12}V_{22}^{-1}(X_2-\mu_2)\\ V_{11\cdot2}=&V_{11}-V_{12}V_{22}^{-1}V_{21} \end{align*}

同样,给定X1X_1 时,X2X_2 的条件分布为Nk(μ21,V221)N_k(\mu_{2\cdot1},V_{22\cdot1}),把上式中所有 1 换成 2、2 换成 1 即可

偏相关系数:给定X3X_3(扣除了X3X_3 的影响之后),X1X_1X2X_2 的相关系数

# 均值向量与协方差阵的估计

首先注意样本的形状为Xn×pX_{n\times p},把每个随机向量样品横过来作行了,一共nn

化简的联合分布密度函数:

p(X;μ;V)=(2π)np2Vn2exp{12tr{V1[S+n(xˉμ)(xˉμ)T]}}\large p(X;\mu;V)=(2\pi)^{-\frac{np}{2}}|V|^{-\frac{n}{2}}exp\Big\{-\frac{1}{2}tr\{V^{-1}[S+n(\bar x-\mu)(\bar x-\mu)^T]\}\Big\}

其中Xˉ=1nk=1nXk\bar X=\dfrac{1}{n}\sum^n_{k=1}X_kS=k=1n(XkXˉ)(XkXˉ)TS=\sum^n_{k=1}(X_k-\bar X)(X_k-\bar X)^T

在化简过程中,我们用到的矩阵的迹的性质 ——

  • 矩阵的循环置换不会改变迹的值,即tr(ABC)=tr(BCA)=tr(CBA)tr(ABC)=tr(BCA)=tr(CBA)
  • 对于常数aaa=tr(a)a=tr(a)

这里的SS 不是样本协方差矩阵!!!而是样本的离差矩阵!!!
样本协方差矩阵的计算之前也给过了,(n1)(n-1) 样本协方差矩阵 = 样本离差矩阵

重要结论:

  • X\overline Xμ\mu 的极大似然估计

  • 1nS\frac 1 n S(离差矩阵)是VV 的极大似然估计

  • X\overline Xμ\mu 的 UMVUE

  • 1n1S\frac 1 {n-1} SVV 的 UMVUE

  • XNp(μ,1nV)\overline{X}\sim N_p\left(\mu,\frac1nV\right), 且X\overline{X}SS 相互独立.

  • SWp(n1,V)S\sim W_p(n-1,V), 即自由度为n1n-1 的 Wishart 分布.

# 均值向量值检验

# V 已知

对于检验问题:

H0:  μ=μ0H1:  μμ0\begin{align*} &H_0:\;\mu=\mu_0&\\ &H_1:\;\mu\neq \mu_0& \end{align*}

给定显著性水平为α\alpha,计算:

D=n(Xˉμ0)TV1(Xˉμ0)D=n(\bar X-\mu_0)^TV^{-1}(\bar X-\mu_0)

Dχ1α2(p)D\ge \chi^2_{1-\alpha}(p),拒绝

# V 未知

与上差不多,计算:

F=np(np)(Xˉμ0)TS1(Xˉμ0)F=\dfrac{n}{p}(n-p)(\bar X-\mu_0)^TS^{-1}(\bar X-\mu_0)

FF1α(p,np)F\ge F_{1-\alpha}(p,n-p),拒绝

# 两个正态总体均值相等检验

# V 已知

计算:

D=n1n2n1+n2n(XˉYˉ)TV1(XˉYˉ)D=\dfrac{n_1n_2}{n_1+n_2}n(\bar X-\bar Y)^TV^{-1}(\bar X-\bar Y)

Dχ1α2(p)D\ge \chi^2_{1-\alpha}(p),拒绝

# V 未知

计算:

V^=(n11)V^1+(n21)V^2n1+n22F=n1n2(n1+n2p1)p(n1+n2)(n1+n22)(XˉYˉ)TV^1(XˉYˉ)\widehat V=\dfrac{(n_1-1)\widehat V_1+(n_2-1)\widehat V_2}{n_1+n_2-2} \\\\ F=\dfrac{n_1n_2(n_1+n_2-p-1)}{p(n_1+n_2)(n_1+n_2-2)}(\bar X-\bar Y)^T\widehat V^{-1}(\bar X-\bar Y)

FF1α(p,n1+n2p1)F\ge F_{1-\alpha}(p,n_1+n_2-p-1),拒绝

此文章已被阅读次数:正在加载...更新于

谢谢你请我喝[茶]!(๑OvO๑)♪

柳小寒寒子 微信支付

微信支付