# 基础知识
# 概念
对多变量总体,一次同时观测p 个变量,
我们将每次观测的结果称为一个样品,n 个样品形成一个样本
随机向量:p 个随机变量组一块,X=(X1,X2,⋯,Xp)T
独立:联合分布函数 =∏ 各自分布函数;或联合分布密度 =∏ 各自分布密度
p 个随机变量相互独立⟹ 任何两个随机变量相互独立
反之不能推出!!!
# 数值特征
# 均值
定义均值向量μ (要求所有E(Xi) 存在):
E(X)=E(X1)E(X2)⋮E(Xp)=μ1μ2⋮μp=μ
- E(AX)=AE(X)
- E(AXB)=AE(X)B
# 方差
p 维随机向量X 的协方差阵:
Σ=cov(X,X)=E[(X−EX)(X−EX)T]=D(X)=D(X1)cov(X2,X1)⋮cov(Xp,X1)cov(X1,X2)D(X2)⋮cov(Xp,X2)⋯⋯⋱⋯cov(X1,Xp)cov(X2,Xp)⋮D(Xp)=(σij)
称行列式∣cov(X,X)∣ 为X 的广义方差
- D(AX)=AD(X)AT=AΣAT
- cov(AX,BY)=Acov(X,Y)BT
- E(XTAX)=tr(AΣ)+μTAμ
随机向量X=(X1,X2,⋯,Xp)T, 其协方差阵Σ 都是对称阵,同时总是半正定的,大多数情形下是正定的。
半正定:所有特征值大于等于 0,所有的主子式(即行列式的前几个小矩阵)必须都不小于 0
正定:所有特征值大于 0,所有的主子式必须都严格大于 0
随机向量X 的相关阵:
R=corr(X,X)=1corr(X2,X1)⋮corr(Xp,X1)corr(X1,X2)1⋮corr(Xp,X2)⋯⋯⋱⋯corr(X1,Xp)corr(X2,Xp)⋮1
为克服不同指标量纲的影响,我们对变量做标准化:
Xj∗=D(Xj)Xj−E(Xj),j=1,2,⋯,pX∗=(X1∗,X2∗,⋯,Xp∗)T
此时E(X∗)=0,D(X∗)=E[X∗X∗T]=corr(X)=R
对于抽样出来的样本,则有:
Σ=cov(X,X)=n−11(X−Xˉ)(X−Xˉ)T
i 行j 列的位置,恰好是对应的乘积
此时:
R=n−11X∗X∗T
# 多元正态分布
# 概念
X 为p 维正态随机变量,即X∼Np(μ,V) 时,其密度函数为:
f(x1,x2,⋯,xp)=(2π)2p∣V∣211exp{−21(X−μ)TV−1(X−μ)}
其中μ 是均值向量,V 是协方差矩阵,且V>0
当∣V∣=0 时,X 的分布维度退化,即这p 个随机变量线性相关
换个定义方式:若对任何非零向量a∈Rp,X 的线性组合aTX 服从一元正态分布N(aTμ,aTVa),则称X 服从p 元正态分布Np(μ,V)
# 性质
- p 维正态分布由其均值向量和协方差阵唯一确定
- 对于任一 p 维向量μ 及p 阶非负定矩阵V,必存在p 维正态随机向量X∼Np(μ,V).
- 设X∼Np(μ,V), A 是m×p 常数矩阵, b 是m 维向量, 若令Y=AX+b, 则Y∼Np(Aμ+b,AVAT).
- X 为p 维正态随机向量的充要条件为对任一p 维向量c, cTX 是一维正态随机变量(书上写的,别纠结于零向量了)
- 设X=(X1T,X2T)T 为多维正态随机向量, 则X1 与X2 互不相关的充要条件是X1 与X2 相互独立(多元正态分布的随机向量中,元素不相关就是独立)
- 设X∼Np(μ,V), 则rank(V)=m 的充要条件是存在m×p 的矩阵B(BBT=V) 使得X=BY+μ, 其中Y∼Nm(0,Im)
- 若X∼Np(μ,V), 且∣V∣=0, 则 η≜(X−μ)TV−1(X−μ)∼χ2(p)(半正定矩阵满秩,那么该矩阵正定)
# 多元正态条件分布
将多元正态分布的随机向量分块:X=(X1X2),长度分别为k 与p−k
则可得到:
μ=(μ1μ2),V=(V11V21V12V22)
给定X2 时,X1 的条件分布为Nk(μ1⋅2,V11⋅2),其中:
μ1⋅2=V11⋅2=μ1+V12V22−1(X2−μ2)V11−V12V22−1V21
同样,给定X1 时,X2 的条件分布为Nk(μ2⋅1,V22⋅1),把上式中所有 1 换成 2、2 换成 1 即可
偏相关系数:给定X3(扣除了X3 的影响之后),X1 与X2 的相关系数
# 均值向量与协方差阵的估计
首先注意样本的形状为Xn×p,把每个随机向量样品横过来作行了,一共n 行
化简的联合分布密度函数:
p(X;μ;V)=(2π)−2np∣V∣−2nexp{−21tr{V−1[S+n(xˉ−μ)(xˉ−μ)T]}}
其中Xˉ=n1∑k=1nXk,S=∑k=1n(Xk−Xˉ)(Xk−Xˉ)T,
在化简过程中,我们用到的矩阵的迹的性质 ——
- 矩阵的循环置换不会改变迹的值,即tr(ABC)=tr(BCA)=tr(CBA)
- 对于常数a,a=tr(a)
这里的S 不是样本协方差矩阵!!!而是样本的离差矩阵!!!
样本协方差矩阵的计算之前也给过了,(n−1) 样本协方差矩阵 = 样本离差矩阵
重要结论:
-
X 是μ 的极大似然估计
-
n1S(离差矩阵)是V 的极大似然估计
-
X 是μ 的 UMVUE
-
n−11S 是V 的 UMVUE
-
X∼Np(μ,n1V), 且X 与S 相互独立.
-
S∼Wp(n−1,V), 即自由度为n−1 的 Wishart 分布.
# 均值向量值检验
# V 已知
对于检验问题:
H0:μ=μ0H1:μ=μ0
给定显著性水平为α,计算:
D=n(Xˉ−μ0)TV−1(Xˉ−μ0)
当D≥χ1−α2(p),拒绝
# V 未知
与上差不多,计算:
F=pn(n−p)(Xˉ−μ0)TS−1(Xˉ−μ0)
当F≥F1−α(p,n−p),拒绝
# 两个正态总体均值相等检验
# V 已知
计算:
D=n1+n2n1n2n(Xˉ−Yˉ)TV−1(Xˉ−Yˉ)
当D≥χ1−α2(p),拒绝
# V 未知
计算:
V=n1+n2−2(n1−1)V1+(n2−1)V2F=p(n1+n2)(n1+n2−2)n1n2(n1+n2−p−1)(Xˉ−Yˉ)TV−1(Xˉ−Yˉ)
当F≥F1−α(p,n1+n2−p−1),拒绝