第四章 随机变量的数字特征
数学期望与方差
数学期望与方差通常针对的是单个随机变量
离散型
我们记
为 \(X\) 的数学期望,存在的前提是 \(\sum _ {i= 1} ^ {+\infty} |x_i| \cdot P(X = x_i)\) 级数收敛,否则期望不存在
接下来记
为 \(X\) 的方差,同时记 \(\sqrt{DX} = \sigma(X)\) 为标准差,存在的前提是 \(EX^2 < +\infty\)
方差 \(DX\) 就是 \(g(X) = (X-EX)^2\) 的数学期望
常见离散型随机变量的数字特征
- 几何分布 \(X \sim g(p)\)
- 二项分布 \(X \sim B(n,p)\)
(括号里的内容为通过期望/方差的性质进行的简化运算)
- 泊松分布 \(X \sim P(\lambda)\)
连续型
我们记
为 \(X\) 的数学期望,存在的前提是 $ \int_{-\infty}^{+\infty} |x|p(x)dx$ 级数收敛,否则期望不存在
接下来记
为 \(X\) 的方差,同时记 \(\sqrt{DX} = \sigma(X)\) 为标准差,存在的前提是 \(EX^2 < +\infty\)
方差 \(DX\) 就是 \(g(X) = (X-EX)^2\) 的数学期望
常见连续型随机变量的数字特征
- 均匀分布 \(X \sim U[a,b]\)
- 指数分布 \(X \sim E(\lambda)\)
- 正态分布 \(X \sim N(\mu, \sigma^2)\)
(计算量偏大,并且需要借助高斯积分归一化)
期望的性质
对于离散型随机变量
- \(\displaystyle E(g(X)) = \sum _ {i= 1} ^ {+\infty} g(x_i) \cdot P(X = x_i)\)
对于连续型随机变量
- \(\displaystyle E(g(X)) = \int_{-\infty}^{+\infty} g(x)p(x)dx\)
上述结论可以推广到 \(Z = g(X,Y)\) 的数学期望,对应二重求和 / 积分
对于任意随机变量
- \(E(a) = a\)
- \(E(aX+bY) = aEX+bEY\)
- \(X,Y\) 相互独立 \(\longrightarrow E(XY)=EX\cdot EY\)
方差的性质
对于任意随机变量
- \(D(a) = 0\)
- \(D(aX+b) = a^2DX\)
- \(D(X ± Y) = DX + DY ± 2E[(X-EX)(Y-EY)]\),当 \(X,Y\) 相互独立时化简为 \(D(X ± Y) = DX + DY\)
(\(D(X ± Y) = DX + DY ± 2 \text{cov}(X,Y)\))
上面的结论可扩展到 \(n\) 维
切比雪夫不等式
设随机变量 \(X\) 的期望 \(EX\) 和方差 \(DX\) 均存在,则对任意 \(ε > 0\):
Proof
可以借助证明:\(DX = 0 \longrightarrow X = c\)
协方差
如果 \(EX, EY, E(XY)\) 存在,则
为 \(X,Y\) 的协方差
有以下性质和结论:
- \(\text{cov} (X,X) = D(X)\)
- \(\text{cov} (X,Y) = \text{cov}(Y,X)\)
- \(\text{cov} (aX+c,bY+d) = ab\text{cov}(X,Y)\)
- \(\text{cov} (X_1 + X_2,Y) = \text{cov}(X_1,Y) + \text{cov}(X_2,Y)\)
-
\(X,Y\) 相互独立 \(\longrightarrow \text{cov}(X,Y) = E(XY) - EX\cdot EY = 0\)
-
二维正态分布 \((X,Y)\sim N(\mu_1, \mu_2, \sigma_1^2, \sigma_2^2, \rho)\) 的协方差为 \(\sigma_1\sigma_2\rho\)
柯西 · 施瓦兹不等式的概率论形式
若 \(X,Y\) 方差存在,则
取等条件是存在 \(a,b\) 不全为零,\(P(Y= aX+b) = 1\)
一个更基础的形式是:若 \(X^2,Y^2\) 期望存在,则
取等条件是存在 \(t_0\) 不为零,\(P(Y= t_0X) = 1\)
积分形式:若 \(\displaystyle \int_a^b f^2 dx, \int_a^b g^2 dx\) 存在,则
取等条件是存在 \(a,b\) 不全为零,\(af(x) = bg(x)\) 几乎处处成立
相关系数
回顾:正态分布的标准化:\(X\sim N(μ,σ^2) \to \frac{x-μ}{σ} \sim N(0,1)\),标准正态分布的期望为 \(0\),方差为 \(1\)
已知随机变量 \(X\) 的期望和方差,我们令
计算得到 \(EX^\ast = 0,\; DX^\ast = 1\),此时称 \(X^*\) 为 \(X\) 的标准化随机变量
上式中记 \(EX = \mu,\;DX = \sigma^2\)
在此基础上定义 \(X,Y\) 的相关系数:设 \(DX, DY > 0\),则
记 \(\rho_{X\,Y}\) 为 \(X,Y\) 的相关系数,根据柯西 · 施瓦兹不等式 \([\text{cov}(X,Y)]^2 \leqslant DX\cdot DY\),得到 \(|\rho_{X\,Y}| \leqslant 1\),取等条件是存在 \(a,b\) 不全为零,\(P(Y= aX+b) = 1\)
上面的性质表明,相关系数 \(ρ_{X\,Y}\) 刻画了 \(X\) 和 \(Y\) 间的线性相关特征。\(|ρ_{X\,Y}|\) 越大,表明 \(X\) 和 \(Y\) 之间线性关系越密切,当 \(|ρ_{X\,Y}| = 1\) 时表明 \(X\) 和 \(Y\) 以概率 \(1\) 线性相关。反之,若 \(|ρ_{X\,Y}|\) 越小,表明 \(X\) 和 \(Y\) 的线性关系越弱。
\(\rho_{X\,Y}\) 描述了两个随机事件的线性相关特征;独立性描述了两个随机事件的相关性
特别地,若 \(ρ_{X\,Y} = 0\),我们称 \(X,Y\) 线性无关(不相关),容易得到以下等式
独立性和不相关并非等价,但是正态分布的独立性和不相关性等价,比如 \((X,Y)\sim N(\mu_1,\mu_2,\sigma_1^2, \sigma_2^2,\rho)\) 中 \(\rho_{X\,Y} = \rho\),而 \(X,Y\) 相互独立的充要条件即 \(\rho = 0\)
矩和协方差阵
矩可以看作期望的推广:对于随机变量 \(X\),\(X^k\) 的数学期望 \(EX^k\) 为 \(X\) 的 \(k\) 阶(原点)矩;标准化后 \(E(X-EX)^k\) 为 \(X\) 的 \(k\) 阶中心矩
(矩的存在性类比 \(EX\) 的存在性)
将随机变量标准化后的三阶矩 \(E\left(\dfrac{X-EX}{\sqrt{D(X)}}\right)^3 = \dfrac{E(X-\mu)^3}{\sigma^3}\) 记为偏度;\(\dfrac{E(X-EX)^4}{\sigma^4}\) 记为峰度
对于 \(n\) 维随机向量 \(X = (X_1,\cdots,X_n)^T\),称
为 \(X\) 的数学期望;记 \(c_{ij} = \text{cov}(X_i, X_j)\) ,称矩阵
为 \(X\) 的协方差阵,它是一个对称矩阵,比如二维正态分布的协方差阵为 \(\begin{bmatrix}\sigma_1^2 & \sigma_1 \sigma_2 \rho \\ \sigma_1 \sigma_2 \rho & \sigma_2^2\end{bmatrix}\)