离散型随机变量期望、方差的一些公式与证明
声明
本文基于人教版高中数学选修 2-3,本中随机变量均为离散型随机变量。
本文中 \(\displaystyle\sum_x\) 为 \(\displaystyle\sum_{x \in Range(X)}\)(\(Range(X)\) 表示随机变量 \(X\) 可能的取值的集合)的简写。
期望
期望的线性性质
\]
课本上就有,证明略。
公式 1
\]
证明
E(X+Y) &=\sum_{x} \sum_{y}(x+y) P(X=x, Y=y) \\
&=\sum_{x} \sum_{y} x P(X=x, Y=y)+\sum_{x} \sum_{y} y P(X=x, Y=y) \\
&=\sum_{x} x \sum_{y} P(X=x, Y=y)+\sum_{y} y \sum_{x} P(X=x, Y=y) \\
&=\sum_{x} x P(X=x)+\sum_{y} y P(Y=y) \\
&=E(X)+E(Y)
\end{aligned}
\]
公式 2
在 \(X,Y\) 相互独立的情况下,有
\]
证明
由 \(X,Y\) 相互独立知 \(P(X=x,Y=y)=P(X=x)P(Y=y)\)
所以
E(XY) &=\sum_{x} \sum_{y} xy P(X=x, Y=y) \\
&=\sum_{x} \sum_{y} xy P(X=x)P(Y=y) \\
&=\sum_{x} x P(X=x)\sum_{y} yP(Y=y) \\
&=\sum_{x} x P(X=x)E(Y) \\
&=E(Y)\sum_{x} x P(X=x) \\
&=E(X)E(Y)
\end{aligned}
\]
方差
定义
\]
换种写法
\]
再换种写法
D(X) &= E[X-E(X)]^2 \\
&=E[X^2-2X\cdot E(X)+(E(X))^2] \\
&=E(X^2)-2E(X)E(X)+(E(X))^2 \\
&=E(X^2)-(E(X))^2
\end{aligned}
\]
即
\]
公式 1
\]
课本上就有,证明略。
公式 2
在 \(X,Y\) 相互独立的情况下,有
\]
证明
D(X+Y) &= E{(X+Y)^2 – (E(X+Y))^2} \\
&= E{(X^2+Y^2+2XY) – (E(X)+E(Y))^2} \\
&= E(X^2 – E^2(X)) + E(Y^2 – E^2(Y))+ E(2XY) – 2E(X) E(Y) \\
&= D(X) + D(Y) + 0
\end{aligned}
\]
即:\(D(X+Y) = D(X) + D(Y)\)
超几何分布
定义
\(N\) 个物品中有 \(M\) 个次品,超几何分布描述了在这 \(N\) 个样本中选 \(n\) 个,其中有 \(k\) 个次品的概率。
\]
若随机变量 \(X\) 服从参数为 \(n, M, N\) 的超几何分布,则记为
\]
期望
若 \(x \sim H(n, M, N)\),则
\]
证明
引理 1
由组合数公式可以得到 \(k \cdot C_M^k = M \cdot C_{M – 1}^{k – 1}\)
引理 2
由组合数公式可以得到 \(C_{N}^n = \dfrac Nn \cdot C_{N – 1}^{n – 1}\)
引理 3
由超几何分布概率和为 \(1\),即 \(\displaystyle \sum_{k=0}^m P(X=k) = \sum_{k = 0}^m \frac{C_M^k C_{N – M}^{n – k}}{C_N^n} = 1\)
可得 \(\displaystyle\sum_{k = 0}^m C_M^k C_{N – M}^{n – k} = C_N^n\)
推导过程
\]
方差
\]
二项分布
定义
二项分布(Binomial distribution)是 \(n\) 个 独立重复试验中成功的次数的离散概率分布,其中每次试验的成功概率为 \(p\)。这样的单次成功/失败试验又称为 伯努利试验。
实际上,当 \(n = 1\) 时,二项分布就是两点分布。
一般地,如果随机变量 \(X\) 服从参数 \(n\) 和 \(p\) 的二项分布,我们记 \(x \sim b(n, p)\) 或 \(X \sim B(n, p)\). \(n\) 次试验中正好得到 \(k\) 次成功的概率为
\]
期望
若 \(X\sim B(n,p)\),则
\]
证明
简单的证明
记
1 & \text{第 $i$ 次试验成功}\\
0 & \text{第 $i$ 次试验不成功}
\end{cases}
\]
显然 \(E(x_i)=p\)
由于 \(X=x_1+x_2+\cdots+x_n\),根据期望的线性性质,
\(E(X) = E(x_1) + E(x_2) + \cdots + E(x_n) = np\)
复杂的证明
记 \(q = 1-p\),那么
E(X) &= \sum_{k=0}^n k P(X=k)\\
&= \sum_{k=0}^n k C_{n}^{k}p^kq^{n-k} \\
&= \sum_{k=1}^n k C_{n}^{k}p^kq^{n-k} \\
&= p\sum_{k=1}^n nC_{n-1}^{k-1}p^{k-1}q^{(n-1)-(k-1)}\\
&= np\sum_{k=1}^n C_{n-1}^{k-1}p^{k-1}q^{(n-1)-(k-1)} \\
&= np\cdot (p+q)^{n-1} \qquad \text{(二项式定理)}\\
&= np
\end{aligned}
\]
方差
\]
证明
简单的方法
类似于期望的那种证明方法。
复杂的方法
D(X) &=\sum_{k=0}^{n}\left[k-E(X)\right]^{2} \cdot p_{k}=\sum_{k=0}^{n}(k-n p)^{2} \cdot \mathrm{C}_{n}^{k} p^{k} q^{n-k} \\
&=\sum_{k=0}^{n} k^{2} \cdot \mathrm{C}_{n}^{k} p^{k} q^{n-k}+\sum_{k=0}^{n}-2 n p k \cdot \mathrm{C}_{n}^{k} p^{k} q^{n-k}+\sum_{k=0}^{n} n^{2} p^{2} \cdot \mathrm{C}_{n}^{k} p^{k} q^{n-k} \\
&=\sum_{k=0}^{n}(k-1) \cdot k \cdot \mathrm{C}_{n}^{k} p^{k} q^{n-k}+\sum_{k=0}^{n} k \cdot \mathrm{C}_{n}^{k} p^{k} q^{n-k}-2 n p \sum_{k=0}^{n} k \cdot \mathrm{C}_{n}^{k} p^{k} q^{n-k} \\
&+n^{2} p^{2} \sum_{k=0}^{n} \mathrm{C}_{n}^{k} p^{k} q^{n-k} \\
&=\sum_{k=1}^{n}(k-1) \cdot k \cdot \mathrm{C}_{n}^{k} p^{k} q^{n-k}+n p-2 n p \cdot n p+n^{2} p^{2} \\
&=n \sum_{k=2}^{n}(k-1) \cdot \mathrm{C}_{n-1}^{k-1} p^{k} q^{n-k}+n p-n^{2} p^{2} \\
&=n(n-1) p^{2} \sum_{k=2}^{n} \mathrm{C}_{n-2}^{k-2} p^{k-2} q^{(n-2)-(k-2)}+n p-n^{2} p^{2} \quad(\text{令} k-2=i) \\
&=n(n-1) p^{2} \sum_{i=0}^{n-2} \mathrm{C}_{n-2}^{i} p^{i} q^{(n-2)-i}+n p-n^{2} p^{2} \\
&=n(n-1) p^{2}+n p-n^{2} p^{2} \\
&=n p q
\end{aligned}
\]