统计第4讲:估计(标准误、偏差、均方误差)| Estimation (SE, Bias, MSE)
💡

1. 样本均值与标准误(Sample Mean & Standard Error)
1.1 基本定义
设 X1,X2,...,Xn 为从均值为 μ、方差为 σ2 的总体中随机抽取的样本,则:
Xˉ=n1i=1∑nXi 为样本均值(Sample Mean)。它是总体均值 μ 的无偏估计(Unbiased Estimator):
E(Xˉ)=μ 1.2 标准误(Standard Error, SE)
样本均值的标准差称为标准误:
SE=Var(Xˉ)=nσ 实际中常用样本标准差 s 近似:
SE≈ns,s2=n−11i=1∑n(Xi−Xˉ)2 例子:
若总体 σ=5,样本量 n=25,则:
SE=255=1
表示样本均值
Xˉ 与真实均值 μ 的典型距离约为1。
2. 偏差与均方误差(Bias & Mean Squared Error)
2.1 偏差(Bias)
设真实参数为 w,但测量值存在系统性偏差 b:
Xi=w+b+ϵi,ϵi∼(0,σ2) 则样本均值的期望为:
E(Xˉ)=w+b
此时
Xˉ 是 w 的有偏估计(Biased Estimator),偏差为:
Bias=E(Xˉ)−w=b 2.2 均方误差(MSE)
衡量估计量整体性能的指标:
MSE=E[(Xˉ−w)2]=nσ2+b2 可分解为:
MSE=SE2+Bias2 例子:
若 σ=2, n=100, b=0.5,则:
MSE=10022+0.52=0.04+0.25=0.29
3. 一般理论(General Case)
对任意参数 θ 和其估计量 θ^:
- 标准误(SE): SD(θ^)
- 偏差(Bias): E(θ^)−θ
MSE=E[(θ^−θ)2]=SE2+Bias2 关键结论:
当样本量 n→∞ 时,SE项 nσ2→0,但偏差项 b2 保持不变,因此:
n→∞limMSE=b2
4. 学习建议
- 动手计算:通过具体数值例子验证公式(如SE随$n$变化的规律)
- 无偏性理解:明确区分"估计量无偏"和"估计量准确"
- 编程验证:用Python/R生成模拟数据,观察MSE的分解现象
- 核心公式:熟记 MSE=SE2+Bias2 的推导过程
附:练习合集
练习