/ / /
统计第4讲:估计(标准误、偏差、均方误差)| Estimation (SE, Bias, MSE)
🔴
入学要求
💯
能力测试
🛣️
课程安排
🕹️
研究资源

统计第4讲:估计(标准误、偏差、均方误差)| Estimation (SE, Bias, MSE)

💡

查看全集:🎬概率与统计

1. 样本均值与标准误(Sample Mean & Standard Error)

1.1 基本定义

X1,X2,...,XnX_1, X_2, ..., X_n 为从均值为 μ\mu、方差为 σ2\sigma^2 的总体中随机抽取的样本,则:

 Xˉ=1ni=1nXi  \bar{X} = \frac{1}{n}\sum_{i=1}^n X_i 

样本均值(Sample Mean)。它是总体均值 μ\mu无偏估计(Unbiased Estimator):

 E(Xˉ)=μ  E(\bar{X}) = \mu 

1.2 标准误(Standard Error, SE)

样本均值的标准差称为标准误

 SE=Var(Xˉ)=σn   \text{SE} = \sqrt{\text{Var}(\bar{X})} = \frac{\sigma}{\sqrt{n}}  

实际中常用样本标准差 ss 近似:

 SEsn,s2=1n1i=1n(XiXˉ)2  \text{SE} \approx \frac{s}{\sqrt{n}}, \quad s^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \bar{X})^2 

例子

若总体 σ=5\sigma=5,样本量 n=25n=25,则:

SE=525=1 \text{SE} = \frac{5}{\sqrt{25}} = 1 
表示样本均值
Xˉ\bar{X} 与真实均值 μ\mu 的典型距离约为1。


2. 偏差与均方误差(Bias & Mean Squared Error)

2.1 偏差(Bias)

设真实参数为 ww,但测量值存在系统性偏差 bb

 Xi=w+b+ϵi,ϵi(0,σ2)   X_i = w + b + \epsilon_i, \quad \epsilon_i \sim (0, \sigma^2)  

则样本均值的期望为:

 E(Xˉ)=w+b  E(\bar{X}) = w + b 


此时
Xˉ\bar{X}ww有偏估计(Biased Estimator),偏差为:

 Bias=E(Xˉ)w=b  \text{Bias} = E(\bar{X}) - w = b 

2.2 均方误差(MSE)

衡量估计量整体性能的指标:

 MSE=E[(Xˉw)2]=σ2n+b2   \text{MSE} = E\left[ (\bar{X} - w)^2 \right] = \frac{\sigma^2}{n} + b^2  

可分解为:

 MSE=SE2+Bias2  \text{MSE} = \text{SE}^2 + \text{Bias}^2 

例子

σ=2\sigma=2, n=100n=100, b=0.5b=0.5,则:

MSE=22100+0.52=0.04+0.25=0.29 \text{MSE} = \frac{2^2}{100} + 0.5^2 = 0.04 + 0.25 = 0.29 


3. 一般理论(General Case)

对任意参数 θ\theta 和其估计量 θ^\hat{\theta}

 MSE=E[(θ^θ)2]=SE2+Bias2  \text{MSE} = E\left[ (\hat{\theta} - \theta)^2 \right] = \text{SE}^2 + \text{Bias}^2 

关键结论

当样本量 nn \to \infty 时,SE项 σ2n0\frac{\sigma^2}{n} \to 0,但偏差项 b2b^2 保持不变,因此:

 limnMSE=b2  \lim_{n \to \infty} \text{MSE} = b^2 

4. 学习建议

  1. 动手计算:通过具体数值例子验证公式(如SE随$n$变化的规律)
  1. 无偏性理解:明确区分"估计量无偏"和"估计量准确"
  1. 编程验证:用Python/R生成模拟数据,观察MSE的分解现象
  1. 核心公式:熟记 MSE=SE2+Bias2\text{MSE} = \text{SE}^2 + \text{Bias}^2 的推导过程

附:练习合集