统计第8讲:最大似然估计量的大样本分布 | Large-Sample Distribution of MLEs
💡

一、渐近正态性 | Asymptotic Normality
1.1 基本定理
设 θn 为参数 θ∈Θ⊂R 的最大似然估计量 (Maximum Likelihood Estimator, MLE),基于独立同分布 (iid) 样本 X1,…,Xn。当样本量 n 足够大时,MLE 的分布近似满足:
θn∼⋅N(θ,nI(θ)−1) 其中 I(θ) 为 Fisher 信息量 (Fisher Information),由单个样本计算得到。
特性:
- MLE 是渐近无偏的 (asymptotically unbiased)
- 但小样本下可能存在偏差:E(θn)=θ
二、Fisher 信息量 | Fisher Information
2.1 定义与计算
设随机变量 X 的概率密度函数为 f(x∣θ),则 Fisher 信息量定义为:
I(θ)=−E[dθ2d2logf(X∣θ)] 矩阵形式(当 θ 为向量时):
I(θ)ij=−E[∂θi∂θj∂2logf(X∣θ)] 矩阵 I(θ) 对称且半正定,反映单个样本包含的关于 θ 的信息量。
三、经典案例
3.1 伯努利分布 | Bernoulli Distribution
模型设定:
X∼Bernoulli(p),概率质量函数为:
f(x∣p)=px(1−p)1−x,x=0,1 推导步骤:
- 对数似然函数:
logf(X∣p)=Xlogp+(1−X)log(1−p) - 二阶导数:
dp2d2logf(X∣p)=−p2X−(1−p)21−X - 计算期望:
I(p)=p(1−p)1 渐近分布:
对于样本均值 p^=Xˉn,当 n 较大时:
p^≈N(p,np(1−p))
3.2 几何分布 | Geometric Distribution
模型设定:
X∼Geometric(p),概率质量函数为:
f(x∣p)=p(1−p)x−1,x=1,2,… 推导步骤:
- 对数似然函数:
logf(X∣p)=logp+(X−1)log(1−p) - 二阶导数:
dp2d2logf(X∣p)=−p21−(1−p)2X−1 - 计算期望:
I(p)=p2(1−p)1 渐近分布:
MLE p^=1/Xˉn 的渐近分布为:
p^≈N(p,np2(1−p)) 注意:
- p^ 在小样本下有偏:E(p^)>p
3.3 正态分布 | Normal Distribution
模型设定:
X∼N(μ,σ2),参数 θ=(μ,σ)
Fisher 信息矩阵:
I(θ)=[σ2100σ22] 渐近分布:
对于 MLE θ^=(Xˉn,σ^),当 n 较大时:
⎩⎨⎧Xˉn∼N(μ,nσ2)(精确分布)σ^≈N(σ,2nσ2)(近似,因σ≥0)
四、学习建议
- 动手推导:对每个分布的 Fisher 信息量进行手算,验证二阶导数与期望的计算。
- 模拟验证:使用 Python/R 生成随机样本,比较 MLE 的样本分布与理论渐近分布。
- 对比分析:分析几何分布中 p^=1/Xˉn 的偏差与方差特性。
关键术语对照表:
- 最大似然估计量 (Maximum Likelihood Estimator, MLE)
- Fisher 信息量 (Fisher Information)
- 渐近正态性 (Asymptotic Normality)
- 独立同分布 (Independent and Identically Distributed, iid)
附:练习合集
练习