统计第7讲:最大似然估计 | MLE
💡

一、基本概念
1.1 似然函数 (Likelihood Function)
设观测数据 x1,x2,…,xn 是独立同分布 (iid) 随机变量 X1,X2,…,Xn 的样本值,其概率密度函数为 f(x∣θ),其中 θ∈Θ⊂Rk。似然函数定义为:
L(θ)=i=1∏nf(xi∣θ) 对应的对数似然函数 (Log-Likelihood Function) 为:
ℓ(θ)=logL(θ)=i=1∑nlogf(xi∣θ) 1.2 最大似然估计 (MLE)
MLE 的核心思想:选择使得观测数据出现概率最大的参数值 θ^。
求解步骤:
- 构建似然函数 L(θ) 或对数似然函数 ℓ(θ)
- 对 ℓ(θ) 求导并令导数为零:∂θ∂ℓ=0
- 验证二阶导数 ∂θ2∂2ℓ<0 确保极大值
二、典型分布案例
2.1 泊松分布案例 | Poisson Distribution
参数: λ
概率质量函数:
f(x∣λ)=x!λxe−λ,x=0,1,2,… 推导过程
- 似然函数:
L(λ)=i=1∏nxi!λxie−λ=x1!x2!…xn!λ∑xie−nλ - 对数似然函数(忽略常数项):
ℓ(λ)=(i=1∑nxi)logλ−nλ - 求导并解方程:
dλdℓ=λ∑xi−n=0⇒λ^=xˉ 学习建议:重点理解如何从概率质量函数构建似然函数,并掌握对数转换简化计算的技巧。
2.2 正态分布案例 | Normal Distribution
参数: μ(均值), σ(标准差)
概率密度函数:
f(x∣μ,σ)=2πσ1e−2σ2(x−μ)2 推导过程
- 对数似然函数:
ℓ(μ,σ)=−2nlog(2π)−nlogσ−2σ21i=1∑n(xi−μ)2 - 对 μ 求导:
∂μ∂ℓ=σ21i=1∑n(xi−μ)=0⇒μ^=xˉ - 对 σ 求导:
∂σ∂ℓ=−σn+σ31i=1∑n(xi−μ)2=0⇒σ^2=n1i=1∑n(xi−xˉ)2 关键点:注意方差估计量 σ^2 是有偏估计量,修正为无偏估计时需使用 n−1。
2.3 伽马分布案例 | Gamma Distribution
参数: α(形状参数), λ(速率参数)
概率密度函数:
f(x∣α,λ)=Γ(α)λαxα−1e−λx,x>0 推导特点
- 对数似然函数:
ℓ(α,λ)=nαlogλ−nlogΓ(α)+(α−1)i=1∑nlogxi−λi=1∑nxi - 联立方程(需数值方法求解):
log(xˉα)−Γ(α)Γ′(α)+n1i=1∑nlogxi=0
λ^=xˉα^ 学习建议:对于复杂分布的MLE,重点掌握联立方程的构建方法,并了解数值求解的必要性。
三、MLE 与矩估计 (MOM) 的比较
3.1 方法论差异
3.2 性能比较
特性 | MLE | MOM |
估计量显式表达式 | 通常无显式解 | 总能用样本矩表示 |
标准误 (Standard Error) | 更小 | 较大 |
偏差 (Bias) | 通常更小 | 可能较大 |
应用建议:在计算资源允许时优先选择MLE,当模型复杂时可将MOM作为初始值辅助计算。
四、学习总结
- 核心公式需熟练掌握:
- 似然函数构建:L(θ)=∏f(xi∣θ)
- 对数似然函数转换:ℓ(θ)=∑logf(xi∣θ)
- 典型分布案例需独立推导一遍,特别注意:
- 编程实践建议:使用Python的
scipy.optimize
模块实现伽马分布参数的MLE估计。
附:练习合集
练习