统计第3讲:点估计 | Point Estimation
💡

基本概念
总体参数与样本统计量
设总体N中变量v的:
μ=N1i=1∑Nvi(总体均值)σ2=N1i=1∑N(vi−μ)2(总体方差) - 参数(Parameters) μ, σ2是未知常数
- 简单随机样本(Simple Random Sample)用于估计参数:从总体中不放回随机抽取个体
二元变量特例:
当变量v是二元变量(取0/1值),设总体比例为p,则有:
μ=p,σ2=p(1−p) 抽样分布特性
单次抽样:
设X为抽取的观测值,则:
E(X)=μ,var(X)=σ2 有放回抽样:
对容量n的样本X1,...,Xn:
样本均值 X=n1i=1∑nXiE(X)=μ,var(X)=nσ2 实例分析:
从股票收益率总体中抽取10天收益率数据(单位:%):
0.8, 1.2, -0.5, 2.1, 1.5, 0.3, -0.2, 1.8, 0.9, 1.1
样本均值计算:
x=101(0.8+1.2+⋯+1.1)=0.9% 学习建议:
- 理解iid(独立同分布)假设的重要性
- 练习计算不同样本量的均值方差
标准误与估计精度
标准误理论
标准误(Standard Error)衡量估计量精度:
SE=var(X)=nσ 实际应用:
使用样本标准差s估计σ:
估计标准误=ns其中 s2=n−11i=1∑n(xi−x)2 案例演示:
前述股票收益率样本的标准差计算:
s=9∑(xi−0.9)2≈1.12%SE≈101.12%≈0.35%
无偏性验证
关键定理:
样本方差S2是σ2的无偏估计:
E(S2)=σ2 证明推导:
E(∑(Xi−X)2)=E(∑Xi2−nX2)=n(σ2+μ2)−n(nσ2+μ2)=(n−1)σ2 学习建议:
- 掌握期望运算的线性性质
- 理解自由度(n−1)的统计含义
比例估计专题
二元变量情形
当研究二元变量(如客户是否购买产品),设总体比例为p:
p^=n样本中成功数SE=np(1−p)≈np^(1−p^) 应用案例:
调查400名客户,112人表示会购买新产品:
p^=400112=0.28SE≈4000.28×0.72≈0.022
置信区间构建:
0.28±1.96×0.022⇒(0.237,0.323)
抽样方法进阶
有限总体修正
当抽样比例n/N>5%时,需应用修正因子:
修正标准误=N−1N−n×nσ 银行账户案例:
从10,000个账户中抽取500个:
修正因子=99999500≈0.975
学习建议:
- 区分有限总体与无限总体的差异
- 掌握修正因子的应用条件
高斯模型框架
统计建模基础
假设观测值xi来自:
Xi∼iid N(w,σ2)X∼N(w,nσ2) 参数解读:
金融应用:
用于建模资产收益率分布,为风险管理提供理论基础
附:练习合集
练习