🔴
入学要求
💯
能力测试
🛣️
课程安排
🕹️
研究资源

统计第3讲:点估计 | Point Estimation

💡

查看全集:🎬概率与统计

基本概念

总体参数与样本统计量

设总体NN中变量vv的:

μ=1Ni=1Nvi(总体均值)σ2=1Ni=1N(viμ)2(总体方差)\mu = \frac{1}{N}\sum_{i=1}^N v_i \quad (\text{总体均值}) \\ \sigma^2 = \frac{1}{N}\sum_{i=1}^N (v_i - \mu)^2 \quad (\text{总体方差})

二元变量特例

当变量vv是二元变量(取0/1值),设总体比例为pp,则有:

μ=p,σ2=p(1p)\mu = p,\quad \sigma^2 = p(1-p)

抽样分布特性

单次抽样

XX为抽取的观测值,则:

E(X)=μ,var(X)=σ2 E(X) = \mu,\quad \text{var}(X) = \sigma^2 

有放回抽样

对容量nn的样本X1,...,XnX_1,...,X_n

样本均值 X=1ni=1nXiE(X)=μ,var(X)=σ2n\text{样本均值} \ \overline{X} = \frac{1}{n}\sum_{i=1}^n X_i \\ E(\overline{X}) = \mu,\quad \text{var}(\overline{X}) = \frac{\sigma^2}{n}

实例分析

从股票收益率总体中抽取10天收益率数据(单位:%):
0.8, 1.2, -0.5, 2.1, 1.5, 0.3, -0.2, 1.8, 0.9, 1.1

样本均值计算:

x=110(0.8+1.2++1.1)=0.9% \overline{x} = \frac{1}{10}(0.8+1.2+\cdots+1.1) = 0.9\% 

学习建议

  1. 理解iid(独立同分布)假设的重要性
  1. 练习计算不同样本量的均值方差

标准误与估计精度

标准误理论

标准误(Standard Error)衡量估计量精度:

SE=var(X)=σn SE = \sqrt{\text{var}(\overline{X})} = \frac{\sigma}{\sqrt{n}} 

实际应用

使用样本标准差ss估计σ\sigma

估计标准误=sn其中 s2=1n1i=1n(xix)2\text{估计标准误} = \frac{s}{\sqrt{n}} \\ \text{其中} \ s^2 = \frac{1}{n-1}\sum_{i=1}^n (x_i - \overline{x})^2

案例演示

前述股票收益率样本的标准差计算:


s=(xi0.9)291.12%SE1.12%100.35%s = \sqrt{\frac{\sum (x_i-0.9)^2}{9}} \approx 1.12\% \\ SE \approx \frac{1.12\%}{\sqrt{10}} \approx 0.35\%

无偏性验证

关键定理

样本方差S2S^2σ2\sigma^2的无偏估计:

E(S2)=σ2E(S^2) = \sigma^2

证明推导

E((XiX)2)=E(Xi2nX2)=n(σ2+μ2)n(σ2n+μ2)=(n1)σ2\begin{align*} E\left(\sum (X_i - \overline{X})^2\right) &= E\left(\sum X_i^2 - n\overline{X}^2\right) \\ &= n(\sigma^2 + \mu^2) - n\left(\frac{\sigma^2}{n} + \mu^2\right) \\ &= (n-1)\sigma^2 \end{align*}

学习建议

  1. 掌握期望运算的线性性质
  1. 理解自由度(n1n-1)的统计含义

比例估计专题

二元变量情形

当研究二元变量(如客户是否购买产品),设总体比例为pp

p^=样本中成功数nSE=p(1p)np^(1p^)n\hat{p} = \frac{\text{样本中成功数}}{n} \\ SE = \sqrt{\frac{p(1-p)}{n}} \approx \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}

应用案例

调查400名客户,112人表示会购买新产品:


p^=112400=0.28SE0.28×0.724000.022\hat{p} = \frac{112}{400} = 0.28 \\ SE \approx \sqrt{\frac{0.28×0.72}{400}} \approx 0.022

置信区间构建


0.28±1.96×0.022(0.237,0.323)0.28 \pm 1.96×0.022 \Rightarrow (0.237, 0.323)

抽样方法进阶

有限总体修正

当抽样比例n/N>5%n/N > 5\%时,需应用修正因子:

修正标准误=NnN1×σn\text{修正标准误} = \sqrt{\frac{N-n}{N-1}} × \frac{\sigma}{\sqrt{n}}

银行账户案例

从10,000个账户中抽取500个:


修正因子=950099990.975\text{修正因子} = \sqrt{\frac{9500}{9999}} \approx 0.975 

学习建议

  1. 区分有限总体与无限总体的差异
  1. 掌握修正因子的应用条件

高斯模型框架

统计建模基础

假设观测值xix_i来自:

Xiiid N(w,σ2)XN(w,σ2n)X_i \sim \text{iid} \ N(w, \sigma^2) \\ \overline{X} \sim N\left(w, \frac{\sigma^2}{n}\right)

参数解读

金融应用

用于建模资产收益率分布,为风险管理提供理论基础

附:练习合集