🔴
入学要求
💯
能力测试
🛣️
课程安排
🕹️
研究资源

统计第1讲:概率基础 | Probability

💡

查看全集:🎬概率与统计

1. 概率基础概念

1.1 概率的定义

limr事件发生次数r\lim_{r \to \infty} \frac{\text{事件发生次数}}{r}

2. 期望与方差

2.1 期望 (Expectation)

离散型(质量函数):

E(X)=i=1nxipiE(X) = \sum_{i=1}^n x_i p_i

连续型(密度函数):

E(X)=xf(x)dxE(X) = \int_{-\infty}^{\infty} x f(x) dx

函数期望:对任意函数 h(X)h(X)

离散型:E{h(X)}=i=1nh(xi)piE\{h(X)\} = \sum_{i=1}^n h(x_i) p_i

连续型:E{h(X)}=h(x)f(x)dxE\{h(X)\} = \int_{-\infty}^{\infty} h(x) f(x) dx

例子

掷骰子的期望值计算

E(X)=116+216++616=3.5E(X) = 1 \cdot \frac{1}{6} + 2 \cdot \frac{1}{6} + \dots + 6 \cdot \frac{1}{6} = 3.5


2.2 方差 (Variance)

定义

var(X)=E[(Xμ)2],μ=E(X)\text{var}(X) = E\left[(X - \mu)^2\right], \quad \mu = E(X)

标准差 (Standard Deviation):

SD(X)=var(X)\text{SD}(X) = \sqrt{\text{var}(X)}

性质

  1. var(X)=E(X2)[E(X)]2\text{var}(X) = E(X^2) - [E(X)]^2
  1. E(Xμ)=0E(X - \mu) = 0

推导

var(X)=E[(Xμ)2]=E(X22μX+μ2)=E(X2)2μE(X)+μ2=E(X2)μ2\begin{align*} \text{var}(X) &= E[(X - \mu)^2] \\ &= E(X^2 - 2\mu X + \mu^2) \\ &= E(X^2) - 2\mu E(X) + \mu^2 \\ &= E(X^2) - \mu^2 \end{align*}

3. 大数定律与蒙特卡洛方法

3.1 大数定律 (Law of Large Numbers, LLN)

rr 次独立实验的观测值 x1,,xrx_1, \dots, x_r,定义:

样本均值:

xˉ=1ri=1rxi\bar{x} = \frac{1}{r} \sum_{i=1}^r x_i

样本方差:

v=1ri=1r(xixˉ)2v = \frac{1}{r} \sum_{i=1}^r (x_i - \bar{x})^2

LLN结论:当 rr \to \infty 时,

xˉE(X),vvar(X)\bar{x} \to E(X), \quad v \to \text{var}(X)

3.2 蒙特卡洛近似 (Monte Carlo Approximation)

通过生成大量样本 x1,,xrx_1, \dots, x_r 近似计算期望:

E{h(X)}1ri=1rh(xi)E\{h(X)\} \approx \frac{1}{r} \sum_{i=1}^r h(x_i)

学习建议

尝试用 Python 模拟抛硬币实验,观察样本均值随实验次数增加收敛到真实概率 p=0.5p=0.5


4. 联合分布与协方差

4.1 联合分布 (Joint Distribution)

P(X=xi,Y=yj)=pijP(X=x_i, Y=y_j) = p_{ij}
f(x,y)0,f(x,y)dxdy=1f(x,y) \geq 0, \quad \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} f(x,y) dx dy = 1

函数期望:对 h:R2Rh: \mathbb{R}^2 \to \mathbb{R}

离散型:

E{h(X,Y)}=i=1Ij=1Jh(xi,yj)pijE\{h(X,Y)\} = \sum_{i=1}^I \sum_{j=1}^J h(x_i,y_j) p_{ij}

连续型:

E{h(X,Y)}=h(x,y)f(x,y)dxdyE\{h(X,Y)\} = \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} h(x,y) f(x,y) dx dy

4.2 协方差 (Covariance)

定义

cov(X,Y)=E[(XμX)(YμY)]\text{cov}(X,Y) = E[(X - \mu_X)(Y - \mu_Y)]

计算式

cov(X,Y)=E(XY)μXμY\text{cov}(X,Y) = E(XY) - \mu_X \mu_Y

性质

  1. cov(X,Y)=cov(Y,X)\text{cov}(X,Y) = \text{cov}(Y,X)
  1. cov(X,X)=var(X)\text{cov}(X,X) = \text{var}(X)
  1. cov(W,aX+bY+c)=acov(W,X)+bcov(W,Y)\text{cov}(W, aX + bY + c) = a \cdot \text{cov}(W,X) + b \cdot \text{cov}(W,Y)

组合方差

var(aX+bY+c)=a2var(X)+b2var(Y)+2abcov(X,Y)\text{var}(aX + bY + c) = a^2 \text{var}(X) + b^2 \text{var}(Y) + 2ab \cdot \text{cov}(X,Y)

例子

设股票A和B的收益率分别为 XXYY,已知 cov(X,Y)=0.02\text{cov}(X,Y) = 0.02,计算投资组合 Z=0.6X+0.4YZ = 0.6X + 0.4Y 的方差。


5. 条件分布与独立性

5.1 条件分布 (Conditional Distribution)

f(x,y)=fX(x)fYX(yx)=fY(y)fXY(xy) f(x,y) = f_X(x) \cdot f_{Y|X}(y|x) = f_Y(y) \cdot f_{X|Y}(x|y) 

其中 fYX(yx)f_{Y|X}(y|x) 是给定 X=xX=xYY 的条件密度。


5.2 独立性 (Independence)

定义XXYY 独立当且仅当对任意 x,yx,y

f(x,y)=fX(x)fY(y)f(x,y) = f_X(x) \cdot f_Y(y)

推论:若独立,则

  1. E(XY)=E(X)E(Y)E(XY) = E(X)E(Y)
  1. cov(X,Y)=0\text{cov}(X,Y) = 0(但逆命题不成立!)

学习建议

通过抛硬币和掷骰子的组合实验,验证独立事件的协方差是否为0。

附:练习合集