统计第1讲:概率基础 | Probability
💡

1. 概率基础概念
1.1 概率的定义
- 事件概率 (Probability of an event):实验重复多次时事件发生的极限相对频率
r→∞limr事件发生次数 - 随机变量 (Random Variable, RV):生成数值结果的机制,例如 X
- 实现值 (Realisation):随机变量的具体观测结果,例如 X=5 时,x=5 是常数
2. 期望与方差
2.1 期望 (Expectation)
离散型(质量函数):
E(X)=i=1∑nxipi 连续型(密度函数):
E(X)=∫−∞∞xf(x)dx 函数期望:对任意函数 h(X),
离散型:E{h(X)}=∑i=1nh(xi)pi
连续型:E{h(X)}=∫−∞∞h(x)f(x)dx
例子:
掷骰子的期望值计算
E(X)=1⋅61+2⋅61+⋯+6⋅61=3.5
2.2 方差 (Variance)
定义:
var(X)=E[(X−μ)2],μ=E(X) 标准差 (Standard Deviation):
SD(X)=var(X) 性质:
- var(X)=E(X2)−[E(X)]2
- E(X−μ)=0
推导:
var(X)=E[(X−μ)2]=E(X2−2μX+μ2)=E(X2)−2μE(X)+μ2=E(X2)−μ2
3. 大数定律与蒙特卡洛方法
3.1 大数定律 (Law of Large Numbers, LLN)
对 r 次独立实验的观测值 x1,…,xr,定义:
样本均值:
xˉ=r1i=1∑rxi 样本方差:
v=r1i=1∑r(xi−xˉ)2 LLN结论:当 r→∞ 时,
xˉ→E(X),v→var(X)
3.2 蒙特卡洛近似 (Monte Carlo Approximation)
通过生成大量样本 x1,…,xr 近似计算期望:
E{h(X)}≈r1i=1∑rh(xi) 学习建议:
尝试用 Python 模拟抛硬币实验,观察样本均值随实验次数增加收敛到真实概率 p=0.5。
4. 联合分布与协方差
4.1 联合分布 (Joint Distribution)
P(X=xi,Y=yj)=pij f(x,y)≥0,∫−∞∞∫−∞∞f(x,y)dxdy=1 函数期望:对 h:R2→R,
离散型:
E{h(X,Y)}=i=1∑Ij=1∑Jh(xi,yj)pij 连续型:
E{h(X,Y)}=∫−∞∞∫−∞∞h(x,y)f(x,y)dxdy
4.2 协方差 (Covariance)
定义:
cov(X,Y)=E[(X−μX)(Y−μY)] 计算式:
cov(X,Y)=E(XY)−μXμY 性质:
- cov(X,Y)=cov(Y,X)
- cov(X,X)=var(X)
- cov(W,aX+bY+c)=a⋅cov(W,X)+b⋅cov(W,Y)
组合方差:
var(aX+bY+c)=a2var(X)+b2var(Y)+2ab⋅cov(X,Y) 例子:
设股票A和B的收益率分别为 X 和 Y,已知 cov(X,Y)=0.02,计算投资组合 Z=0.6X+0.4Y 的方差。
5. 条件分布与独立性
5.1 条件分布 (Conditional Distribution)
f(x,y)=fX(x)⋅fY∣X(y∣x)=fY(y)⋅fX∣Y(x∣y) 其中 fY∣X(y∣x) 是给定 X=x 时 Y 的条件密度。
5.2 独立性 (Independence)
定义:X 和 Y 独立当且仅当对任意 x,y,
f(x,y)=fX(x)⋅fY(y) 推论:若独立,则
- E(XY)=E(X)E(Y)
- cov(X,Y)=0(但逆命题不成立!)
学习建议:
通过抛硬币和掷骰子的组合实验,验证独立事件的协方差是否为0。
附:练习合集
练习