本课程系统探讨机器学习在金融领域的理论与实践,聚焦数据治理、策略开发、回测验证等核心环节。通过平衡理论与工程实践,揭示机器学习在量化交易中的真实能力边界,重点解决金融场景下的过拟合、生存偏差、非平稳性等特殊挑战。适合具备统计学与编程基础(Python/R)的量化研究员、资管从业者及学术研究者。
模块1:金融数据工程(3周)
模块2:模型构建与验证(4周)
模块3:策略回测与风控(3周)
模块4:前沿应用专题(2周)
类型 | 书目 | 核心价值 |
主教材 | Advances in Financial Machine Learning (Marcos López de Prado) | 提出金融特异性方法论:元标签、Purged CV、组合分层 |
辅助教材 | Machine Learning in Finance: From Theory to Practice (Dixon等) | 提供Python案例:从特征工程到策略部署全链路代码 |
扩展资源 | Quantopian研究文库(含订单簿仿真代码库) | 实盘级高频数据处理工具与案例数据集 |
领域 | 要求 | 速成资源 |
Python编程 | 熟练使用NumPy/Pandas/Scikit-learn | Python for Finance (Yves Hilpisch) |
机器学习 | 监督学习基础(回归/分类/评估指标) | Hands-On Machine Learning (Géron) |
金融基础 | 资产定价、投资组合理论 | Active Portfolio Management (Grinold) |
本课程以Marcos López de Prado的“金融机器学习三部曲”为理论基底,结合最新学术论文(如ICML 2024金融应用前沿)与工业级案例,系统构建符合金融物理规律的机器学习范式。