5月5日,应数理与金融学院邀请,同济大学董玉超博士在T1612会议室作题为《Randomized Optimal Stopping Problem in Continuous Time and Reinforcement Learning Algorithm》的学术报告。报告会由系统科学学科负责人费为银教授主持,学院青年骨干教师、研究生参加了此次报告会。
董玉超从强化学习方法在金融数学与最优控制领域的应用价值切入,系统阐释了该算法相较于传统优化方法在处理高维随机问题、复杂动态系统建模等方面的理论优势。聚焦连续时间下的随机最优停时问题,以美式看跌期权定价为典型案例,创新性地提出将熵正则化机制嵌入强化学习奖励函数,构建起经典最优停时问题与连续时间随机控制问题的数学等价框架。这一方法论突破不仅拓展了动态规划的理论边界,更为金融衍生品定价、投资决策优化等实际问题提供了新的算法实现路径。
在互动环节,与会师生就强化学习算法、熵正则化参数校准等关键问题与董玉超博士展开深度探讨,气氛热烈。本次报告通过学科交叉视角揭示了机器学习方法在金融数学领域的前沿应用,为我院相关方向的研究注入了新的学术增长点,进一步推动了智能算法与数理金融的融合创新研究。
(文:李亮 编辑:郭亚勤 预审:潘海峰 审核:彭海燕)