“德贤数理”青年人才学术沙龙第32期举行

单位(作者):数理学院时间:2024-11-13

11月8日下午,数理学院博士生刘佳敏和常续阳副教授于理化楼404,作题为“Kernel-Based Decentralized Policy Evaluation for Reinforcement Learning”和“Brightness and Contrast Corrections for Space-Time Stereocorrelation via Proper Generalized Decomposition”的学术报告。

刘佳敏介绍了多智能体强化学习问题,对强化学习问题中的时间差分算法及存在的问题进行了阐述。她讨论了非参数框架下多智能体强化学习和去中心化分布式学习的联系,重点讲解了用于价值函数估计的多阶段梯度下降算法及其收敛性,并通过数值模拟结果比较了新算法和传统时间差分算法的估计误差。

常续阳引入了广义本征正交分解表征PVB夹层玻璃的低速撞击试验,介绍了PVB夹层玻璃的特性,强调了表征其力学本构模型的研究意义。他具体讲述了如何构建三维表面数字图像相关法、如何进行全局亮度与对比度矫正、以及如何在时空有限元计算的框架内,通过广义本征正交分解的方法,同时表征多物理场的时空变化。最后,他介绍了表征PVB夹层玻璃力学的研究进展和使用三维表面数字图像相关法进行实验表征的优势。

(摄影:数理学院)

(责编:付云笛)

分享到: