cgail

发表于 2025-10-05 cgail irl maxent

报告人简介：美国伍斯特理工大学（WPI）计算机学院教授，研究方向主要集中在智慧城市和增强学习。课程介绍：在日常生活中，很多人类的行为可以建模成序贯的决策过程，即为某个任务目标而做出连续而相关的决策从而最大化任务过程中取得的收益。报告首先介绍时空决策过程中遇到的挑战、利用时空数据决策的步骤以及常用的逆强化学习和模仿学习方法

报告人简介：美国伍斯特理工大学wpi计算机学院教授

发表于 2025-07-22 cgail irl maxent