12月20日上午10:00-11:30,同济高等讲堂(院级)于交通学院(通达馆)103报告厅成功举行,本次讲座主题为:强化学习在城市交通与运营管理的应用。讲座邀请了来自香港城市大学的Andy H.F. Chow博士,为大家带来了精彩的报告。
Andy H.F. Chow博士是香港城市大学系统工程系副教授,研究重点关注智慧交通和物流系统的设计和运营,以及新兴信息和计算技术的应用。周浩輝博士是香港运输学会 (HKSTS) 委员会会成员、香港运筹学会 (ORSHK) 副会长,以及英国运输物流学会 (CILTHK) 特别会员。他也是香港物流及供应链多元技术研发中心(LSCM)的专家评审小组成员,以及美国运输研究委员会(TRB)多个委员会的成员,曾在英国伦敦大学学院和美国加州大学伯克利分校担任学术和研究职位,为交通领域的发展做出了重要贡献。
在开始阶段,Andy H.F. Chow博士重点介绍其团队在使用强化学习(Reinforcement Learning, RL)技术管理城市交通和公交运营方面的最新研究工作。为了应对现代城市交通系统的复杂性和动态变化的特点,研究团队将这一问题建模为马尔可夫决策过程(Markov Decision Process, MDP)。通过这种建模方法,可以量化不确定性、动态变化和多样化的决策路径,从而为优化城市交通管理和公交调度提供坚实的理论基础。他强调了在研究中,团队面临的主要挑战是如何在拥有大量历史数据和动态决策变量的情况下,实时高效地评估和搜索最优操作策略。为了克服这一计算复杂性,研究团队提出了一种基于强化学习的高效计算框架。该框架的核心思想是使用代理函数来对状态空间和决策空间进行近似,避免了传统强化学习方法中庞大的计算开销。这种近似方法显著降低了策略搜索和决策评估的时间复杂度,使得在大规模、动态不确定的交通场景中实现实时控制成为可能。
随着讲座的推进,Andy H.F. Chow博士指出,为了验证所提出方法的有效性,研究团队在多个实际交通管理和公交运营场景中对该方法进行了系统性测试。这些案例研究涵盖了从日常通勤高峰到大流行期间的交通流量异常波动等一系列典型场景。实验结果显示,基于 RL 的计算框架在处理这些意外不确定性方面表现出了显著的鲁棒性和适应性。在应对大规模交通堵塞和大流行期间的极端交通条件时,该方法能够比传统的调度和优化方法表现出更高的决策效率和更强的适应能力。
在讲座的最后,Andy H.F. Chow博士聚焦强化学习的潜力,指出这项研究不仅为交通管理和公交调度领域的智能化和自动化提供了新思路,还展示了基于强化学习的计算方法在应对城市复杂动态环境中的巨大潜力。随着这项技术的进一步完善和应用,未来的城市交通系统有望实现更加高效、智能和可持续的运行模式。