5月30日上午,长沙理工大学计算机与通信工程学院“计算机类专业前沿系列名师专题课程”的第七讲圆满举行。本次讲座特别邀请了教育部青年长江学者、湖南芙蓉学者青年学者、湖南省优青,湖南大学刘璇教授。刘璇老师为我们作了题为“强化学习基本原理与典型应用”的精彩报告。我院师生共200余人参加了此次报告会,活动由计通学院副院长蔡烁主持。
蔡烁代表学院热烈欢迎刘璇老师的到来,并向参会师生介绍了刘璇老师在教学和科研方面的丰硕成果,以及目前的主要研究方向。
在讲座的开篇,刘璇教授首先介绍了什么是强化学习。她详细解释了强化学习的定义、基本概念和工作机制。强化学习是一种机器学习方法,通过智能体与环境的交互,不断调整策略,以最大化长期累积奖励。这种方法在解决复杂决策问题中显示出强大潜力。随后,刘教授深入剖析了强化学习的基本原理。她详细介绍了强化学习的核心要素,包括状态、动作、奖励、策略和价值函数。通过具体实例和图示,刘教授生动地讲解了推荐系统应用的经典算法,帮助听众理解这些算法如何通过不断试错和学习优化决策策略。接下来,刘教授探讨了强化学习的广泛应用前景。她列举了强化学习在机器人控制、自动驾驶、智能游戏、金融交易和医疗诊断等领域的成功案例,展示了强化学习在实际应用中的巨大潜力。特别是在群智决策领域,强化学习为优化集体智慧、提升决策效率提供了创新解决方案。最后,刘教授讲述了强化学习在群智决策中所面临的挑战。她指出,群智决策中的多智能体协同、实时动态环境以及数据稀缺等问题,给强化学习算法的设计和实现带来了巨大挑战。针对这些挑战,刘教授提出了几种可能的解决方案,并分享了她团队在这一领域的最新研究进展。
此次讲座内容丰富、深入浅出,不仅拓宽了与会者对强化学习的认知,也激发了他们对这一前沿领域的浓厚兴趣。刘璇教授的精彩演讲赢得了现场热烈的掌声,与会者纷纷表示受益匪浅。
人物介绍:刘璇,教育部青年长江学者,湖南省芙蓉学者青年学者,湖南省优青。主要从事人工智能、大数据、智能感知等领域研究工作。相关研究工作发表于TMC、TPDS、TC、INFOCOM、MOBIHOC、 IJCAI等顶级国际期刊和会议,已发表/录用论文70多篇。主持和参与国家重点研发计划以及国家自然科学基金项目多项。担任多个国内外学术会议相关程序委员和组织委员会委员,以及IEEE/ACMTRANS等多个国际期刊和会议审稿人。
(图/文:赵阳洋、刘俊 一审:李秋桂 二审:蔡烁 三审:张锦)