新闻网讯(通讯员 次雨桐 张蓉)3月14日,ACM Transactions on Computer Systems(TOCS)发表了我校计算机科学与技术学院石宣化教授团队的最新研究成果“Deca: a Garbage Collection Optimizer for In-memory Data Processing”。
现有内存计算模式在处理大型数据集时会创建大量长寿命数据对象,使垃圾回收器的工作时间变长,从而限制了系统的可扩展性。为了解决这一问题,石宣化教授团队提出一种基于生命周期的内存管理框架,自动分析用户定义的函数与数据类型的预期生命周期,并依此分配与释放对象,最终减少了垃圾回收的开销,增强了系统的可扩展性。该团队在此研究基础上,研发了原型系统Deca。Deca系统透明地将具有相似生命周期的对象分解,放置在字节数组中,并在它们的生命周期结束时释放其占用的空间。当系统处理大型数据集时,Deca提供面向字段的内存页面以确保高压缩效率。实验表明,与国际流行的Spark系统相比,Deca能够将垃圾回收时间减少99.9%,内存消耗减少46.6%,缓存开销减少23.4%;在无数据溢出时,实现1.2x-22.7x的加速,在有数据溢出时,实现16x-41.6x的加速。
据悉,ACM Transactions on Computer Systems(TOCS)创办于1983年,是ACM系统领域顶级期刊,每年出版四期,每期三篇左右论文。目前,以国内机构作为第一署名单位在该刊发表的论文仅有四篇。
图1Deca系统与Spark系统长生命周期对象数目和垃圾回收时间对比
我校计算机科学与技术学院石宣化教授为论文第一作者,金海教授和硕士生柯志祥、张雄、王斐、胡振宇参与了该项研究。论文的合作者还包括丹麦哥本哈根大学周永銮副教授、英国华威大学何黎刚副教授和阿里巴巴陆路工程师。此项研究工作得到国家自然科学基金、国家重点研发计划和湖北省杰出青年基金的资助。
论文链接:https://dl.acm.org/citation.cfm?id=3310361