在学实楼负一层的一间普通机房里,三列黑色的计算机柜整齐矗立其间,网络状态指示灯星星般闪烁,机器持续运转发出低沉的轰鸣声。这些看起来“平平无奇”的机器,就是被誉为“国之重器”的超级计算机。得益于已有的高速校园网,学校的科研人员在自己的电脑上就可以通过它们破解作物遗产育种、生物信息等领域的重要密码。
在网信中心等部门的支持下,学校高性能超算平台于2018年7月建成,同年9月通过试运行后正式开放使用,依托信息学院运维管理。目前凭借超强的计算能力在学校科研创新发展中发挥着越来越大的作用。
“2020年上半年,学校高性能超算平台支持了10项省级以上项目,助力发表SCI论文10余篇。”信息科学与工程院长李西灿介绍说,“我们是山东高校中最早建立超算中心的两所高校之一,是当时最先进的。
智能化时代的“最强大脑”
超级计算机是指由数千甚至更多处理器组成,能计算普通计算机和服务器不能完成的大型复杂课题的计算器,被誉为 “计算机中的珠穆朗玛峰”。“超级计算机是一项公共科研基础设施,是智能化信息基础设施中的‘最强大脑’,属于新型基础设施建设的范畴。新基建对科技创新有着巨大的助推作用。”参与学校高性能超算平台前期筹备与建设的网信中心主任孙建迎说。
学校高性能超算平台集群采用CPU+GPU的双重异构架构,计算节点+胖节点的混合体系结构,配备 2台管理节点(mgmt1-2)、14台CPU计算节点 (node1-14)、4台GPU计算节点 (gpu1-4)、2台前后处理节点(gs1-2)、1台文件读写服务器(io1)以及一台HPE3par存储(104TB)组成;集群共有528个CPU计算核心,双精度浮点运算次数理论峰值达每秒69.78万亿次,是个人主流计算机的3500倍左右,是名副其实的“最强大脑”。节点之间使用全互连无阻塞的Infiniband56GB网络进行数据交换,平台集成科研应用软件超过百款,集群为校内科研力量提供的计算资源使用频率已达整个集群的95%以上。
高性能超算平台为全校相关科研人员提供高性能科学计算类和仿真计算类服务。成立时间虽短,平台多次面向全校师生开展常用分析语言和方法的培训。截至2020年10月,高性能超算平台有正式账号93个,遍及学校信息、化学、农学、生科、植保、园艺、动科、机电等10余个学院,为作物遗传育种、生物信息学、人工智能等60多个研究方向提供基因对比分析、数据分析、分子动力学分析等科学计算服务和结构仿真、电磁仿真、力学仿真等仿真计算服务。截至10月底,学校高性能超算平台已成功计算各类大小作业3万多个,已累计为用户分配计算资源达数十万个CPU核次,存储使用超过上百TB,各计算节点基本处于满负荷运行状态。
小平台撬动大科学
2020年,是学校学术集中突破的一年。三四月间,前后不到一个月,科研人员与国际顶级学术期刊《细胞》、《自然》、《科学》来了一次全方位的“亲密接触”。山东农大作为唯一通讯单位的成果登上《科学》主刊并成为封面文章。其通讯作者王宏伟是学校高性能超算平台的“常客”,他说,正是得益于高性能超算平台的助力,团队顺利完成了长穗偃麦草基因组组装,为找到并克隆出抗赤霉病关键基因Fhb7提供了线索,为相关研究内容在《科学》等相关杂志上的发表提供了基础。
用数据分析支撑科学研究,是高性能超算中心的专长。“做研究离不开做计算,但是一般的计算机很难满足要求。”信息学院教师孙晓勇说。他的研究方向是基因组学研究和表型组学研究,需要大量计算。2018年,在他为手上的项目和有限的科研资源发愁时,学校高性能超算平台免费试用的消息传来,他非常兴奋,第一时间预约使用。针对高通量测序大数据,进行生物信息学分析,包括序列比对、突变体检测、非编码RNA识别等。“真是解了燃眉之急,租用国家超算中心,花费巨大且非常不便。”
作为第一批使用高性能超算平台的科研人员,在平台的助力下,不到两年的时间,他的科研项目不断取得突破进展:开发植物环形RNA平台两个,相关研究论文在SCI发表2篇,中文核心期刊2篇,申请发明专利10项,软件著作权20项。在此基础上,申请到了2020年国家自然科学基金面上项目资助。
学校高性能超算平台对于打破学科壁垒、推动跨学科研究的作用也在逐渐显现。信息学院兰鹏团队采集了上万张泰山森林照片,借助高性能超算平台的专业GPU计算节点TeslaP100显卡和深度学习模型进行识别监测,快速发现了森林病害区,准确率达到98%。该成果将应用于泰山森林保护与病虫害防治。
高性能超算平台得到了大批“青椒”的青睐,“90后”教授苏斐应用高性能超算平台的MATLAB软件做计算。机电学院青年教师张婷婷来校前租用国家超算“天河”计算机开展科研,来校工作后使用校内超算平台,科研工作无缝衔接。她说:“没想到咱们学校也有超算,真是太方便了!”许多拟聘用的博士在入职之前就联系预约使用高性能超算平台,确保科研工作的接续。助力科研的同时,高性能超算平台已成为学校集聚高科技人才的重要保障。
工欲善其事,必先利其器
学校高性能超算平台建立之初,由于经费紧张和大家认识的不足,超算平台的建设酝酿了许久。当时山东省高校中只有山东大学有超算中心。很多人认为一所在小城市的农业大学建设超算中心会造成资源的闲置浪费。经费、选址、配套设施等诸多现实问题,一次次地将设想推翻。回忆起这段经历,孙建迎仍然记忆犹新,他说,尽管困难很多,但是所有人都没有放弃这个梦想。“2011年我曾经参观过清华大学超算中心,场景很震撼,从那时起我就坚信这个项目的实施,必将促进学校科学研究的飞速发展。”
在网信中心的协调与支持下,学校高性能超算平台顺利立项,争取到项目经费400万元。工程师们多次利用周末论证、协商,最终以极高的性价比购买了服务器,确定了项目选址———网信中心将位于学实楼负一楼的机房腾出来改造给超算中心使用。此处毗邻强电室,与信息学院的生物信息实验室在同一栋楼,可直接接入网信中心的交换机,节约工程布线的同时,也便于后期的日常管理。
建成后,信息学院精心选派3位专业人员专职对其进行运维管理。三位年轻人对平台日常运维和未来发展倾注了大量精力。高性能超算平台最怕的是停电,停电后机房温度升高,会对设备造成极大伤害。有一天深夜,负责超算平台运维的董老师被停电高温报警信息惊醒,他连忙起床赶到平台机房,检查服务器、存储系统,确保设备安然无恙。
近年来,学校科研任务越来越多,而平台资源有限,平时,他们要积极协调各个科研团队的时间,争取平台资源得到最大化利用,及时关注科研团队需求,广泛调研,将软件从最初的20多个升级到现在的百余个。
未来,高性能超算平台将完成软硬件的跨越升级,有效整合使用学校计算资源,降低科研成本,依靠平台的自主创新,提供全面的技术解决方案,支持科学家挑战农业科学领域影响深远的课题。
“高性能超算平台是一所大学重要的科研支撑条件。”副校长辛杰说,“依靠平台的专业技术支持,在小城市,也可以做大科学。我们相信,未来农业重大的科研发现和创新,可以从这里开始孕育、诞生。”