教学科研

当前位置: 首页 > 教学科研 > 正文

信息工程学院本科生提出AI新模型解决中文短新闻文本精炼摘要生成问题在SCI一区发表

来源:信息工程学院   发布时间:2024-08-30   编辑:迟婧婧   打印   字号:

新闻网讯  近日,信息工程学院本科生曹康杰以第一作者在《Expert Systems With Applications》期刊上发表题目为“DMSeqNet-mBART: A state-of-the-art Adaptive-DropMessage enhanced mBART architecture for superior Chinese short news text summarization”的研究成果(论文链接:https://doi.org/10.1016/j.eswa.2024.125095)。论文通讯作者程卫军副教授给予了全程指导,同时也受到了阿里巴巴Hummingbird Audio 实验室郝一亚博士后的指导,论文合作者还包括本科生甘一超等4位同学,并做出了相应的贡献。《Expert Systems With Applications》是人工智能、运筹学等领域国际顶级期刊,在全球具有较强的学术影响力。

本研究针对中文互联网短新闻文本数量与日俱增,如何快速、准确地生成这些文本的精炼摘要所带来的挑战,综合应用自适应消息丢弃技术(Adaptive-DropMessage)、动态卷积层、门控残差连接、自定义前馈网络及增强的自注意力和交叉注意力机制等,首次提出了针对中文短新闻文本摘要的一种基于mBART框架的创新模型——DMSeqNet-mBART,如下图所示。实验效果表明该模型显著提升了摘要的流畅性、完整性和准确性,并在多个权威数据集上超越了当前的业界领先模型,如T5、MLC、PLCC和GPT-4。尤其在BERTScore、BLEU和ROUGE等关键指标上,DMSeqNet-mBART的表现尤为突出。

该研究成果不仅为中文短新闻文本摘要提供了一个高效、精准的解决方案,也为未来在其他语言和领域的文本摘要应用奠定了坚实的基础。DMSeqNet-mBART模型在新闻聚合、企业会议记录总结、AI个人助手及教育工具等多个实际场景中具有广泛的应用前景。未来,本合作团队计划继续优化该模型的架构,并探索其在多语言、多领域文本处理中的应用潜力。

该研究成果得到了国家自然科学基金(52374169)的资助,充分体现了信息工程学院在科学研究和技术创新方面的实力和贡献。

新闻网版权与免责声明:

① 凡本网未注明其他出处的作品,版权均属于中央民族大学新闻中心,转载、摘编或以其它方式使用本网作品的应注明“来源:中央民族大学新闻网”。违反上述声明者,本网将追究其相关法律责任。

② 凡本网注明其他来源的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。

③ 有关作品内容、版权和其它问题请与我们联系。

联系方式:中央民族大学新闻中心 mucxcb@muc.edu.cn

中央民族大学官方微信中央民族大学官方微博中央民族大学官方B站中央民族大学官方抖音