西电主页 English 宣传部
西电要闻
表格等宽内容时,请左右滑动 <>
【创新西电】西电3篇文章被国际计算语言学年会ACL主会录用
时间:2024-06-04 14:30:02来源:电子工程学院 计算机科学与技术学院点击:

西电新闻网讯(通讯员 闫杰熹)近日,2024年(第62届)度国际计算语言学年会(Annual Meeting of the Association for Computational Linguistics,简称ACL)公布了论文录用结果。学校共3篇文章被ACL主会录用,第一作者分别是邓成教授团队的博士生胥喆和徐承昊,以及赵伟和管子玉教授团队的博士生赵杰。

ACL是计算语言学和自然语言处理领域国际排名第一的顶级学术会议,由国际计算语言学协会组织,每年召开一次,在中国计算机学会(CCF)推荐会议列表中被列为A类会议。2024年是第62届会议,将于8月11日至8月16日在泰国曼谷举行。

胥喆博士的论文“Exploiting Intrinsic Multilateral Logical Rules for Weakly Supervised Natural Language Video Localization” 关注弱监督自然语言视频定位任务,其目标是在训练过程中仅使用视频-语言对的情况下检索视频中与语言查询对应的时刻。尽管取得了巨大的成功,现有的方法很少考虑蕴含在语言查询中复杂的时序关系(例如,语言查询与它的同义查询或从它分解的子查询之间的关系),从而产生不合逻辑的预测。为此,本文提出了一种新的即插即用方法——基于固有多边逻辑规则的弱监督自然语言视频定位方法。具体来说,我们将从原始语言查询派生的查询形式化为有向图(即固有时序关系图)的节点,并将它们之间的时间关系形式化为边。我们提出了一种关系引导的提示方法,以分层方式利用预训练的语言模型生成固有时序关系图。我们根据固有时序关系图定义了四种类型的多边时序逻辑规则(即全同、包含、同步和相继),并利用它们来训练我们的模型。实验证明了该方法在多个数据集上的有效性和优越性。

徐承昊博士的论文“LLM Knows Body Language, Too: Translating Speech Voices into Human Gestures”提出了一个手势翻译范式,GesTran,它利用大型语言模型来加深对语音和手势之间联系的理解,并通过将手势解释为一种独特的肢体语言形式来顺序生成人类手势。该框架的初级阶段采用基于变压器的自编码器网络将人类手势编码为离散符号。在此之后,后续阶段使用预训练的LLM来破译语音和手势之间的关系,通过将手势解释为LLM中唯一的语言标记,将语音翻译成手势。该方法通过在多个数据集上进行的广泛和公正的实验,证明了最先进的性能提升。

赵杰博士的论文“SC2: Towards Enhancing Content Preservation and Style Consistency in Long Text Style Transfer”聚焦于文本风格迁移任务。最近的相关研究在短文本风格迁移任务上取得了一些进展,但仍是一个相对简单的任务,实际应用有限。针对更为全面的长文本风格迁移面临的两大挑战:(1)现有方法难以准确评估多个Token的内容属性,导致内容退化;(2)传统的单一风格分类器损失难以保证多个生成句子的风格一致性,我们提出了一种新方法SC2。该方法设计了一个多层联合风格-内容衡量模块(JSCW)和一种风格一致性损失来解决这两个问题。JSCW模块同时评估Token中的风格和内容属性,以获得无损的内容表示,从而增强内容保留。同时,多个JSCW层进一步逐步优化内容表示。我们还设计了一种风格一致性损失,确保生成的多个句子可以一致地表达出目标风格。此外,我们结合了一个去噪非自回归解码器用以加速训练。实验结果表明,SC2方法明显优于最优的基线方法。本文所提出的SC2预计在社交媒体内容改写、文学创作、低资源场景数据增强等领域有着较好的应用前景。

上一条:教育部党组任命任小龙同志为西安电子科技大学党委书记
下一条:【学在西电】教育部计算机“101计划”工作组组长、北京大学胡振江教授来校作主题报告

【创新西电】西电3篇文章被国际计算语言学年会ACL主会录用
发布时间:2024-06-04 14:30:02来源:电子工程学院 计算机科学与技术学院点击:我要评论:

西电新闻网讯(通讯员 闫杰熹)近日,2024年(第62届)度国际计算语言学年会(Annual Meeting of the Association for Computational Linguistics,简称ACL)公布了论文录用结果。学校共3篇文章被ACL主会录用,第一作者分别是邓成教授团队的博士生胥喆和徐承昊,以及赵伟和管子玉教授团队的博士生赵杰。

ACL是计算语言学和自然语言处理领域国际排名第一的顶级学术会议,由国际计算语言学协会组织,每年召开一次,在中国计算机学会(CCF)推荐会议列表中被列为A类会议。2024年是第62届会议,将于8月11日至8月16日在泰国曼谷举行。

胥喆博士的论文“Exploiting Intrinsic Multilateral Logical Rules for Weakly Supervised Natural Language Video Localization” 关注弱监督自然语言视频定位任务,其目标是在训练过程中仅使用视频-语言对的情况下检索视频中与语言查询对应的时刻。尽管取得了巨大的成功,现有的方法很少考虑蕴含在语言查询中复杂的时序关系(例如,语言查询与它的同义查询或从它分解的子查询之间的关系),从而产生不合逻辑的预测。为此,本文提出了一种新的即插即用方法——基于固有多边逻辑规则的弱监督自然语言视频定位方法。具体来说,我们将从原始语言查询派生的查询形式化为有向图(即固有时序关系图)的节点,并将它们之间的时间关系形式化为边。我们提出了一种关系引导的提示方法,以分层方式利用预训练的语言模型生成固有时序关系图。我们根据固有时序关系图定义了四种类型的多边时序逻辑规则(即全同、包含、同步和相继),并利用它们来训练我们的模型。实验证明了该方法在多个数据集上的有效性和优越性。

徐承昊博士的论文“LLM Knows Body Language, Too: Translating Speech Voices into Human Gestures”提出了一个手势翻译范式,GesTran,它利用大型语言模型来加深对语音和手势之间联系的理解,并通过将手势解释为一种独特的肢体语言形式来顺序生成人类手势。该框架的初级阶段采用基于变压器的自编码器网络将人类手势编码为离散符号。在此之后,后续阶段使用预训练的LLM来破译语音和手势之间的关系,通过将手势解释为LLM中唯一的语言标记,将语音翻译成手势。该方法通过在多个数据集上进行的广泛和公正的实验,证明了最先进的性能提升。

赵杰博士的论文“SC2: Towards Enhancing Content Preservation and Style Consistency in Long Text Style Transfer”聚焦于文本风格迁移任务。最近的相关研究在短文本风格迁移任务上取得了一些进展,但仍是一个相对简单的任务,实际应用有限。针对更为全面的长文本风格迁移面临的两大挑战:(1)现有方法难以准确评估多个Token的内容属性,导致内容退化;(2)传统的单一风格分类器损失难以保证多个生成句子的风格一致性,我们提出了一种新方法SC2。该方法设计了一个多层联合风格-内容衡量模块(JSCW)和一种风格一致性损失来解决这两个问题。JSCW模块同时评估Token中的风格和内容属性,以获得无损的内容表示,从而增强内容保留。同时,多个JSCW层进一步逐步优化内容表示。我们还设计了一种风格一致性损失,确保生成的多个句子可以一致地表达出目标风格。此外,我们结合了一个去噪非自回归解码器用以加速训练。实验结果表明,SC2方法明显优于最优的基线方法。本文所提出的SC2预计在社交媒体内容改写、文学创作、低资源场景数据增强等领域有着较好的应用前景。

责任编辑:冯毓璇
本月热点