学术动态

首页 >> 学术动态 >> 正文

【成才在珞珈】武大学子成果被ACM CCS 2025录用

发布时间:2025-09-03 18:16 来源:信息管理学院 阅读:
A A A

新闻网讯(通讯员刘家伟)近日,信息管理学院博士研究生陈卓作为第一作者的论文“FlippedRAG: Black-Box Opinion Manipulation Attacks to Retrieval-Augmented Generation of Large Language Models”(《针对大语言模型检索增强生成系统的黑盒观点操纵攻击》)被第32届国际计算机与通信安全会议(ACM Conference on Computer and Communications Security,ACM CCS 2025)录用。该论文的合作指导教师为信息管理学院教授陆伟、副教授程齐凯、特聘副研究员张帆、博士后刘家伟(通讯作者)和美国伍斯特理工学院副教授刘晓钟。信息管理学院博士生刘昊坦、硕士生陈淼坤、本科生龚宇扬参与了论文相关工作。

检索增强生成(RAG)技术通过引入外部知识库增强模型生成能力,被广泛应用于减轻幻觉现象、提升答案准确性。RAG技术生成内容的可靠性、安全性也日益受到关注。现有RAG可靠性研究多集中于白盒设定或仅针对事实性问答任务,未能深入揭示在黑盒环境下、针对具有争议性观点类任务的潜在威胁。该论文着眼于这一关键空白,提出一种基于迁移学习的对抗攻击方法FlippedRAG,揭示了RAG系统在面对少量被恶意修改的检索数据时存在的安全漏洞。攻击者即使在逼近真实场景的黑盒设定下,仍可无需了解模型内部信息,通过逆向构建代理检索器并设计对抗性触发文本、污染极少量文档就能操纵大模型生成带有某种偏见的观点。实验表明,FlippedRAG相比基线攻击方法平均提升了攻击成功率达16.7%,可导致大模型生成答案的观点极性发生50%的偏移。该论文还实施了用户实验,探究这类RAG漏洞对人的真实影响,发现FlippedRAG可以引发用户认知观点产生20%的显著转变。FlippedRAG还能够规避已有的防御检测手段,克服了已有攻击方法受限于白盒场景或采用易被检测的启发式方法的局限。

据悉,ACM CCS 2025将于2025年10月13至17日在中国台北召开。ACM CCS与IEEE S&P、USENIX Security、NDSS并称为信息安全领域国际四大顶级学术会议,也是中国计算机学会(CCF)推荐的A类会议。ACM CCS近十年录用率约为18%,被录用的稿件反映了信息安全领域国际最前沿的研究水平。

(供图:信息管理学院 编辑:相茹)

最新阅读