人工智能与数据科学学院师生获人工智能顶会ICLR杰出论文奖

发布时间:2025-04-29 编辑: 浏览次数:10

近日,人工智能领域国际顶级会议ICLR(International Conference on Learning Representations)于新加坡举办,中国科学技术大学人工智能与数据科学学院师生与新加坡国立大学合作完成的论文《AlphaEdit: Null-Space Constrained Model Editing for Language Models》荣获杰出论文奖(Outstanding Paper Award),全球仅有三篇论文获得此项荣誉。中国科大是本年度大陆地区唯一获此殊荣的单位。

图 1 ICLR 2025组委会授予论文合作者ICLR杰出论文奖(右三:何向南教授,左四:方俊峰博士,右二:姜厚丞)

ICLR是人工智能与深度学习领域最具影响力的国际顶级会议之一,与NeurIPS、ICML并称为人工智能领域三大顶会。ICLR聚焦于人工智能的最新研究成果,历年来发表的论文对推动深度学习、自然语言处理、计算机视觉等领域的发展起到了重要作用。每年,ICLR从数千篇投稿中评选出极少数“杰出论文奖”(如2025年从11672篇投稿中选取3篇杰出论文),用于表彰在理论深度、技术创新及应用潜力等方面具有突出贡献的研究工作,获奖论文通常被视为引领领域发展的标志性成果。

图 2 ICLR 2025组委会宣布ICLR杰出论文奖(2025年从3704录用论文中选取3篇杰出论文)

本论文研究针对当前大语言模型(LLM)知识编辑方法存在的核心挑战提出了创新性的解决方案。现有主流的“定位-编辑”策略在更新特定知识时,往往无法避免对原有知识造成破坏,导致模型在多次编辑后出现知识遗忘、文本生成质量下降乃至模型崩溃等严重问题。论文通过深入的理论分析与系统的实验证明,揭示了现有方法未能有效平衡知识更新与知识保留之间关系的根本原因,即编辑操作导致模型隐藏表示的分布偏移。为此,研究团队提出了全新的AlphaEdit方法。该方法通过将模型参数扰动严格投影到保留知识的零空间中,实现在编辑目标知识的同时,最大程度保护模型原有知识不被破坏。尤其值得一提的是,研究者设计了一种仅需一行代码即可实现的高效投影操作,使得AlphaEdit能够灵活集成到现有多种编辑框架中,大幅提升了其性能与实用性。整体而言,AlphaEdit开创性地提出了以零空间投影为核心的语言模型编辑新范式,为未来实现可持续、可靠的语言模型知识更新提供了重要方法论支持。论文也进一步呼吁,未来的语言模型编辑技术应更加注重深层次的知识空间区分,确保在更新特定知识的同时,严格保护已有知识的完整性。

图 3 AlphaEdit为大模型知识编辑提供新范式

图 4 何向南教授率我院Lab for Data Science师生参加ICLR 2025会议

本论文第一作者为方俊峰博士(2024年12月博士毕业于人工智能与数据科学学院,现为新加坡国立大学博士后),第二作者为姜厚丞(在读研二学生),何向南教授和王翔教授共同担任通讯作者。

此次获奖是中国科大在国际人工智能领域取得的重要突破,充分展示了学院在人工智能基础研究方面的深厚实力与国际影响力,以及在人工智能领域前沿研究的引领能力。学院将以此为契机,继续加强原创性、引领性研究,为推动人工智能技术的科学发展作出更大贡献。

人工智能与数据科学学院


联系我们

地址:安徽省合肥市中国科学技术大学招生办公室

电话:0551-63600096,63602553

传真:0551-63603222

邮箱:zsb@ustc.edu.cn