近日,中国科学院合肥物质院智能所运动与健康信息技术研究中心丁增辉研究员联合华南理工大学未来技术学院靳战鹏教授团队,提出一种医疗大模型智能体决策框架FRAME。相关研究工作“FRAME: Feedback-Refined Agent Methodology for Enhancing Medical Research Insights”已被第63届国际计算语言学年会录用。
探寻新的医疗洞见和决策方法是辅助医学研究的前沿热点,大语言模型(LLM)的快速发展为该领域研究提供了重大机遇,但在知识整合与质量保证方面仍面临严峻挑战。研究团队提出的FRAME (Feedback-Refined Agent Methodology)框架,旨在通过迭代式优化和结构化反馈来提升医学洞见性能。该方法包含三大核心创新:一是构建结构化数据集:通过迭代优化,将医学文献分解为核心研究要素,构建精细化数据集;二是搭建“生成-评估-反思”三方智能体架构:集成了生成(Generator)、评估(Evaluator)和反思(Reflector)智能体,通过指标驱动的反馈循环,逐步提升内容质量;三是形成综合评估体系:结合了统计学指标与人工基准,对生成内容进行全方位评测。
对比实验结果显示,相较于传统方法,FRAME框架在运用多种大语言模型提升医学洞见性能方面效果显著,在DeepSeek V3上平均提升9.91%,在GPT-4o Mini上也取得了同等级别的改进。同时,人工评估也证实了利用FRAME智能生成的医疗决策质量已能媲美人类水平,尤其在凝练未来研究方向方面表现突出。相关研究成果表明,所构建的FRAME框架,能够自动生成高标准的医学研究方案,高效辅助医学研究。
智能所在读博士生张一鸣与华南理工大学在读博士生余承章(中心硕士毕业生)为论文共同第一作者,丁增辉研究员和靳战鹏教授为共同通讯作者。该方向的研究在智能所首席科学家孙怡宁研究员的长期指导和大力支持下开展,得到了运动健康中心的大力支持,获得了国家重点研发计划课题、合肥综合性国家科学中心医工融合医疗装备创新研究平台项目和安徽省科技重大专项等多个科研项目的持续资助。
据悉,国际计算语言学年会(Annual Meeting of the Association for Computational Linguistics ,简称ACL)是计算语言学与自然语言处理领域的顶级国际会议,由国际计算语言学协会主办,每年举办一次,是中国计算机学会(CCF)推荐的A类国际学术会议。本届ACL大会为第63届,于2025年7月27日至8月1日在奥地利维也纳举行,据大会官方统计,本届ACL总投稿数高达8000多篇,创历届之最。
文章链接:https://arxiv.org/abs/2505.04649
图 1:提出了一种医学智能体(FRAME)架构。在训练阶段,系统会在专用数据库中生成并累积反思,这些经验随后会指导方案的生成过程。这种迭代训练范式通过结构化的反馈机制,能够持续优化生成能力。
图 2:数据集构建过程概览。