近日,中國科學院合肥物質院智能所丁增輝研究員聯合華南理工大學靳戰鵬教授團隊,提出一種醫療大模型智能體決策框架FRAME。相關研究工作“FRAME: Feedback-Refined Agent Methodology for Enhancing Medical Research Insights”被第63屆國際計算語言學年會錄用。
探尋新的醫療洞見和決策方法是輔助醫學研究的前沿熱點,大語言模型(LLM)的快速發展為該領域研究提供了重大機遇,但在知識整合與質量保證方面仍面臨嚴峻挑戰。研究團隊提出的FRAME (Feedback-Refined Agent Methodology)框架,旨在通過迭代式優化和結構化反饋來提升醫學洞見性能。該方法包含三大核心創新:一是構建結構化數據集:通過迭代優化,將醫學文獻分解為核心研究要素,構建精細化數據集;二是搭建“生成-評估-反思”三方智能體架構:集成了生成(Generator)、評估(Evaluator)和反思(Reflector)智能體,通過指標驅動的反饋循環,逐步提升內容質量;三是形成綜合評估體系:結合了統計學指標與人工基準,對生成內容進行全方位評測。
對比實驗結果顯示,相較于傳統方法,FRAME框架在運用多種大語言模型提升醫學洞見性能方面效果顯著,在DeepSeek V3上平均提升9.91%,在GPT-4o Mini上也取得了同等級別的改進。同時,人工評估也證實了利用FRAME智能生成的醫療決策質量已能媲美人類水平,尤其在凝練未來研究方向方面表現突出。相關研究成果表明,所構建的FRAME框架,能夠自動生成高標準的醫學研究方案,高效輔助醫學研究。
智能所在讀博士生張一鳴與華南理工大學在讀博士生余承章(中心碩士畢業生)為論文共同第一作者,丁增輝研究員和靳戰鵬教授為共同通訊作者。該方向的研究在智能所首席科學家孫怡寧研究員的長期指導和大力支持下開展,得到了運動健康中心的大力支持,獲得了國家重點研發計劃課題、合肥綜合性國家科學中心醫工融合醫療裝備創新研究平臺項目和安徽省科技重大專項等多個科研項目的持續資助。
據悉,國際計算語言學年會(Annual Meeting of the Association for Computational Linguistics,簡稱ACL)是計算語言學與自然語言處理領域的頂級國際會議,由國際計算語言學協會主辦,每年舉辦一次,是中國計算機學會(CCF)推薦的A類國際學術會議。
文章鏈接:https://arxiv.org/abs/2505.04649
圖 1:醫學智能體(FRAME)架構
圖 2:數據集構建過程概覽。