大语言模型在医疗决策中的自适应协作策略

基础模型已经在医疗领域中发挥着不可替代的作用。然而，如何将大语言模型（LLMs）部署到复杂医疗任务中仍然是一个亟待解决的问题。为了解决这个问题，我们开发了一款名为医疗决策代理（MDAgents）的新框架。该框架可以自动分配 LLMs 的协作结构，以适应不同医疗任务的复杂性。这种协作结构模拟了现实世界中的医疗决策过程。我们使用最新的 LLMs 对我们的框架和基准方法进行了评估，结果表明我们的框架在 7 项医疗基准测试中取得了 5 项最佳性能，这些基准测试需要理解多模态医疗推理。进一步的研究表明，MDAgents 能够根据实际情况调整协作代理数量，以提高效率和准确性。此外，我们还研究了协作代理在复杂临床团队动态中的行为方式，提供了有价值的见解。我们的代码已经公开，欢迎访问 https://github.com/mitmedialab/MDAgents。

一、引言

本项研究提出了一个名为“Medical Decision-making Agents (MDAgents)”的新框架，旨在解决在医疗决策制定中有效利用大型语言模型（LLMs）的策略部署问题。医疗决策制定是一个复杂且多面的过程，临床医生需要在复杂的背景下，结合广泛而多样的信息源来做出准确的结论。随着大型语言模型（LLMs）在医疗领域的潜在应用逐渐显现，如何有效地将这些模型融入医疗决策制定过程中成为了一个亟待解决的问题。MDAgents框架通过自动为LLMs分配有效的协作结构，旨在模仿现实世界的医疗决策制定过程。

二、MDAgents框架概述

MDAgents框架的核心是自动为LLMs分配协作结构，这可以是单独工作或是以组队的形式。该协作结构的分配是基于当前医疗任务的复杂性来定制的。通过这种方法，MDAgents能够在不同的医疗场景中实现高效和准确的决策制定。

三、研究方法与实验

为了验证MDAgents框架的有效性，研究团队在一系列具有挑战性的医疗基准测试中进行了实验，包括MedQA、MedMCQA、PubMedQA、DDXPlus、PMC-VQA、Path-VQA和MedVidQA。这些基准测试涵盖了多模态医疗推理的各个方面。实验结果显示，MDAgents在其中的5项基准测试中取得了最佳性能，证明了其在多模态医疗推理任务中的优越性能。

此外，研究团队还进行了消融研究，以探究MDAgents如何适应不同数量的协作代理来优化效率和准确性。这些研究揭示了MDAgents在不同场景下的鲁棒性。

四、团队共识动力学探索

除了基本的性能评估外，研究团队还深入探索了MDAgents中协作代理的团队共识动力学。这一探索为理解协作代理在复杂临床团队中的行为提供了有价值的见解。

五、结论与展望

MDAgents框架通过自动为LLMs分配协作结构，为医疗决策制定提供了新的思路。实验结果表明，MDAgents在多模态医疗推理任务中取得了显著的性能提升。未来，该框架有望进一步扩展和优化，以适应更广泛的医疗场景和更复杂的决策制定任务。

此外，MDAgents的研究也为医疗人工智能领域带来了新的启示。随着医疗数据的不断增长和医疗决策的复杂性不断提高，人工智能技术在医疗领域的应用将越来越广泛。MDAgents框架的成功实践为其他医疗人工智能研究提供了有益的参考和借鉴。

六、代码与资源

为了方便其他研究者进一步探索和应用MDAgents框架，研究团队将相关的代码和资源公开在了GitHub上（https://github.com/mitmedialab/MDAgents）。这为推动医疗人工智能领域的研究和应用提供了宝贵的资源支持。

–EOF–
转载须以超链接形式标明文章原始出处和作者信息及版权声明.