PIORS: 基于大语言模型和多智能体医疗场景仿真的个性化智能门诊接待系统

在中国,导诊护士在门诊环境中面临着超负荷的工作量,这限制了他们为每位患者提供服务的时间和精力,并最终降低了服务质量。在本文中,我们提出了个性化智能门诊接待系统 (PIORS)。该系统集成了基于大语言模型 (LLM) 的导诊护士,并将大语言模型 (LLM) 与医院信息系统 (HIS) 的协作应用于真实的门诊接待环境中,旨在提供个性化、高质量、高效的接待服务。此外,为了提高大语言模型在真实医疗保健场景中的性能,我们提出了一个名为服务流程感知的医疗场景仿真 (SFMSS) 的医疗对话数据生成框架,旨在使大语言模型适应真实环境和 PIORS 系统设置。我们通过 15 名用户和 15 名临床专家参与的自动评估和人工评估来评估 PIORS 和 SFMSS 的有效性。结果表明,PIORS-导诊护士优于所有基线模型,包括当前最先进的模型 GPT-4o,并且符合人类偏好和临床需求。更多细节和演示请访问 https://github.com/FudanDISC/PIORS。

1. 论文的研究目标及背景

研究目标与实际问题

研究目标:本文旨在开发一个基于大型语言模型(LLM)的个性化智能门诊接待系统(PIORS),以解决中国门诊接待护士工作负荷过重、服务质量下降的问题。该系统通过将LLM与医院信息系统(HIS)集成到真实的门诊接待环境中,提供个性化、高质量且高效的接待服务。

实际问题:在中国,门诊接待护士面临巨大的工作量,导致每位患者得到的时间和注意力有限,从而降低了服务质量。此外,患者在门诊过程中经常花费大量时间等待,这影响了整体效率。

是否为新问题:这是一个相对较新的问题,尽管医疗信息化已有多年发展,但如何利用AI技术特别是LLM来优化门诊接待流程,仍然是一个新兴的研究领域。

科学假设:通过集成LLM到门诊接待流程中,可以显著提高接待效率和患者满意度。

相关研究

  • 医疗LLM的应用:已有研究探索了LLM在医疗领域的应用,如疾病诊断、药物建议等。
  • 门诊接待流程优化:传统方法多依赖于人工规则或简单的自动化系统,缺乏个性化和灵活性。

研究归类:本文属于医疗信息化人工智能应用的交叉领域,特别是关注于大型语言模型在医疗场景中的应用

领域内值得关注的研究员:文中提到的研究者包括Zhijie Bao、Qingyun Liu、Ying Guo等,他们在医疗信息化和人工智能领域有着丰富的研究经验。

2. 论文提出的新思路、方法或模型

新思路与方法

PIORS系统:该系统由四个主要参与者组成:患者、接待护士(PIORS-Nurse,基于LLM的虚拟护士)、临床医生和信息助手(HospInfo-Assistant)。PIORS-Nurse负责与患者交互,收集医疗信息,提供部门推荐和初步诊断信息。

关键解决方案

  • 个性化服务:根据患者的具体情况和需求提供定制化的接待服务。
  • 高效信息收集:通过自动化手段收集患者的症状和病史,减轻人工负担。
  • 集成HIS系统:与医院信息系统无缝集成,确保信息的准确性和实时性。

特点与优势

  • 个性化:能够根据患者的具体情况提供定制化的建议和服务。
  • 高效性:自动化流程显著提高了信息收集和部门推荐的效率。
  • 灵活性:系统能够适应不同的患者需求和场景变化。

与之前的方法相比,PIORS系统更加智能化和个性化,能够更好地适应复杂的医疗场景。

模型与方法细节

  • PIORS-Nurse:由交互模块、查询生成模块和总结模块组成。交互模块负责与患者交互;查询生成模块用于生成查询请求以获取额外信息;总结模块则从对话中提取预诊断信息。
  • HospInfo-Assistant:通过自然语言指令提取结构化参数,并与HIS系统进行交互。
  • SFMSS框架:用于生成模拟对话数据,以训练和优化PIORS-Nurse。该框架包括患者模拟器、接待护士模拟器和监督代理。

3. 实验设计与结果验证

实验设计

实验目标:验证PIORS系统的有效性和效率。

实验方法

  • 自动评估:通过模拟对话评估不同模型在部门推荐和信息收集能力方面的表现。
  • 人工评估:招募15名用户和15名临床专家进行盲测对比,评估PIORS-Nurse与基线模型的表现。

数据集

  • 基于2023-2024年的真实门诊记录构建,包含2,400条训练样本和500条测试样本。
  • 使用SFMSS框架生成模拟对话数据(SFMSS-CD),用于训练PIORS-Nurse。

实验数据与结果

自动评估结果

  • PIORS-Nurse在部门推荐准确率、信息收集能力、对话平均轮数和平均轮长等指标上均优于基线模型,包括GPT-4o和Qwen2-7B-Instruct等。

人工评估结果

  • 用户评估显示,PIORS-Nurse在73%的样本中表现优于GPT-4o,81%的样本中表现优于或等同于SF-ablated nurse。
  • 专家评估认为,PIORS-Nurse在主动询问能力和简洁响应方面表现突出,且整体表现最佳。

关键数据

  • 部门推荐准确率:PIORS-Nurse为82.2%,高于GPT-4o的71.7%和Qwen2-7B的63.4%。
  • 对话平均轮数:PIORS-Nurse为3.22轮,显著低于其他基线模型。

实验支持科学假设:实验结果表明,集成LLM的门诊接待系统能够显著提高效率和患者满意度,验证了科学假设。

4. 论文贡献与业界影响

论文贡献

  • 提出PIORS系统:一个基于LLM的个性化智能门诊接待系统,能够显著提高门诊接待效率和患者满意度。
  • SFMSS框架:一个用于生成模拟对话数据的框架,支持PIORS系统的开发和优化。
  • 实验验证:通过自动和人工评估验证了PIORS系统的有效性和效率。

业界影响

  • 提高医疗服务质量:通过自动化和智能化手段减轻门诊接待护士的工作负担,提高服务质量。
  • 优化医疗资源分配:通过高效的信息收集和部门推荐,优化医疗资源的分配和利用。
  • 推动医疗信息化发展:为医疗信息化提供了新的思路和方法,推动行业进步。

潜在应用场景与商业机会

  • 医院门诊接待:直接应用于医院门诊接待流程,提高效率和患者满意度。
  • 远程医疗服务:结合远程医疗技术,提供更加便捷的医疗服务。
  • 健康管理平台:集成到健康管理平台中,为用户提供更加个性化的健康管理服务。

工程师应关注方面

  • 系统集成技术:如何将PIORS系统与现有的HIS系统无缝集成。
  • 数据安全与隐私保护:在收集和处理患者信息时如何确保数据安全和隐私保护。
  • 用户体验优化:如何通过持续优化用户体验来提高患者满意度。

5. 未来研究方向与挑战

值得探索的问题

  • 多模态交互:探索结合语音、图像等多模态信息的门诊接待系统。
  • 跨语言支持:开发支持多种语言的门诊接待系统,以适应不同地区的需求。
  • 持续学习与优化:如何使系统能够持续学习并优化自身性能。

催生新技术与投资机会

  • AI与医疗信息化融合:推动AI技术在医疗信息化领域的深入应用。
  • 智能化医疗设备:结合物联网和AI技术开发更加智能化的医疗设备。
  • 健康管理服务:提供个性化的健康管理服务,满足用户多样化的需求。

6. 论文的不足与存疑之处

不足与缺失

  • 数据集局限性:仅基于一家医院的门诊记录构建数据集,可能存在地域和文化差异的影响。
  • 模拟对话的真实性:模拟对话数据可能与真实对话存在差异,需要进一步验证。
  • 系统泛化能力:系统的泛化能力尚未得到充分验证,需要在不同医院和场景中进行测试。

需要验证与存疑的方面

  • 用户接受度:用户对智能化门诊接待系统的接受度如何?
  • 法规与伦理问题:在收集和处理患者信息时如何遵守相关法规和伦理规范?
  • 长期效益评估:系统对医疗服务质量和患者满意度的长期影响如何?

–EOF–
转载须以超链接形式标明文章原始出处和作者信息及版权声明.

No comments: