MedBuild AI:基于代理的混合智能框架,通过医疗建筑生成设计重塑医疗基础设施规划中的代理权



论文信息

  • 标题 (Title): MedBuild AI: An Agent-Based Hybrid Intelligence Framework for Reshaping Agency in Healthcare Infrastructure Planning through Generative Design for Medical Architecture


  • 作者 (Authors): Yiming Zhang, Yuejia Xu, Ziyao Wang, Xin Yan*, Xiaosai Hao

  • 机构 (Affiliations): 北京建筑大学 (BUCEA) 建筑与城市规划学院

  • 发表年份 (Year): 2025 (Preprint, Oct 18, 2025)


结构化摘要 (Structured Abstract)

  • 背景/目标 (Background/Objective): 全球医疗基础设施分布极不均衡,尤其在资源匮乏地区,面临“知识缺口”与“资源缺口”的双重困境。传统规划流程缓慢、昂贵且缺乏对当地语境的适应(即“不可能三角”)。本研究旨在开发一个基于混合智能(Hybrid Intelligence)的 Web 平台,使缺乏专业知识的社区也能参与并获取合规、低成本、模块化的医疗建筑设计方案。

  • 方法 (Methods): 提出了 MedBuild AI 框架,采用**多智能体(Multi-Agent)**系统架构,融合了 LLM 的语义理解能力与专家系统的确定性计算能力。系统包含三个核心智能体:

    1. 对话智能体:负责采集本地定性需求并编码为结构化数据(DQL)。

    2. 专家系统智能体:基于规则的确定性计算引擎,生成功能任务书和预算控制。

    3. 设计与布局智能体:结合 LLM 规划与程序化几何引擎生成 3D 建筑模型。

  • 结果 (Results): 通过四个不同语境(乡镇、大都市、新城、沿海村庄)的案例研究,证明了系统能根据人口、预算和地理约束,自动生成从 10 床位诊所到 1500 床位综合医院的差异化方案。

  • 结论 (Conclusion): MedBuild AI 展示了神经符号 AI(Neuro-Symbolic AI)在建筑设计中的潜力。它不旨在替代建筑师,而是通过计算互惠(Computational Reciprocity)赋予社区规划主导权,将设计过程转化为透明的协商平台。

1. 引言 (Introduction)

1.1. 研究背景与核心问题 (Research Background & Problem Statement)

  • 宏观背景:尽管联合国提出了可持续发展目标(SDG 3),但全球全民健康覆盖(UHC)进展停滞。数十亿人缺乏基本医疗服务,非洲等地区存在严重的“空间失衡”(Spatial Imbalance),即医疗资源高度集中于城市,农村成为“医疗荒漠”。

  • 行业痛点:传统医疗设施规划存在“不可能三角”(图 3):设计周期速度建设成本与**语境适应性(Contextual Fit)**之间难以兼顾。现有流程过于依赖外部专家,导致“互动失效”:

    • 信息差:本地知识被边缘化。

    • 结构性低效:审批和设计周期过长。

    • 可建造性困境:设计往往忽视本地低技术(Low-tech)和模块化施工能力。

  • 核心研究问题:如何利用 AI 技术构建一个混合智能框架,既能利用专业医学建筑知识,又能赋予本地社区参与权,从而快速、低成本地生成符合当地语境的医疗设施概念设计?

1.2. 文献综述与研究缺口 (Literature Review & Research Gap)

  • 现有方法演变

    1. 早期生成范式:基于数学优化(如 QAP, MIP)和规则系统(如 Shape Grammars)。缺点:输入要求高,难以处理定性因素(文化、社会需求)。

    2. 数据驱动范式:基于 GANsGNNs 的生成设计。缺点:“黑盒”性质,缺乏可解释性,难以保证严格的功能和法规约束(Hallucination)。

  • 研究缺口 (Gap)

    • 现有的计算工具链是断裂的:定量优化(数学模型)、模式生成(AI)与定性协商(人类对话)之间存在鸿沟。

    • 缺乏一个端到端的、能将自然语言需求转化为合规工程模型的集成系统。

    • 现有的 AI 辅助设计多关注视觉生成,忽视了医疗建筑特有的严格逻辑(如流线控制、院感防控)。

1.3. 研究目标与核心理念

  • 目标:构建 MedBuild AI,一个基于 Web 的三智能体系统。

  • 核心理念混合智能(Hybrid Intelligence)。即利用 LLM 处理模糊的自然语言和逻辑规划,利用确定性代码(Python)处理数值计算和几何约束,实现“创造性”与“可验证性”的平衡。

2. 研究设计与方法 (Methodology)

2.1. 系统架构:三智能体框架 (The Three-Agent Framework)

系统遵循“对话-编译-计算-生成-合成”的工作流,核心是 DQL (Dimensional Qualitative Local-health-intelligence),这是一种 JSON 格式的中间数据载体,贯穿全流程。

2.2. Agent 1: 对话与信息编码智能体 (Dialogue & Information Encoding)

  • 功能:降维(Dimensionality Reduction)。将非结构化的用户叙述转化为结构化的机器指令。

  • 流程

    1. 启发式数据引出:MedBuild-GPT 与用户进行苏格拉底式对话。

    2. PHCMEISXG 框架:基于 P(人口)、H(健康威胁)、C(文化)、M(母婴)、E(现有资源)、I(基础设施)、S(安全)、X(经济)、G(地理)九个维度提取信息。

    3. 两阶段编译:先由 LLM 总结为要点,再由 Encoder LLM 转化为紧凑的 DQL 字符串(如 P:pop=50000...|X:budget=5...)。

2.3. Agent 2: 专家系统智能体 (Functional Programming Expert System)

  • 性质确定性(Deterministic)基于规则(Rule-based)。这是本研究区别于纯生成式 AI 的关键,旨在避免幻觉,确保医疗规划的科学性。

  • 核心算法

    1. 需求预测:基于人口增长率和多因子加权评分模型(考虑疾病复杂度和基础设施)确定医院等级(Level Score)。

    2. 床位计算:计算 理论需求 - 现有有效供给 + 修正因子(如传染病、冲突创伤) = 净床位缺口。

    3. 功能与预算优化

      • 根据公共卫生标准计算手术室(ORs)、ICU 等具体房间数量。

      • 预算倒逼算法:如果 估算成本 > 预算,系统会根据临床优先级(Priority Hierarchy)自动削减非核心面积,直到方案在预算内。

2.4. Agent 3: 建筑设计与布局智能体 (Architectural Design & Layout)

  • LLM 布局规划器 (Knowledge-Injected Generation)

    • 使用“知识注入”Prompt,包含医疗建筑拓扑库(如 Courtyard, Podium-Tower, Finger Plan)。

    • 强制执行几何约束:边界依附、无环路(树状拓扑)、双方案输出(S1/S2)。

  • 程序化 3D 引擎 (Procedural Geometry Engine)

    • 技术细节:为避免浮点数误差,使用离散整数网格 (Discrete Integer Grid) 进行布尔运算。

    • 轮廓生成:采用闵可夫斯基和(Minkowski Sum)近似法生成建筑轮廓。

    • 布局算法

      1. 智能分层:根据基地面积动态计算所需楼层数。

      2. 瀑布流分配:优先安置核心医疗科室。

      3. 网格化模块生成:将房间映射到结构网格,生成模块化组件(便于预制装配)。

3. 结果与发现 (Results & Findings)

3.1. 案例研究 (Case Studies)

论文展示了系统在四种极端不同场景下的适应能力(Table 4):

  1. 成长型乡镇 (Case 1):人口 5 万,预算 500 万美元。系统生成了一个 172 床的二级医院,采用分散式布局以适应宽松用地。

  2. 大型都市 (Case 2):人口 60 万,预算 5000 万美元。系统生成了 1500 床的三级医院,采用高密度塔楼(Podium-Tower)应对用地紧张。

  3. 未来新城 (Case 3):人口 300 万。生成了超大规模教学医院园区。

  4. 沿海渔村 (Case 4):人口 5 千,预算极低。系统生成了 10 床的一级卫生中心,并建议采用架空结构以应对洪水风险。

3.2. 关键发现

  • 语境敏感性:系统不仅调整规模,还调整形态。例如在 Case 4 中,它识别出洪水风险并调整了底层结构逻辑。

  • 预算控制:Agent 2 的迭代算法成功将设计控制在预算范围内,实现了“设计即算账”的透明化。

  • 模块化输出:生成的 3D 模型具有明显的模块化特征,直接对应低技术、预制化的建造逻辑。

4. 讨论 (Discussion)

4.1. 理论贡献:神经符号 AI 的应用

  • 论文对比了 MedBuild AI 与其他计算设计框架(如 QAP, GANs, GNNs)(Table 5)。

  • 核心优势:MedBuild AI 处于“混合智能”象限,结合了 LLM 的意图理解(Intent Understanding)和专家系统的可验证性(Verifiability)。它解决了纯数学模型难以使用、纯深度学习模型不可解释/不可控的问题。

4.2. 实践启示:重塑代理权 (Reshaping Agency)

  • 流程变革:从线性的“专家主导”转变为循环的“人机协作”。

  • 赋能:将复杂的医疗规划知识封装在后台,前台通过自然语言交互,使得没有建筑学背景的本地社区领袖、医生也能参与早期规划,并即时看到预算和功能的权衡(Trade-offs)。这是一种**设计协商(Design Negotiation)**工具。

4.3. 局限性与未来研究

  • 局限性:目前的 PHCMEISXG 框架难以完全捕捉复杂的文化动态;地形适应能力有限;缺乏多目标(能耗、流线)的同时优化能力。

  • 未来方向

    • 引入 RAG (检索增强生成),结合各国的具体建筑规范。

    • 引入 GNN (图神经网络) 优化复杂的房间邻接关系。

    • 对接 BIM (IFC 格式),实现从概念设计到深化设计的无缝衔接。

5. 结论 (Conclusion)

MedBuild AI 提出了一种应对全球医疗基础设施不平等的务实技术路径。通过“对话-编译-计算-生成”的工作流,它不仅是一个生成工具,更是一个**计算互惠(Computational Reciprocity)**的媒介。它证明了在资源受限的语境下,AI 可以通过降低专业门槛、提供透明的决策支持,来促进更公平的建筑设计实践。

6. 核心参考文献 (Core References)

  1. World Health Organization (2023)Tracking universal health coverage: 2023 global monitoring report. (数据来源,定义了问题的紧迫性)

  2. Muther, R. (1973)Systematic Layout Planning. (早期布局规划理论基础)

  3. Stiny, G., & Gips, J. (1972)Shape Grammars. (规则生成系统的理论基础)

  4. Hu, R., et al. (2020)Graph2Plan: Learning floorplan generation from layout graphs. (对比的深度学习生成方法)

  5. Rietschel, M., & Steinfeld, K. (2024)Mediating Modes of Thought: LLM’s for Design Scripting. (混合智能与LLM设计脚本的启发来源)


–EOF–
转载须以超链接形式标明文章原始出处和作者信息及版权声明.

No comments: