生成式AI大语言模型概述




2022年,随着OpenAI推出ChatGPT生成式人工智能开始进入公众视线并逐渐受到广泛关注。这种新型的AI不仅可以生成文本,还可以创建图像和视频等多类型的内容,几乎堪称万能。进入2023年,生成式AI的发展势头更为猛烈。

相较于过往的人工智能时代,机器学习只是在模仿人类认知世界的方式,生成式AI的出现则预示着人工智能已进入一个新纪元。在此新纪元中,机器不仅可模仿人类,更开始替代人类去创新,给社会生产力发展带来巨大推动力。

一、 基本概念

自从20世纪50年代图灵测试提出以来,人们就一直在探索让机器处理语言的可能性。机器只有理解了人类的语言,才能通过语言来学习人类文明的知识,并与人类进行有效的沟通。

语言模型是处理语言文字(或者符号体系)的AI模型,它能识别人类语言中的规律,并根据给定的提示,自动生成符合这些规律的内容。近年来,研究人员在大规模语料库上训练得到的语言模型在解决各类自然语言处理任务上展现出了强大的能力。这种模型甚至产生了一个有趣的现象:即当模型的参数规模超过一定水平时,它的性能会显著提升,并且会出现一些在小模型中不存在的新能力,比如上下文学习。为了与基于统计或神经网络的语言模型区分,这种模型被称为大型语言模型Large Language Model,简称LLM)。

尽管大语言模型目前没有正式的定义,但它通常指由具有许多参数(通常数十亿个权重或更多)的人工神经网络组成语言模型,它通过处理和理解自然语言文本数据来进行预测和生成新的文本。简单地说,它就像一个掌握了多门语言的人,不仅可以理解和解释已有的文本信息,还可以根据给定的上下文环境猜测一个句子或段落接下来可能出现的内容,甚至可以自己想出新的词汇或概念。

生成式AI与大语言模型关系



 1生成式AI与大语言模型关系

生成式AIGenerative AI  AIGC)是一种借助深度学习技术,基于大模型(包括但不限于语言模型)创造全新内容和想法的先进技术,可以生成全新的数字视频、图像、文本、音频或代码等内容。图像生成领域的应用包括DALL·E-2Stable Diffusion等,自然语言处理领域的应用包括ChatGPT,代码生成领域的应用包括Github Copilot等,多媒体生成领域的应用包括MusicLMMusicGen等。

使用大语言模型的生成式AI,可以根据输入的文本或关键词,自动生成连贯且有意义的文本,可以广泛应用在文本摘要、机器翻译、对话系统、文本生成和知识图谱等领域。

总而言之,大语言模型与生成式AI密切相关,前者为后者提供了强大的自然语言处理能力,并使得生成式AI在各种任务中表现出色。

 

二、 全球大语言模型总览

目前,全球领先的生成式AI大语言模型主要有OpenAIGPT-3GPT-4Google PaLM 2T5Facebook Galactica LLaMA 等,这些模型都具有超大规模的参数量(从几十亿到几千亿)、支持多语言交互。基于大语言模型,部分开发机构已经构建面向消费者及行业用户的生成式AI应用,典型应用包括ChatGPTBardClaude

在中国,诸多研究机构和企业也在积极开发生成式AI大语言模型,包括北京智源人工智能研究院的悟道系列、百度的ERNIE系列、科大讯飞的星火认知大模型以及清华大学的CPM系列等。

 1 国内外主要大语言模型

模型名称

开发机构

模型大小(训练参数)

发布时间

面向消费者的应用

国外

PaLM 2

Google

3400 亿

2023/05/10

Bard

Med-PaLM 2

Google

未知,基于PaLM 2的医疗领域语言模型

2023/03

暂无

GPT-4

OpenAI

未公开,推测为17600亿

2023/03/14

ChatGPT

LLaMA

Facebook

650亿

2023/02/24

暂无

AnthropicLM v4-s3

Anthropic

520亿

2023/01

Claude

GPT-3

OpenAI

1750亿

2020/05/28

ChatGPT

国内

WinGPT 2.0

卫宁健康

130亿,医疗领域语言模型

2023/07

暂无

悟道3.0

北京智源

未公开,2.0版本为17500亿

2023/06/10

暂无

HuatuoGPT

香港中文大学(深圳)、深圳市大数据研究院所

130亿,医疗领域语言模型

2023/5/25

华佗GPT

MedGPT

医联

1000亿

2023/5/25

暂无

星火认知大模型 V1.5

讯飞

未知

2023/06/09

星火

CPM-Bee

清华大学

100亿

2023/05/27

暂无

ERNIE 3.0 Titan

百度

2600亿

2021/12

文心一言

尽管大语言模型和生成式AI仍处于早期发展阶段,但其在医疗健康行业中的应用正在逐渐增多,潜力和影响力也在不断扩大。在临床场景,能够分析医学文献和患者信息,协助识别疾病,预测疾病风险,并定制个性化治疗计划;在患者服务场景中,可充当健康咨询师的角色,推动患者沟通,并对健康生活方式的选择提供指导;在临床研究场景中,有助于解析疾病机理,并加快新药物的开发;在管理场景中,可用于自动化处理病历管理和保险索赔等行政任务。

Google推出的医疗行业定制模型 Med-PaLM 2 ,可以从各种密集的医学文本中总结见解并回答相关问题,是第一个在美国医疗执照考试 (USMLE) 数据集MedQA 上达到专家应试者水平表现的大语言模型,准确率达到 85% 以上。香港中文大学(深圳)和深圳市大数据研究院发布医疗大模型 ——HuatuoGPT(华佗GPT),使语言模型在在线咨询问诊场景中,具备像医生一样的诊断能力和提供有用信息的能力,同时保持对用户流畅的交互和内容的丰富性,对话更加丝滑[shi1] 卫宁健康自主研发的专注医疗领域的大型语言模型 - WiNGPT,支撑七大基础任务(问答、多轮对话、信息提取、标准化、文本相似度计算、摘要、分类、生成)以及超过20个子任务。WiNGPT将以Co-Pilot诊断辅助模式融合到数字化医疗系统WiNEX中,提供全景式、沉浸式的智能应用,如在健康体检场景中,WiNGPT可以对体检记录进行剖析,自动生成总体检查报告和健康指导建议;在影像检查场景中,WiNGPT可以解析患者的多次检查影像及相关报告,自动产出疾病进展分析和预测。

三、 生成式AI市场及投融资现状

据《福布斯》报道,全球人工智能投资从 2015 年的 1275 万美元飙升至 2021 年的 935 亿美元。进入2023年,尽管全球风险投资势头低迷,但生成式AI的蓬勃发展吸引了大量投资。市场分析公司PitchBook Data数据显示,仅在2023年第一季度,生成式AI初创企业的融资规模就达到了2022年全年投资资金的四倍, 2023年底将达到426亿美元,到2026年将达到981亿美元。另外,IDC预计,2026年中国人工智能市场总规模预计将超264.4亿美元

科技巨头也在生成式AI领域展开竞争、进行大规模投资,并对初创公司进行积极收购或建立合作关系,以便跟上AI新时代的步伐。微软于20231月向OpenAI投资了100亿美元;谷歌于20232月向AnthropicClaude的开发商)投资了约3亿美元;大数据公司Databricks20236月以13亿美元收购了生成式AI初创公司MosaicML

随着生成式AI大语言模型的训练和使用成本的迅速降低,众多AI研究人员从学术界转向初创公司,投入到模型和产品的开发中,受到了大量投资机构和资本的青睐。StabilityStable Diffusion的开发商)于202210月完成了1亿美元的融资,百川智能于2023年获得了5000万美元的天使轮融资,光年之外于2023年获得了3亿美元的融资。

值得注意的是,垂直行业大模型市场正在成为一个重要的机会所在,GoogleFacebook以及国内外的医疗信息化厂商都在积极开展面向医疗行业的专用大语言模型的训练。

四、 大语言模型技术机制与流派

大语言模型的强大力量在很大程度上归功于它们使用的Transformer模型架构和注意力机制,这种架构和机制使得这些模型能够理解并生成复杂的文本内容。值得一提的是,这些大语言模型在训练时,会处理数以百亿计的语料库,包括各种各样的书籍、文章、网站和其他形式的文本。这样,模型就能够学习到各种语言模式,包括语法、词汇、习语,和各种真实事件(事实型知识)和常识性知识。而且,这些模型都经过了精细的训练和调整,以确保它们在实际应用中能够生成准确、连贯、自然的文本。

Transformer模型由编码器(Encoder解码器(Decoder两部分构成。编码器部分主要负责理解输入的文本,并为每个输入构建相应的语义表示。解码器部分则负责产生输出,它利用编码器输出的语义表示和其他输入信息来生成目标输出序列。根据Transformer模型中编码器和解码器模块的注意力机制模式不同,目前的大语言模型主要可以划分为三类:编码器架构(Encoder-Only)、解码器架构(Decoder-Only)和编码器-解码器架构(Encoder-Decoder)。



 2 大语言模型演化树

编码器架构:以Google BERT (Bidirectional Encoder Representations from Transformers)为代表,它在训练时考虑了上下文的双向信息,因此能够更好地理解语言的语义。适用于文本分类、命名实体识别等场景。

解码器架构:以OpenAI GPT (Generative Pre-training Transformer) 为代表,它在训练时只考虑上下文的单向信息,但是在生成文本时却有很好的连贯性。适用于文本生成、对话等场景。

编码器-解码器架构:以Google T5 (Text-to-Text Transfer Transformer) 为代表,这种架构结合了编码器和解码器的优点,通常用于序列到序列的任务。适用于机器翻译、文本摘要等场景。缺点是模型的复杂度较高,需要更多的计算资源和训练时间。

 

今年以来,对大语言模型的高效参数微调以及特定领域数据的训练,使得其计算效率和数据利用效率得到了显著提升,在各行业领域的应用中也取得了广泛的好评。20233月发布的PaLM-E模型更是揭示了大语言模型的发展趋势,即通过视觉、多模态和多任务训练来拓展其能力,预示着更多突破想象的"类人脑"人工智能应用的崭新可能性。

在医疗这样一个数据密集型的行业,大语言模型和生成式AI已经展现出不可忽视的前景。我们深信,随着这些先进技术与医疗场景、流程的深度融合,我们将迈入一个由AI驱动的智慧医疗新时代。



医院信息系统的过去、现状与未来

在医疗改革、快速增长的医疗服务需求背景下,新一代信息技术的发展,对医院信息化的建设模式、业务流程、工作方法和管理手段都将产生深刻影响。研究探讨医院信息系统的发展趋势,准确把握信息系统在医院信息化技术改造与转型升级中的需求和机遇,将是未来医院信息化建设重要课题。

1、医院信息系统的发展历程

通过影响因素、驱动因素和创新与应用来分析国内外医院信息系统的发展历程,可以看出医院信息系统从早期的“散点式”应用逐步连成了“线”,多重“线”互联又进一步织就了“网状应用,并逐步向全互联的应用模式发展。

1.1美国医院信息系统发展历程

早在20世纪60年代,美国就开始了将信息技术应用于医疗系统以提高医疗质量,降低费用,改进运营效率的探索。在五十多年的发展过程中,信息化的发展重点随着医疗理念和体制的阶段性变革而不断变化。

1 美国医院信息化发展历程

年代

影响因素

IT驱动因素

创新与应用

1960s

Medicare/Medicaid

è  昂贵的大型机

è  昂贵的存储

共享的医院财务系统

1970s

è  全院通讯(入出转,床位管理)

è  运营管理系统

è  部门事务系统

è  小型电脑

è  改进的终端和连接

è  大范围财务和管理系统(患者管理,人力资源,库管)

è  报告调阅

è  有限的临床科室自动化(实验室,放射,药房)

1980s

è  疾病诊断相关分组

è  医保报销

è  网络

è  个人电脑

è  更便宜的存储

è  独立的软件应用程序

è  集成的临床和临床(有限)系统

è  管理式医疗财务和管理系统

è  部门影像系统

1990s

è  竞争,整合

è  整合医院、提供商和管理式医疗

è  大量的分布式计算机

è  便宜的硬件和存储

è  不断扩展的临床部门级解决方案

è  IDN类集成的增加

è  整合的EMR产品的出现

2000s

è  广泛的集成

è  基于效果的付费

è  物联网

è  移动

è  新兴的云计算

è  新兴的,具有广泛基础的临床决策支持

è  广泛的集成的EMR

è  新兴的数据仓库和分析解决方案

1.2国内医院信息系统发展历程

我国医院信息化应用从 20 世纪 70 年代后期展开,1998底启动的医疗保险和2002年非典的发生,成为医疗卫生信息化爆破性增长的引信。进入21 世纪,医院信息系统的应用范围不断扩大,涉及医疗、管理、教学科研等各个方面。

2 国内医院信息化发展历程

年代

影响因素

IT驱动因素

创新与应用

1970s

 

è  大型机

è  小型的管理软件,如工资软件、门诊计价、住院病人费用管理等

1980s

 

è  XT286的国产化, DBASEIII和网络操作系统

è  基于部门管理的小型网络管理系统,如住院管理、药房管理、收费发药系统等

1990s

è  全院通讯(入出转,床位管理)

è  部门事务系统

è  快速以太网

è  大型关系型数据库

è  全院数据共享的门诊、住院、药品、卫生经济、物资、固定资产、LISPACS等系统

2000s

è  医保

è  公共卫生

è  医疗改革

è  便宜的硬件和存储

è  互联网

è  移动

è  不断扩展的临床部门级解决方案

è  集成的电子病历系统

2、医院信息系统发展现状

2009年,《关于深化医疗卫生体制改革的意见》的发布,明确以医院管理和信息化建设为重点,全面推动了医院信息化发展。

从发展阶段来看,大部分三级医院及部分先行的二级医院,已基本完成医院管理信息系统、临床信息系统建设,部分三级医院已进入临床信息系统整合阶段;大部分一级医院及二级医院,尚在逐步建设医院管理信息系统、临床信息系统。

从应用范围来看,临床信息系统从医嘱处理扩展到医疗服务的全过程信息化管理,智能化自动化应用逐步增多;传统医院管理信息系统进入到普及应用状态,面向患者服务的应用快速增长,面向医疗质量管理的应用发展空间巨大。

从应用水平来看,大部分医院的信息共享程度不高,整体应用水平有限。以电子病历系统应用水平分级评价为例,2013年参加评估的两千多家医院中,评测结果是3级及以下的医院占98%,即信息系统基本属于部门级应用。

总体而言,中国多数医院尚处于医院管理信息化建设阶段,只有部分信息化水平较高的医院在进行临床应用系统的整合,并表现出如下特点:大中型医院持续扩展应用范围,带动整个行业应用水平提升;县级医院和乡镇卫生院等医疗机构的信息化则快速起步,呈现全面发展的势头。

3、医院信息系统发展趋势

快速推进的医疗服务改革使得医疗结构迫切需要一步提升医疗服务水平,同时面临更加严峻的成本压力。随着新技术与医疗机构业务的不断融合,医院将会逐渐经历了一个从外接嵌入到自然融合的过程,医院的工作流程、服务模式都会发生渐进式的改变,甚至革命性的巨变。

2.1互通共享的医疗信息资源

打破医院内部信息孤岛。互联互通、推动信息资源共享是数字化医院的重要任务。医院信息化建设需要从简单的业务流程应用逐步发展到统一平台、统一规范、以电子病历为核心的业务互联互通、信息融合的数字化医院。

2.2连续的医疗服务

随着移动互联网、物联网、便携式检测设备的快速发展与普及,使得医院、医生、护士、病患甚至医院管理者之间,发生了更加泛在的联接和实时互动,并逐步延伸到家庭、其他医疗健康服务机构,甚至覆盖个人的整个生命周期,实现信息的互通与资源共享,为个人提供更加主动、及时、连续、个性化的医疗和健康管理服务。

2.3高效的运营管理

为了更好的发展,医院需要进一步提高医疗质量、降低服务成本,医院必须在运营管理上更加精细化,以最低的成本提供最优质的服务。在人力资源管理方面,进一步加强绩效管理,提高工作效率;在财务管理方面,严格执行预算管理;在物资管理方面,从采购、运行、维护和报废等环节实现全生命周期管理。

4、总结

医院的未来信息化之路,就是利用各种新型技术,帮助实现医疗数据和信息的快速流通、互联互通和高效共享,实现医疗健康服务提供者的全联接,助力向以患者为核心的医疗健康服务模式转变,实现医疗卫生资源互通共享和有效配置,降低医疗机构运营成本并提高服务效率,让患者得到更好、更优质的医疗服务。