◎医疗卫生领域的“不可能三角”理论认为,在既定的约束条件下,一个国家的医疗系统难以同时兼顾提高医疗服务质量、可及性和价格。但在王仕锐看来,生成式AI或给“不可能三角”提供了一个解法。生成式医疗AI可以接待上千万的患者,做到随时随地、无限供应。
每经记者 陈星 王佳飞 每经编辑 文多
在生成式AI技术出现之前,AI看病更多是一个“空想”。往往在做完一连串选择题后,患者才能拿到一个似是而非的诊断结果,甚至比不上去医院排队后的看病5分钟。
但生成式AI给这一蓝图中的世界带来了一丝可能性。今年5月,互联网医疗平台“医联”开发了国内首款医疗大语言模型——MedGPT(Med指医学,GPT即基于Transformer网络结构的预训练语言模型)。医联创始人、CEO王仕锐接受《每日经济新闻》记者独家专访时表示,这一模型或为解决医疗的“不可能三角”(医疗系统难以同时兼顾提高医疗服务质量、增加医疗服务可及性和降低医疗服务价格)带来了新的答案。
今年6月30日,医联在医院搭起了线下义诊,将患者的主诉分别传达给真人医生与AI医生,并完成开单诊断和出具治疗方案全流程。最后,专家打分结果显示,AI医生与三甲主治医生在比分结果上的一致性达到96%。
生成式AI听懂了患者说话
在生成式AI出现之前,AI看病是一个“想象很美好、现实很骨感”的愿望。2018年,互联网医疗平台医联曾应用自然语言处理(NLP)、计算机视觉(CV)等AI技术,落地了一系列医疗应用场景。其中包括智能健康终端、智能分诊等——这是智能医助的“雏形”。
但彼时智能医助的尝试“是失败的”。由于当时的诊断决策信息收集主要通过选择题完成,长达四五十项的冗长内容,让用户和医生都不买单。医联团队意识到,AI或许就是打开医疗服务时间、空间和人力限制的大门,但苦于找不到打开这扇门的钥匙。
在团队一度受挫时,ChatGPT出现了。大语言模型就像“最后一块拼图”,医联团队开发了MedGPT,并于今年5月正式发布。
7月20日的采访中,王仕锐这样描述MedGPT:“在我们看到的所有报道、学术期刊里,MedGPT(出现的价值)应该是:第一次有了一个AI医生能够像人类医生一样,对患者进行多轮问询、鉴别诊断,出具检测意见并且读取报告,最后给到精确的治疗方案。这个过程全程模仿真实场景,不仅是国内首个,应该也是全球首个。”
图片来源:医联官网
“我现在每天都泡在这个事情里面,因为这就是未来。”王仕锐难掩兴奋。
但在生成式AI出现以前,自然顺畅的AI疾病诊疗流程曾被视为一个难以突破的瓶颈。
“其中最难的一点应该是AI技术对人类真实自然语义的理解。”王仕锐说道。自然语音处理不好,机器就听不懂患者的话,只能通过冗长的选择题排除可能存在的病因,最后下疑似诊断,用户体验随之大打折扣。此外,即使机器能够读懂人类语言,也未必能够像一个真的医生一样直接做排除法,用直觉和经验进行判断推论,这个过程我们称之为思维链。如何从若干个可能性中找到一个最有可能性的诊断,是一个非常大的难题。
底层技术的革新首先突破了“读懂”这一难关,基于Transformer架构的大语言模型出来之后,与自然语言的沟通能力、识别能力相关的问题就自然解决了。但在医疗领域,AI技术应用的准确性和一致性至关重要。要提升这一点,还需要更多算法及指令要求机器收敛判断,避免误诊或过度诊疗。“比如医学检验报告可能有影像、文字,包含不同剂量、单位、符号,涉及病理、生化各类指标,如何准确地读取检测报告涉及大量统一标准的工作。并且医学标准指南也在不断更新,所以这对于及时更新数据库提出了较高的要求。”王仕锐说。
据了解,MedGPT主要由两个系统组成:大模型系统与专家系统。其中,大模型完成了60%的工作,专家系统完成最终的40%,以此来不断优化医学的准确性、有效性。截至目前,MedGPT每个月仍要检测超3000个病例,然后由100位人类医生对每个病例的诊断进行打分反馈。“每个月收到的反馈有2000多条”。
“这些反馈包括但不限于——系统问多了,问题针对性不强,提到了国内没有的药品,没有注意到患者的药品偏好,检测是不是必须一次性全部做完等等。现在我们认为MedGPT还有很多有待优化的地方。”王仕锐坦言。
今年6月30日,医联做了这样一件事——在医院搭起了线下义诊,由医生助理与患者面对面沟通,将患者的主诉分别传达给真人医生与AI医生,多轮沟通之后,“医生们”为患者开具检查单或诊断,患者现场完成检查后复诊,再由AI医生及真人医生提供临床诊断及治疗方案。
最后,来自北大人民医院、中日友好医院等医院的7位专家教授,从多个评价维度对这些有效病例进行打分。结果显示,真人医生综合得分为7.5分,AI医生综合得分为7.2分——AI医生与三甲主治医生在比分结果上的一致性达到了96%。
“如果从病种覆盖度、智能化、准确性和销量四个维度衡量,MedGPT的分数应该分别是9分、6分、8.5分和9分。”王仕锐介绍。
测评现场 图片来源:医联官网
机器永远不会比人类更关心人类
美国耶鲁大学教授William Kissick曾提出医疗卫生领域的“不可能三角”理论,这一理论是指,在既定的约束条件下,一个国家的医疗系统难以同时兼顾提高医疗服务质量、增加医疗服务可及性和降低医疗服务的价格。
但在王仕锐看来,生成式AI或给“不可能三角”提供了一个解法。
他认为,生成式医疗AI可以接待上千万的患者,做到随时随地、无限供应。随着持续训练,医疗AI的水平还会以月为单位提升,“现在我们认为MedGPT基本上达到了10年至15年临床经验的医生水平,未来每个月可能会提升一到两年的临床经验。”由此,医疗服务的可及性和服务质量得以借助AI这一工具得到兼顾。
在成本上,王仕锐表示,现在使用MedGPT完成一次完整的就诊流程成本不超过1美元,此后每18个月成本会减半。
对于互联网医疗而言,生成式AI带来了新的可能性。王仕锐表示,互联网医疗即将进入数字医疗时代。初始状态时,互联网医疗是以平台作为链接,实现信息的汇聚和分发,但对“不可能三角”的帮助是有限的。AI的爆发使互联网医疗从链接者变为了生产力的创造者,是一个能够覆盖更多患者的原始生产力,这才能真正地解决问题。
但AI始终无法避开的一个问题是——AI与人的关系。在医疗领域,则是AI技术与人类医生的关系是什么样的?
王仕锐认为,人类医生有两个层面永远无法被替代。
图片来源:视觉中国
第一个层面是只有人类医生才能够做真正的深度研究。医学要进步要依靠解决疑难杂症、罕见病、新发疾病,而以目前的AI技术水平来说,还需要真正的人类医学专家去设定背后的算法规则。临床指南、案例研究,这件事情必须人类医学从业者去完成。但反过来,AI可以帮助人类医学专家快速地搜集疾病案例和数据,将其汇聚起来供专家参考和攻克。
第二个层面是针对大量的基层、年轻医务工作者,医疗AI可以扮演数据库、知识库的角色。
王仕锐介绍:“现在培养一个合格的医生要花费很多年,本科到博士加上规培要花费数十年,千辛万苦才能达到合格的水平。借助医疗AI,年轻医生可以迅速成长起来并提升诊疗效率。”
在采访最后,王仕锐说:“机器永远不会比人类更关心人类。机器可以扮演得力的助手,但最后确认诊疗方案的、在方案上签字的,一定是我们具有行医资格的专业医生,他们要为患者兜底”。
记者|陈星 王佳飞
编辑|文多
视频编辑|韩阳
视觉设计|帅灵茜
统筹编辑|易启江
1本文为《每日经济新闻》原创作品。
2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。