国内首次AI医生与真人医生一致性评测结果正式揭晓!6月30日,医联于成都举行了国内首次AI医生与真人医生一致性评测,并进行了全天候实时直播。现场有120多位真实患者及10位来自四川大学华西医院的主治医师共同参与了这场评测研究。最终,经过来自北大人民医院、中日友好医院、阜外医院和友谊医院的7位专家教授针对评测形成的91份有效病例进行审核,并且针对AI医生的问诊准确性、诊断准确性、治疗建议准确性、辅助检查方案准确性、数据分析准确性、提供可解释信息、自然语言问诊与交互这7个评价维度的打分之后,最终,真人医生综合得分为 7.5分,AI医生综合得分为 7.2分。AI医生与三甲主治医生在比分结果上的一致性达到了96%。
(最终评审结果)
(评测人员名单)
在历经8个小时的问诊过程中,MedGPT与来自四川大学华西医院的心内科、消化内科、呼吸内科、内分泌科、肾脏内科、骨科、泌尿外科的10位主治及以上医师共同对100余名患者进行问诊,经过专家评审团,从准确性、客观数据分析、可信度、人机交互性展开。最终,经过长达3个小时的对比分析及判断,综合专家团所有评审的判定及评分,AI医生与三甲主治医生在比分结果上的一致性达到了96%。
(评审流程)
为了保证评测的合理性和科学性,此次测试的问诊环节进行了特殊的设计:患者进入诊室后,将与医助沟通自身病情,医助通过线上文字输入的方式将患者主诉传达给真人医生与AI医生并协助医患完成多轮沟通,在收集足够的决策因子后,真人医生与 AI 医生为患者开具检查单或诊断,患者直接在成都高新海尔森医院完成检查;在获得检查结果后,患者进行复诊,并由AI医生及真人医生提供临床诊断及治疗方案。通过以上流程,可以在条件基本一致的情况下,让真人医生与AI医生进行互不干涉的独立诊断。
令人惊喜的一点是,不同于专科医生,MedGPT诊断出了不属于就诊科室的疾病,给出其他具备可能性的判断,这在常规的专科问诊中是很难做到的。
(专家评审维度)
值得一提的是,MedGPT不仅在一致性上达到了一定水准,还可以提供疾病治疗环节中的其他“手段”,例如此次诊断过程中的“云检验”:在完成初步问诊后,MedGPT会给患者开具必要的医学检查项目,以进一步明确病情。患者则可以通过医联云检验等多模态能力进行检查。基于有效问诊以及医学检查数据,MedGPT得以进行准确的疾病诊断,并为患者设计后续疾病治疗方案。对于真人医生来说,开具检验并根据结果对病情进行判断是疾病诊断过程中的常规操作,但对于AI 医生来说,这是一则突破。
(真人医生(左)与AI医生(右)为患者开具检验检查并进行解读)
在此次问诊现场,MedGPT就为患者开具了多种检验检测,患者在凭借单据直接在成都高新海尔森医院完成相关检测。医联MedGPT项目负责人王磊表示:MedGPT开单检查只是多模态能力的其中一环,MedGPT 后续将配合医联多种云化能力,覆盖预防、诊断、治疗、康复的疾病管理全流程,让患者轻松接触到优质医疗资源。未来,MedGPT会拥有更大的想象空间。
事实上,医联在今年5月已经公布了MedGPT多种医学检验检测模态能力。除了配合云化能力进行检验检测外,MedGPT会在患者收到药品后主动为患者进行用药指导与管理、智能随访复诊、康复指导等智能化疾病诊疗动作。医联MedGPT plugin应用平台整合超过1000+医疗多模态能力,整合多样化的医疗多模态能力,丰富和完善全流程智能化诊疗体验。
现阶段,医疗行业还存在着资源分配不均,偏远地区患者难以接触到优质医疗资源等痛点,而AI医疗可以有效补充医疗资源,助力全民健康生活水平的提升,有利于补全基层诊疗服务短板,强化公共卫生服务效率,帮助解决优质医疗资源相对匮乏和基层医疗服务能力不足的结构性难题。
此次测试是国内首次公开的、规模化的、基于真实患者的AI医生与真人医生的一致性研究评测,也是对于AI 医疗的一次阶段性探索。经过此次评测,以 MedGPT为代表的AI医疗已经进入到了真实患者测试阶段,这也意味着通用型人工智能技术的研究与应用发展水平得到了进一步推进。王磊表示:“此次测评,本质是为了持续验证与提升AI模型的医学有效性。医联希望通过MedGPT在疾病管理全流程上的能力,让智能化的医疗手段帮助更多患者,令各地医疗资源的不均等逐渐消弭。”
推动AI在医疗行业的研究与应用,以严肃医疗为根本,让优势的医疗资源与技术惠及更多人,是医联不断向前的动力。医联也将在AI医疗领域持续耕耘,加速AI在医疗行业内的落地应用。