1. 研究背景与核心发现
急诊科医生一直是广受欢迎的英雄形象,但哈佛大学的一项开创性研究发现,在高压的急诊分诊环节,AI 系统的表现优于人类医生,能在患者被紧急送往医院的生死攸关时刻做出更准确的诊断。研究结果被独立专家描述为 AI 临床推理能力的 "真正进步"。
2. 具体实验情况
研究将数百名医生的诊断结果与 AI 进行对比。其中一项实验聚焦于波士顿一家医院急诊科的 76 名患者,研究人员给一个 AI 和两名人类医生提供相同的标准电子健康记录,AI 在 67% 的病例中做出了准确或接近准确的诊断,击败了准确率仅为 50% - 55% 的人类医生。这表明在需要根据最少信息快速做出决策的分诊情况下,AI 优势明显。当有更多细节信息时,OpenAI 的 o1 推理模型诊断准确率提高到 82%,专家医生准确率为 70% - 79%,不过差异在统计学上不显著。在制定长期治疗方案方面,AI 也优于更多数量的人类医生,研究人员让 AI 和 46 名医生分析五个临床案例,计算机制定的方案得分 89%,而使用传统资源的人类医生仅得 34%。
3. AI 并非取代医生
研究人员表示,急诊医生还不会就此 "下岗"。该研究仅测试了人类医生和 AI 基于文本形式的患者数据进行诊断的能力,并未测试 AI 对患者痛苦程度、外观等信号的解读能力,AI 更像是一位根据书面材料提供第二意见的临床医生。该研究的主要作者之一阿琼·曼拉伊认为研究结果并不意味着 AI 会取代医生,但正在见证一场将重塑医学的重大技术变革。另一位主要作者亚当·罗德曼博士称 AI 大语言模型是 "数十年来最具影响力的技术之一",未来十年内,AI 不会取代医生,而是会与医生共同构建一种新的 "三元护理模式——医生、患者和人工智能系统"。
4. 实际案例与应用现状
在哈佛的研究中,有一个案例是一名患者肺部出现血栓且症状不断恶化,人类医生认为抗凝剂治疗无效,但 AI 注意到患者有狼疮病史,可能是导致肺部炎症的原因,事实证明 AI 判断正确。根据相关研究,近五分之一的美国医生已经在使用 AI 辅助诊断,英国 16% 的医生每天使用该技术,另有 15% 的医生每周使用,"临床决策" 是最常见的应用场景之一。
5. 存在的问题与担忧
英国医生最担心的是 AI 出错和责任风险,虽然有数十亿美元投入到 AI 医疗公司,但 AI 出错的后果仍存在诸多疑问。罗德曼强调目前还没有正式的问责框架,患者最终希望由人类医生指导做出生死攸关的决策以及应对具有挑战性的治疗决策。爱丁堡大学医学信息中心联合主任尤恩·哈里森教授表示这项研究很重要,表明这些系统正逐渐成为临床医生有用的第二意见工具。谢菲尔德大学助理教授魏星博士指出研究中的一些结果表明医生可能会不自觉地依赖 AI 的答案,且目前尚不清楚 AI 在哪些患者群体的诊断上表现较差,以及它是否在老年患者或非英语母语患者的诊断上更吃力,他强调这并不意味着 AI 可以安全地用于日常临床,公众也不应将免费的 AI 工具作为医疗建议的替代品。