当人工智能(AI)进入手术室:接连出现手术失误与身体部位识别错误的报告
2021年,医疗巨头强生公司(Johnson & Johnson)旗下的一家子公司宣布实现“一次飞跃”:他们在一款用于治疗慢性鼻窦炎(鼻窦炎症)的医疗设备中加入了人工智能。ACClARent 表示,其 TruDi 导航系统的软件将使用机器学习算法,在手术过程中协助耳鼻喉科医生。
该设备在此之前已上市约三年。在那之前,美国食品药品监督管理局(FDA)仅收到7起关于该设备发生故障的未确认报告,以及1起患者受伤报告。但在设备加入人工智能后,FDA已收到至少100起设备故障和不良事件的未确认报告。
医疗设备公司 AcCLArent 为 TruDi 导航系统加入了人工智能,以协助医生进行鼻窦手术。2021年10月,该公司在社交平台发布消息介绍这一新的AI功能。
根据相关报告,从2021年末到2025年11月,至少有10人受伤。大多数事件据称涉及 TruDi 导航系统在手术过程中错误地向医生显示手术器械在患者头部内的位置。
有一名患者据称出现脑脊液从鼻腔泄漏的情况。在另一例报告中,一名外科医生误刺穿了患者的颅底。在另外两起事件中,两名患者分别因一条主要动脉被意外损伤而中风。
FDA的医疗设备报告往往信息不完整,也并非用于确定医疗事故的具体原因,因此目前尚不清楚人工智能在这些事件中发挥了怎样的作用。两名中风患者分别在德克萨斯州提起诉讼,指控 TruDi 系统中的人工智能导致了他们的伤害。其中一份诉状称:“在软件加入人工智能之前,该产品的安全性可能比软件修改之后更高。”
无法独立核实这些诉讼中的指控。
在被问及有关 TruDi 设备的 FDA 报告时,强生公司将问题转交给 Integra LifeScienCEs。该公司于2024年收购了 Acclarent 以及 TruDi 导航系统。InteGra 表示,这些报告“只说明在发生不良事件的手术中使用了 TruDi 系统”。公司补充说,“没有可信证据表明 TruDi 导航系统、人工智能技术与任何所谓的伤害之间存在因果关系。”
Acclarent 在 LinkedIn 上发布的一段视频展示了 TruDi 系统中的一个 AI 功能 TruPath,该功能可以向外科医生显示“两个点之间最短且有效的路径”。
这些事件的出现,正值人工智能开始改变医疗行业之际。支持者认为,这项技术将有助于发现罕见疾病的治疗方法、开发新药、提高手术技能并赋能患者。但对安全记录和法律文件的审查,以及对医生、护士、科学家和监管机构的采访显示,在医疗设备制造商、科技公司和软件开发商争相推出AI技术的过程中,也出现了一些风险。
目前已有至少1,357种使用人工智能的医疗设备获得 FDA 批准,是2022年之前数量的两倍。TruDi 系统并非唯一受到质疑的设备。FDA 还收到了涉及数十种其他 AI 增强设备的报告,例如一款被指未能识别异常心跳的心脏监测仪,以及一款据称误识别胎儿身体部位的超声设备。
来自约翰斯·霍普金斯大学、乔治城大学和耶鲁大学的研究人员在2024年8月发表在《JAMA Health Forum》上的研究信中指出,他们发现60种获得 FDA 批准的 AI 医疗设备与182次产品召回有关。研究显示,其中43%的召回发生在设备获批不到一年内,大约是同类监管规则下所有医疗设备召回率的两倍。
五名现任和前任 FDA 科学家表示,人工智能浪潮给 FDA 带来了挑战:在关键人员流失后,该机构难以跟上大量申请审批的 AI 医疗设备。美国卫生与公众服务部(HHS)发言人表示,该部门正在寻求提升相关能力。
另一类人工智能——生成式AI聊天机器人——也正在进入医学领域。许多医生开始利用AI节省时间,例如自动转录病历记录。但医生也表示,许多患者利用聊天机器人进行自我诊断或质疑专业建议,这带来了新的挑战和风险。
大约三年前,随着 ChatGPT 的推出,人工智能成为商业和社会关注的焦点。ChatGPT 以及 Google 的 GEMini、Anthropic 的 Claude 等聊天机器人都使用生成式人工智能来创建内容。这些系统基于大型语言模型(LLM),通过大量文本和数据训练,以理解并生成自然语言。这些工具如今已被引入消费者医疗应用等领域。
不过,人工智能并不仅仅是大型语言模型。早在聊天机器人出现之前,AI技术就已经进入医学领域。该领域的历史可以追溯到70多年前。1950年,英国数学家艾伦·图灵在一篇论文中提出了一个关键问题:“机器能思考吗?”
FDA 于1995年批准了首批 AI 医疗设备——两套用于筛查宫颈癌的模式识别系统。如今医疗设备中使用的 AI 类型通常被称为机器学习,其中包括一种子领域——深度学习。这些系统通过数据训练以执行特定任务。例如在放射学中,它们可以增强和分析医学影像,帮助识别医生可能忽略的肿瘤,从而辅助癌症诊断。
类似系统也被用于手术设备。2022年6月,在德克萨斯州沃思堡的一家医院,外科医生将一个小气囊插入 Erin Ralph 的鼻窦腔。据 Ralph 在诉讼中称,医生 Marc Dean 使用了带有人工智能的 TruDi 导航系统来确认器械在其头部中的位置。
该手术称为鼻窦球囊扩张术,是治疗慢性鼻窦炎的一种微创技术。医生通过充气球囊扩大鼻窦开口,以改善引流并缓解炎症。
但 Ralph 的诉讼称,TruDi 系统“误导并错误引导”了 Dean 医生。一条向大脑、面部和颈部供血的颈动脉据称被损伤,导致血栓形成。根据法院文件,Ralph 的律师告诉法官,Dean 医生自己的记录显示他“完全不知道自己已经接近颈动脉”。无法查看这些记录,因为它们受到司法保护令限制。
Ralph 离开医院后,人们才发现她已经中风。这位四个孩子的母亲随后返回医院,并在重症监护室住了五天。一项为其康复筹款的 GoFundMe 页面称,医生切除了她的一部分颅骨,“以给大脑肿胀留出空间”。
一年多后,Ralph 在一篇关于中风患者的博客采访中表示:“我仍在接受康复治疗。没有支具很难走路,也很难让左臂恢复功能。”
2023年5月,Dean 医生在另一台鼻窦球囊扩张术中使用 TruDi 系统时,患者 Donna FernihoUGh 的颈动脉据称突然破裂。根据她在美国德克萨斯州联邦地区法院提起的诉讼,血液“四处喷溅”,甚至溅到一名在场观察手术的 Acclarent 公司代表身上。Fernihough 的一条颈动脉受损,并在手术当天中风。
诉讼称,Acclarent “明知或应当知道所谓的人工智能导致或加剧了该导航系统产品不一致、不准确和不可靠的倾向”。
Acclarent 在两起诉讼中均否认相关指控。根据法院文件,该公司表示自己并未设计或制造 TruDi 系统,而只是负责分销。其母公司 Integra LifeSciences 表示,没有证据表明 AI 技术与任何伤害之间存在联系。
公开数据库 Open Payments 显示,Dean 医生自2014年起为 Acclarent 提供咨询服务,截至2024年共获得超过55万美元的咨询费用,其中至少13.5万美元与 TruDi 系统相关。
Dean 医生的律师表示,由于患者隐私和正在进行的诉讼,他无法发表评论。Integra 表示 Dean 已不再担任 TruDi 的顾问。
Fernihough 的诉讼称,2021年时任 Acclarent 总裁 Jeff Hopkins 曾推动在 TruDi 中加入人工智能,“作为营销工具”,以宣称设备拥有“新的创新技术”。
根据 Acclarent 在 LinkedIn 上的介绍,TruDi 软件利用机器学习识别患者解剖结构的特定部分,并计算“医生指定的两个点之间最短且有效的路径”。该技术旨在简化手术规划,并在鼻窦手术等操作中提供实时反馈。
诉讼称,在加入 AI 计划时,Acclarent 曾征询 Dean 医生意见,而他曾警告该公司“仍有一些问题需要解决”。尽管如此,诉状称 Acclarent 仍“降低安全标准以加速技术上市”,并设定“某些新技术在整合进 TruDi 系统前只需达到80%的准确率”。
无法确认 Dean 是否发出过上述警告,因为相关材料受到司法保护令限制。
“错误识别身体部位”
FDA 表示,不良事件和设备故障报告存在局限性:它们往往缺乏详细信息,为保护商业机密而被删减,并且不能单独用来确定责任。此外,同一事件有时会被多次报告。
在2021年至2025年10月向 FDA 提交的报告中,至少有1,401份涉及使用人工智能的医疗设备,其中至少115份提到了软件、算法或编程问题。
2025年6月的一份报告称,一款用于产前超声检查的 AI 软件可能错误识别胎儿身体部位。该软件名为 Sonio DeteCT,使用机器学习技术分析胎儿影像。
报告称:“Sonio Detect 软件的 AI 算法存在缺陷,错误标记胎儿结构,并将其与错误的身体部位关联。”报告并未说明是否有患者受伤。Sonio Detect 由三星电子旗下 Samsung MEDISON 公司拥有。该公司表示,该报告“并未表明存在任何安全问题,FDA 也未要求采取任何措施”。
此外,还有至少16份报告称,医疗设备公司美敦力(Medtronic)的 AI 心脏监测仪未能识别异常心律或停搏,但这些报告没有提到患者受伤。美敦力向 FDA 表示,一些事件是由于“用户混淆”造成的。
美敦力植入式心脏监测仪 LINQ 系列使用被称为“深度学习人工智能”的算法。根据公司网站介绍,该系统减少了误报并保留了真实心脏事件警报。但公司也承认,其 AccuRhythm AI 技术有时可能错误分类异常心律。
美敦力表示,他们审查了全部16起事件,认为设备只漏检了一次异常心律,而且没有患者受到伤害。
FDA在监管能力方面面临挑战
五名现任或前任 FDA 科学家表示,随着人工智能医疗设备数量迅速增加,美国监管机构越来越难以应对。
约四年前,FDA 扩充了专门研究人工智能的科学家团队,特别是负责评估使用 AI 的医学影像设备。许多人被安排在影像、诊断和软件可靠性部门(DIDSR),该部门一度成为评估医疗AI安全性的核心团队。
但在2025年前后,随着政府削减开支,该团队出现裁员和人员流失,一些专家离开了机构。
研究人员在工作中会尝试“破解”设备的 AI 模型,例如在不同临床场景中测试算法表现,并检查其是否随着时间推移而性能下降,同时尽量减少 AI 产生错误信息的“幻觉”现象。
一些前员工表示,在人员减少之后,一些设备评审人员的工作量几乎翻倍。“如果资源不足,就更容易漏掉问题。”一名前审查人员说。
与新药不同,大多数医疗设备无需进行大规模临床试验即可上市。许多 AI 医疗设备只需证明其与已有设备类似即可获得批准。专家表示,人工智能可能为这种传统审批方式带来新的不确定性。
华盛顿大学医学院研究人员 Alexander EVerhart 表示:“FDA 传统的医疗设备监管方式,可能不足以确保 AI 技术的安全和有效。”

