AI健康助手“翻车”：华盛顿邮报告诫，监管重锤将至

当AI开始解读你的心跳和睡眠数据时，它可能比你想象的更不靠谱。《华盛顿邮报》的最新测试给火热的AI+健康赛道泼了一盆冰水：用真实的Apple Health数据测试ChatGPT Health和Claude for Healthcare，得到的回应是可疑且自相矛盾的。这远不止是产品瑕疵，而是直接踩中了医疗监管最敏感的红线。

这不是bug，是系统性风险。 测试暴露的核心问题——输出不一致、答案可疑——恰恰是FDA（美国食品药品监督管理局）对医疗设备软件最忌讳的“原罪”。AI健康应用一旦被用户当作诊断工具，任何“幻觉”或误导都可能造成真实伤害。这意味着，OpenAI和Anthropic等公司引以为傲的“个性化健康分析”功能，正游走在非法医疗实践的边缘。监管机构（FDA和FTC）的介入不是会不会，而是多快和多严厉的问题。企业面临的选择很残酷：要么投入数千万美元、耗时数年走完临床验证和审批流程，成为受监管的“处方AI”；要么彻底阉割功能，退化为一个花哨的数据整理器。

商业逻辑的彻底重构。 这一事件将迫使整个行业从“互联网速度”切换到“医疗科技速度”。过去那种快速迭代、广泛部署的玩法行不通了。高成本的合规门槛将迅速清场实力不足的玩家，拥有深厚医学背景、临床合作资源和合规经验的传统数字医疗公司（如Teladoc）反而可能获得后发优势。纯粹的AI初创公司会发现，最大的壁垒不再是模型参数，而是那一摞摞的临床验证报告和监管批文。投资逻辑也随之改变：风投会更青睐“医学+AI+监管”的复合型团队，投资周期将被拉长到与审批周期同步。

短期阵痛不可避免，但长期看，这或许是AI医疗走向成熟的必经阵痛。行业将两极分化：一端是经过严格验证、用于严肃医疗的“工具”；另一端是风险极低、明确标注“非诊断”的“玩具”。创新方向将从追求功能的炫酷，转向追求结果的可信与可解释。对于用户而言，这未必是坏事——在健康这件事上，可靠远比炫酷重要。监管的重锤，正在为这个狂飙的赛道划定清晰的起跑线。

原文链接：A test of ChatGPT Health and Claude for Healthcare with data from Apple Health finds the chatbots provided questionable and inconsistent responses (Geoffrey A. Fowler/Washington Post)

本文由 AI 辅助生成，仅供参考。