620万订阅者起诉Snap：AI数据“白嫖”时代终结

又一家科技巨头被拖进了AI版权诉讼的泥潭。这次的主角是Snap，原告是一群总计拥有620万订阅者的YouTube创作者。他们指控Snap未经许可，用他们的视频内容训练AI模型。这起集体诉讼，本质上是对整个AI行业“默认抓取，事后再说”数据获取模式的正面挑战。

这不是个案，而是行业“断奶”的信号。 从OpenAI、Meta到现在的Snap，科技巨头们用海量公开网络数据“喂养”大模型的低成本模式，正面临司法系统的全面清算。核心争议点只有一个：用受版权保护的内容训练AI，算不算“合理使用”？原告们显然认为不算，这是在窃取他们的创作果实。如果法院支持这一观点，那么AI研发的成本结构将被彻底颠覆——从“数据驱动”转向“数据合规驱动”。这意味着，未来训练模型前，公司可能需要对每一份数据来源进行审计和授权，研发周期和成本将呈指数级上升。

这场诉讼将重塑AI行业的竞争格局。 短期看，所有依赖网络爬虫抓取数据的公司都将面临风险，必须紧急审查自己的数据供应链。长期看，赢家很可能是那些本身就拥有庞大、合规内容生态的“围墙花园”。比如谷歌（拥有YouTube）和Meta（拥有Instagram和Facebook），它们可以相对容易地在内部生态中获得授权，而初创公司和缺乏内容平台的公司将陷入被动。一个全新的市场——合规训练数据交易与授权服务——可能会因此爆发。同时，专注于用更少数据训练模型（数据高效算法）或生成合成数据的技术公司，价值将凸显。

这场官司无论输赢，都已经赢了。它成功地将行业潜规则摆上了台面，迫使所有玩家重新思考数据的合法性。对于投资者和从业者而言，评估一家AI公司的关键指标，除了算力和算法，现在必须加上 “数据来源的合规性” 。AI的狂野西部淘金时代，正在被法律的围栏一点点圈起来。

原文链接：A group of YouTubers with a combined 6.2M subscribers adds Snap to a class action lawsuit, alleging the company trained its AI systems on their video content (Sarah Perez/TechCrunch)

本文由 AI 辅助生成，仅供参考。