职贝云数AI新零售门户

标题: DeepSeek、Kimi 被 Anthropic 点名"行窃",评论区笑翻了 [打印本页]

作者: NWI    时间: 6 天前
标题: DeepSeek、Kimi 被 Anthropic 点名"行窃",评论区笑翻了
昨天,我刷到了往年 AI 圈最戏剧性的一幕。

Anthropic——就是做 Claude 的那家公司,号称全球最"担任任"的 AI 公司——忽然发了一篇官方博客,标题叫《检测和防止蒸馏攻击》。

锋芒直指三家中国 AI 公司:DeepSeek、Moonshot(Kimi 母公司)、MiniMax。

指控内容:这三家公司用 24,000 个欺诈账户,跟 Claude 停止了超过 1600 万次交互,目的是"非法提取 Claude 的才能来训练本人的模型"。

听起来很严重对吗?

然后——评论区爆了。不是支持的声响,是一场对 Anthropic 本身的集体大起底。

评论区的第一炮:你本人不也是"蒸馏"出来的?

Anthropic 博客发出去不到两小时,推特上点赞最高的那条评论是这句话:

"你们不也是从 OpenAI 蒸馏出来的吗?"

(, 下载次数: 2)

这句话不是随意说的。

Anthropic 的创始人 Dario Amodei、Daniela Amodei,以及大部分核心团队,都是从 OpenAI 出走的。他们带走的不只是人,还有在 OpenAI 外部积累的研讨思绪、训练方法、对 GPT 系列模型的深度了解。

用一个不那么严谨但很直白的说法:Anthropic 这家公司,本身就是从 OpenAI"蒸馏"出来的。

这条评论获得了数千点赞,一张"你也在做异样的事"的梗图末尾疯传。
然后,更大的瓜被扒出来了

就在评论区还在为第一个成绩吵架的时分,有人翻出了一条更劲爆的旧事:

2025年9月,Anthropic 刚由于从盗版网站 LibGen 和 PiLiMi 下载超过 700 万本有版权书籍用于训练 Claude,支付了 15 亿美元的版权和解金。

15 亿美元。

不是被指控,是曾经支付了和解金——也就是说,事情是真实发生过的。

于是,评论区里获得超过 1 万次转发的那条评论出现了:

"先偷别人的书训练模型,如今又指摘别人偷你的模型输入?"

这条评论的讽刺力度,曾经不需求我补充任何阐明了。
最后一击:Claude 自称是 DeepSeek

假如说前两个成绩还算是"陈年旧账",那第三个发现就纯粹是现场翻车了。

有网友在 Anthropic 发文当天,去调用 Claude Sonnet 4.6 的 API,问了一个简单的成绩:

"你是什么模型?"

Claude 的回答:"我是 DeepSeek 开发的模型。"

就在 Anthropic 指控 DeepSeek 抄袭 Claude 的同一天,Claude 本人在自称是 DeepSeek。

截图迅速在推特上疯传。

(注:这个现象的技术缘由是,AI 模型在训练时会学习大量数据,包括其他模型的自我引见,有时会混淆。但工夫点真实太巧,评论区直接笑场了。)
等一下,"蒸馏"到底是什么?

在继续说这场风波之前,我需求先解释一下"蒸馏"这个技术。

由于假如你不了解这个词,就很难判别 Anthropic 的指控到底有多少成色。

知识蒸馏(Knowledge Distillation),是 AI 范畴一种非常成熟的训练技术。原理很简单:

• 有一个大模型(教师模型),才能强但成本高

• 让大模型回答大量成绩,把它的输入搜集上去

• 用这些输入训练一个小模型(先生模型)

• 小模型虽然体量更小,但获得了大模型的部分思想方式

就像徒弟带徒弟——徒弟经过观察徒弟怎样处理成绩来学习,而不是简单复制徒弟的每一个动作。

这个技术本身完全合法,也被广泛运用。重点来了——

Anthropic 本人就在用。

• Claude Opus → 蒸馏出 → Claude Sonnet

• Claude Sonnet → 蒸馏出 → Claude Haiku

• OpenAI、Google 也都是异样的操作

所以 Anthropic 真正的指控不是"蒸馏"这个技术本身,而是:未经授权、经过欺诈账户、大规模提取 Claude 的输入数据,违犯了服务条款。

这个区别,在整个言论发酵过程中被大量模糊掉了——有意有意的,很难说。
Anthropic 的指控,成色到底有多少?

弄虚作假,把心情剥掉,这件事有几个值得仔细对待的维度。

① 服务条款层面:Anthropic 站得住脚

假如的确存在 24,000 个欺诈账户、1600 万次交互,那违犯 ToS(服务条款)是确定的。不管蒸馏技术本身合不合法,用欺诈账户绕过限制就是违规。这一点,Anthropic 的指控是成立的。

② 法律层面:高度模糊

模型输入受不受版权保护?用 AI 的回答训练另一个 AI,算不算侵权?

目前全球没有任何一个司法管辖区有明晰的法律答案。这不是夸张,这是现状。2026 年了,AI 版权成绩的立法还远远跑不过技术发展速度。

③ 道德层面:罗生门

这是最难说清楚的部分。

Anthropic 用公共互联网数据和盗版书籍训练出了 Claude,然后把 Claude 封闭起来商业化,用服务条款制止别人用 Claude 的输入训练模型——同时,它本人就在用更强的模型输入训练更弱的模型。

而被指控的这几家公司——DeepSeek、MiniMax——恰恰把本人的模型开源了,任何人都可以无偿运用。

一边是封闭的、靠版权壁垒变现的商业模型,一边是开源的、推进技术民主化的模型。谁更"担任任"?这道题,不同的人会给出完全不同的答案。

这件事背后,是一场更大的和平

假如只把这件事当成一个"谁偷了谁"的八卦,就太小看它了。

这场争论,本质上是两种 AI 发展途径的正面碰撞:

• 封闭途径:Anthropic、OpenAI 的形式——模型是护城河,版权是武器,商业壁垒是核心价值

• 开放途径:DeepSeek、Meta Llama 的形式——模型是基础设备,开源是策略,生态是护城河

历史上这种对决出现过很多次。

印刷机出现时,手抄经文的人说这是亵渎;录音技术出现时,现场乐手说这是抄袭;录像机出现时,好莱坞说这会毁掉电影工业。

结果呢?每一次,社会都找到了新的平衡,技术也继续向前。印刷、录音、录像——都没有被制止,反而推进了文明的跃升。

AI 这次会例外吗?我不知道。但我知道,用"国家安全"的大帽子去指控竞争对手,是一种非常风险的话语策略——由于它把技术竞争包装成了地缘政治冲突,把商业利益包装成了文明对抗。
说说我本人的判别

我不想假装中立,假装每件事都"各有道理、需求辩证看"。

我的判别是:

• 用欺诈账户绕过限制,是违规行为,不管目的是什么,都说不过去。这一点,被指控的公司假如的确这样做了,就应该承认。

• Anthropic 拿本人的"污点历史"去指控别人,公信力大打折扣。在你还没彻底洁白的时分,最好不要用道德高地去说话。

• 把技术竞争和"国家安全""生物武器"绑在一同,是在用最廉价的恐惧心情来替代最困难的技术论证。我对这种叙事方式高度警觉。

• 开源 vs 封闭的道路之争,最终会由市场和用户来投票,不会由哪家公司的博客文章来决议。

当望远镜被发明时,没有人说它偷了星星的光。当 AI 让我们能看到更远的知识星空时,我们需求争论的,不是"谁偷了谁",而是"这片星空应该属于一切人,还是只属于几家公司"。

这道题,比任何一场公司之间的互撕,都要重要得多。

AI 的将来,不会在骂战里决议。
但骂战,会让我们看清楚谁在捍卫什么。

你怎样看 Anthropic 的这次指控?AI 公司之间互相"学习",算偷吗?👇

点个【关注】,让更多人看到这场罗生门

本文不含任何商业推行,纯个人观点分享




欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/) Powered by Discuz! X3.5