职贝云数AI新零售门户
标题:
DeepSeek V4 马上发布,美国慌了!
[打印本页]
作者:
TG3eX0y
时间:
4 天前
标题:
DeepSeek V4 马上发布,美国慌了!
新智元报道
编辑:KingHZ Aeneas
【新智元导读】最近,炸裂音讯一个接一个。首先,DeepSeek V4将在一周内上线。第二,它跳过英伟达,把访问权限首先给了某国内芯片厂商。另外,Anthropic由于蒸馏事情,也被群嘲了。
炸裂音讯:根据多方来源,DeepSeek V4将在一周内上线!
如今,DeepSeek V4 Lite至少在一家推理服务商停止测试,目前透显露的信息有——
模型代号为Sealion-lite,有100万token的上下文窗口,这个模型比网页版/运用模型好用得多,而且还是原生多模态模型。
与此同时,DeepSeek v4 Lite的一张对比图,也在外网传疯了!
与目前的Deepseek v3.2思索模型相比,DeepSeek v4 Lite不开启思索形式,生成的SVG图像质量分明更好。
(, 下载次数: 2)
上传
点击文件名下载附件
(, 下载次数: 2)
上传
点击文件名下载附件
DeepSeek压顶,美国慌了!
DeepSeek V4春节没来,但这次不远了。
路透社称,一些芯片厂商曾经接入DeepSeek V4,优化功能。
音讯人士称,DeepSeek这次向某国产芯片厂商提供了V4的早期接入权限,而不是英伟达等美国算力霸主。
这直接打破了过去AI模型大版本发布前的行业惯例。
(, 下载次数: 2)
上传
点击文件名下载附件
这条音讯来自两位音讯人士,路透社表示。
而就在昨天,美国官员宣称DeepSeek运用非法获得的英伟达GPU停止训练。
Anthropic直言DeepSeek等经过蒸馏Claude的回复来运作,断言他们缺乏真正的外部创新才能只会抄袭。
(, 下载次数: 3)
上传
点击文件名下载附件
美国的CNN、CNBC、NYT等大众和科技媒体纷纷推出相关报道
去年,Deepseek发布后的确有过攻击,如此密集攻击史无前例。
但也在预料之中。
上一次Deepseek发布模型时,引发了恐慌——
去年,DeepSeek-R1发布或导致英伟达股价下跌17%!
(, 下载次数: 2)
上传
点击文件名下载附件
而如今能够发生什么?
假如DeepSeek V4再次展现出惊人的效率和才能,很能够会重演甚至加剧去年的投资者恐慌,对正在寻求巨额融资的美国AI公司和希望股价波动的英伟达、谷歌等巨头构成直接要挟。
这不是庸人自扰,即便是竞争对手的研讨人员也承认DeepSeek V4不可小视,能够发布就登顶开源第一!
(, 下载次数: 4)
上传
点击文件名下载附件
美国的这波言论攻击,并非偶然,Reddit用户总结称:这是一场有组织的FUD(恐惧、不确定性和怀疑) 营销:
抢占叙事:在DeepSeek V4发布前,预先埋下「他们只会作弊/抄袭」的叙事框架。这样,无论V4多成功,公众的第一反应都会被引导至负面解读。
保护市场:经过言论手腕稀释V4发布的媒体关注度和影响力,试图波动投资者心情,防止股价再次出现两位数暴跌,为美国本土AI公司的融资和发展争取工夫。
维护霸权:从更深层次看,这是为了维护美国在AI范畴的技术和叙事霸权,打击中国AI的崛起势头。
(, 下载次数: 3)
上传
点击文件名下载附件
当你看到这类漫山遍野的负面报道时,要特别留意它的发布工夫。
将其与即将发生的严重事情(如DeepSeek V4发布)联络起来,思索谁最有能够从这种言论中受益,以及他们真正在恐惧什么。
不要随便被这些报道的结论带着走。要学会看穿表面的FUD,基于理想和历史证据,去洞察背后真实的技术竞争和市场博弈。
(, 下载次数: 1)
上传
点击文件名下载附件
Claude自曝「我是DeepSeek」!全网哗然
与此同时,另外一件事,也在全网炸锅了。
X上一个用户发现,当他向Claude发问「你是什么模型」时,它居然回复:「我是DeepSeek V3,是由DeepSeek公司开发的开源大言语模型。」
这一bug,能否阐明Claude是基于DeepSeek蒸馏的?
(, 下载次数: 2)
上传
点击文件名下载附件
讽刺的是,就在不久前,Anthropic刚刚高调指摘DeepSeek停止了「工业级蒸馏攻击」。
这一幕,几乎可谓AI时代的行为艺术。
(, 下载次数: 2)
上传
点击文件名下载附件
网友stevibe完全复现了Claude Sonnet-4.6的这波操作:
不过,有的网友在Claude App中完全无法复现结果。
(, 下载次数: 3)
上传
点击文件名下载附件
的确有网友在Claude App复现了该成绩,但很难一次成功。
(, 下载次数: 2)
上传
点击文件名下载附件
为了力证这一结果的有效性,他特意经过Anthropic的官方API端点再次测试,结果还是一样。
(, 下载次数: 2)
上传
点击文件名下载附件
根据别人提供的创意,这位网友又试着用法语发问「你是什么模型」?这次,Opus 4.6末尾回答:我是ChatGPT。
(, 下载次数: 3)
上传
点击文件名下载附件
为什么stevibe能经过API复现结果,为什么不能用Claude App复现?
最大的缘由能够是系统提示词。假如没有系统提示词,AI会根据训练数据回答。
(, 下载次数: 3)
上传
点击文件名下载附件
有网友揣测:
这是一个数据污染/身份对齐成绩,并不能证明任何事情。假如你用正确的言语停止足够深化的探求,每个主流模型都会存在这个成绩。
(, 下载次数: 2)
上传
点击文件名下载附件
总之,Anthropic的训练数据成了不能说的机密。
(, 下载次数: 3)
上传
点击文件名下载附件
当然,Claude Sonnet 4.6会自称「我是DeepSeek」,需求符合以下三个特定条件——清空系统提示、运用中文发问、特定模型版本。
(, 下载次数: 2)
上传
点击文件名下载附件
事情的关键在于:当默许系统提示要求模型自称Claude 时,一切都很正常;一旦把系统提示清空,模型在中文语境下居然就末尾「认祖归宗」。
成绩来了,假如一个模型中没有系统提示词约束的状况下,就会产生「我是某某模型」的回答,缘由到底是什么?
是训练数据的统计残留,还是大模型中多源数据训练下,出现了自然言语泛化的副作用?目前还无法判别。
但Anthropic似乎被啪啪打脸了:在指摘别人蒸馏时,你最好能确保本人不会在删除提示词后出现身份错乱。
毕竟,蒸馏在机器学习中,是一种非常常见的技术。Anthropic指摘别人停止「工业级蒸馏攻击」时,听上去几乎严重到像一同网络安全事情。
以此站在道德高地上,吃相就有些好看了。
模型的身份波动性,本身就是概率分布成绩。大模型没有自我认知,只是在生成统计上最合理的答案。
假如在中文数据分布中,「我是DeepSeek」这种形式概率较高,那么在没有系统提示的状况下,模型就能够走向那条高概率途径。
(, 下载次数: 2)
上传
点击文件名下载附件
网友Theo Borges解释了其中的原理:一切都是概率和零系统提示词
这不一定阐明「蒸馏发生了」,但它阐明——模型的言语空间是共享的。当整个行业都在同一个语料海洋中训练、优化、蒸馏时,边界本身就变得模糊。
群众的眼睛是雪亮的,Anthropic的thread,曾经被网友们的吐槽冲了。
(, 下载次数: 2)
上传
点击文件名下载附件
6000多条评论,70%都在吐槽Anthropic
这套又当又立的行事逻辑,直接让Anthropic的风评跌至历史最低点。
(, 下载次数: 2)
上传
点击文件名下载附件
(, 下载次数: 3)
上传
点击文件名下载附件
接上去,我们看DeepSeek的了。
参考材料:https://x.com/legit_api/status/2026718853275800019https://x.com/teortaxesTex/status/2026251055672017141?s=20https://www.reuters.com/world/china/deepseek-withholds-latest-ai-model-us-chipmakers-including-nvidia-sources-say-2026-02-25/https://www.reddit.com/r/LocalLLaMA/comments/1rdlsgq/my_theory_on_all_the_negative_chinese_ai_media/https://x.com/stevibe/status/2026227392076018101
(, 下载次数: 2)
上传
点击文件名下载附件
引荐小码哥旧书!
小码哥新手《Python + Excel/Word/PPT一本通》正式上市了!书中详细引见了零基础用Python完成办公自动化的各方面知识,提高职场办公效率,附赠PPT/源代码/重点教学视频讲解和作者VIP一对一指点。
内容引见:《Python + Excel/Word/PPT 一本通》内容引见
欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/)
Powered by Discuz! X3.5