职贝云数AI新零售门户

标题: DeepSeek V4下周上线?DeepSeek与华为“换道”合力包围 [打印本页]

作者: hd7Jjj    时间: 前天 03:52
标题: DeepSeek V4下周上线?DeepSeek与华为“换道”合力包围
点击 信创纵横 并设为星标⭐️ 及时获取最新资讯

编者按:据金融时报报道,DeepSeek将于下周发布其最新的大模型V4。当DeepSeek被曝将V4系列的首发适配权独家授予华为等国产芯片,而非英伟达时,这已不只是一次产品迭代。它标志着中国AI产业从“被动追逐”转向“自动定义”,试图在算力封锁线上凿开一道缺口。本文基于多方信源,深度分析此次“海狮”举动背后的技术包围、产业博弈与全球AI格局的潜流。

编辑|安东
出品 | 信创纵横作者|陈默
转载|请注明出处

(, 下载次数: 2)

扫码收费加入“信创开放社区”知识星球社群,了解更多信创+数字化相关资讯

当地工夫2月28日,据金融时报报道,DeepSeek将于下周发布其最新的大模型V4。据两位知情人士泄漏,这是一款具有图片、视频和文本生成功能的多模态模型。在硬件适配方面,DeepSeek为国产算力提供深度支持,DeepSeek努力于优化V4模型以适配中国制造的芯片,此举有望提振中国市场对其半导体产品的需求,并加速AI模型“推理”环节靠拢本土芯片。据一位直接了解相关计划的人士泄漏,DeepSeek估计在发布V4版本的同时,发布一份篇幅较短的技术阐明,并在大约一个月后发布一份更片面的报告。

(, 下载次数: 3)

就在2月26日,一个代号为“海狮”(Sealion-lite)的奥秘模型,在全球科技圈投下了一枚深水炸弹。它并非来自OpenAI或谷歌,而是中国AI新锐DeepSeek即将推出的V4系列轻量版。音讯的引爆点,并非其高达100万tokens的上下文窗口或原生多模态才能——虽然这些参数足以令业界侧目。真正让资本市场与硅谷感到“刺痛”的,是隐藏在技术参数背后的一条关键信息:华为优先适配。

这意味着,DeepSeek在其最关键的新一代模型上,初次将早期访问权限独家授予了以华为为代表的中国芯片供应商,而将曾经的合作伙伴英伟达、AMD扫除在首批名单之外。这被广泛解读为中国AI产业寻求“算力独立”的一声发令枪。

01
“海狮”登场:一场预先张扬的内测

此次事情的导火索,源自X平台开发者Legit的爆料,随后被凤凰科技乃至路透社等多家媒体证明。据传,至少一家推理服务商已签署严厉保密协议,获得了“海狮”的测试权限。

根据流出的信息,V4系列能够采取“轻重结合”的发布策略:

先行者“海狮”(Sealion-lite):定位为轻量级高功能模型,参数规模约200B,主打100万Token超长上下文和原生多模态推理。这意味着它能一次性处理《三体》三部曲体量的文字,并从底层架构了解图文视频的混合信息,而非后期拼接。

残缺版V4:参数规模或达惊人的1.4T,功能目的直指尚未正式发布的Claude Opus 4.6。

早在2月中旬,DeepSeek已将Web端上下文悄然扩至1M,被业内视为V4系列的预热。但是,此次内测的核心看点早已超越技术本身,聚焦于其极具意味意义的芯片适配策略。

(, 下载次数: 3)

02
DeepSeek V4会有哪些亮点?

截至发稿,DeepSeek官方尚未对V4的任何信息停止正式回应或确认,一切信息均来媒体爆料,详细信息多集中在正在停止机密测试的简化版本V4 Lite(精简版)上。据《科创板日报》综合的音讯,关于V4 Lite:

其代号为“海狮”(Sealion-lite),拥有100万(1M)个tokens的上下文窗口,相比V3系列的128K有近8倍提升,实际上可一次处理如《三体》选集体量的长文本;

为原生多模态架构,意味着模型从预训练阶段就将文本与视觉了解交融,而非后期拼接;

V4 Lite参数规模估算为2000亿,另有猜测以为残缺版V4参数量能够打破1万亿;

效果分明优于网页端/APP端模型;

泄露的测试示例显示,V4 Lite能用极简代码(如54行)生成高质量的SVG图像(如Xbox手柄),在代码优化和视觉还原度上被以为超越了DeepSeek V3.2、Claude Opus 4.6等模型,这暗示了其空间推理和结构化输入才能的提升。

03
“跳票”英伟达:商业选择背后的生活逻辑

要了解这一举动的震撼力,必须回溯中美AI的“算力封锁战”。自2022年起,美国商务部工业与安全局(BIS)延续加码出口管制规则,从制止A100/H100,到限制H800、L40S,甚至将管制范围延伸至先进制程所需的设备。华盛顿的逻辑明晰:经过锁死高端芯片供应,将中国AI锁死在“二流”的赛道上。

DeepSeek曾是这一封锁下的“包围英雄”。2025年1月20日,其仰仗V3模型和R1推理模型的严重更新发布,用仅相当于行业巨头非常之一的成本(约558万美元)和2000余枚“阉割版”H800芯片,训练出了功能比肩GPT-4的开源模型。这直接导致英伟达市值单日蒸发近6000亿美元,黄仁勋不得不出面安抚市场,称“中国AI的打破对一切人都是好事”。



回顾DeepSeek的模型迭代之路,已“冬眠”超一年的DeepSeek,其优化途径非常明晰——提升推理才能、平衡模型功能与推理效率,为大模型“降本”。DeepSeek已发布的次要模型是两条技术道路的代表:追求极致综合功能的V系列“全能助手”和专注于复杂推理的R系列“解题专家”。




2024年5月,DeepSeek V2发布,曾被视作DeepSeek的初次严重打破,其研讨团队提出了多头潜在留意力(MLA)机制,大幅降低推理时的显存占用和成本,以极低的推理费用出圈,确立了混合专家模型(MoE)的技术道路。2024年12月推出的V3是DeepSeek的重要里程碑,其高效的MoE架构确立了弱小的综合功能基础。此后,V3系列经过小版本更新不断打磨,不断提升用户体验和模型Agent才能。

其中,2025年8月发布的DeepSeek-V3.1,是一个里程碑式的更新,初次将V3和R1的才能交融到一个模型中,支持思索形式和非思索形式的自在切换,在SWE-bench等基准上比前代提升超40%;2025年12月推出的V3.2,是DeepSeek首个将深度思索与工具运用无缝交融的版本,推理才能达到GPT-5程度,在H800集群上,128K序列长度的推理成本分明降低,使其成为当时同级别模型中长文本推理成本最低的选择之一。

2025年1月发布的R1,则是其首代公用推理模型,初次证明经过大规模强化学习(RL)能激发模型的推理才能,经过强化学习,该模型在处理数学成绩、代码编程等复杂推理义务上表现杰出,并首创了“深度思索”形式,功能对标OpenAI最强模型o1,但推理成本(仅为约560万美元)不到其非常之一。

可以看出,在大家等待V4时期,DeepSeek不断没有停下脚步,另外,其在多模态才能上的规划比V4更早。从技术演出去看,DeepSeek早在2023年的V3系列和2024年的V2版本中就曾经末尾规划和完成多模态才能。2025年终发布的Janus系列更是专门的、功能弱小的多模态模型。但是,那一次成功,依然建立在英伟达的硬件基础之上。假如说R1是在“带着镣铐跳舞”,那么V4此次的“华为优先适配”,则是自动选择“更换镣铐”,甚至试图“砸碎镣铐”。

04
“换道”而非“超车”:华为与DeepSeek的生态合谋

美国智库乔治城大学报告指出,中国在AI人才培育上已储备了雄厚基础,全球顶尖AI研讨员中,华人占比近半。但人才的转化效率,长期受制于算力底座。DeepSeek+华为的组合,被业界视为破解这一活结的关键尝试。

这不是一次简单的软硬件适配。它包含两层战略意图:

1.  技术验证:在昇腾芯片上跑出媲美甚至超越英伟达H系列的功能。这需求DeepSeek的算法团队与华为的昇腾计算架构(CANN)停止底层结合优化,将模型并行策略、算子库与芯片特性深度耦合。若“海狮”能在华为硬件上完成低延迟、高吞吐的推理,将直接证明“去英伟达”的技术可行性。

2.  生态撬动:AI的竞争本质是生态竞争。英伟达的护城河不只是芯片,更是积淀多年的CUDA软件生态。华为昇腾虽在追逐,但开发者习气与运用迁移是宏大应战。DeepSeek作为全球顶流开源模型,其自动靠拢,将为昇腾生态带来海量开发者和运用场景,加速国产算力平台的成熟。

这不是在英伟达主导的旧赛道上“弯道超车”,而是在开拓一条以“极致工程优化”和“自主可控”为核心的新赛道。

(, 下载次数: 3)

05
市场震颤与行业变局

音讯传出后,市场反应猛烈。虽然英伟达股价尚未出现如R1发布时的暴跌,但长期看空者末尾重估其“垄断溢价”。华尔街的疑虑在于:假如全球AI公司每年数千亿美元的GPU采购中,有相当一部分能够转向性价比更高的“中国方案”,那么英伟达高达90%以上的市占率及其估值逻辑,将面临根本性动摇。

对于中国AI产业而言,这更是一剂强心针。过去,国产芯片常被诟病为“有硬件无生态”,“能用但不好用”。DeepSeek V4的“以身相许”,将极大提振国产芯片的决计。一旦“DeepSeek on Ascend”成为标杆,将吸引更多AI企业投入国产算力怀抱,构成“模型定义芯片,芯片优化模型”的正向循环。

不过,虽然前景诱人,但必须清醒地看到,应战依然严峻。

功能差距:华为昇腾910B等芯片在实际算力上已接近A100,但在实践集群训练中的波动性、互联带宽和能耗比上,与H100等最新产品仍有差距。

软件栈鸿沟:CUDA经过十余年积累,其工具链、库函数的丰富度和易用性,非短期能片面超越。开发者迁移仍面临学习成本。

制程枷锁:华为芯片仍依赖中芯国际的N+2工艺(相当于7nm),与台积电为英伟达代工的4nm工艺存在代际差。这限制了芯片的极限功能。

(, 下载次数: 2)

2026年2月这个夜晚,或许正如一些观察者所言,会被记入中国AI发展的史册。DeepSeek V4的“海狮”举动,其意义已超越一款产品的发布。它向世界宣告:在算力成为战略资源的时代,中国AI不再甘于做英伟达生态的跟随者,而是试图经过算法与硬件的协同创新,构建一套独立、自主的AI价值体系。

再过两天,当“海狮”正式上线,其在华为芯片上的真实表现将接受全球开发者最严苛的检验。无论成败,这条“换道包围”的途径已然开启。英伟达的警报,或许才刚刚拉响。

安东简介:“信创纵横”、“信创咨询”公众号创始人,专栏作者;北京市人社局评定高级工程师、评标专家;北京信息化协会特聘专家;中国工程咨询协会注册咨询工程师(投资);国家开发银行评标专家;广州信创行业协会特邀讲师;本硕分别毕业于北京交通大学计算机、系统工程;先后就职于多家央国企总部,在信创产业及政策、数字政府、央国企数字化转型等范畴从事咨询研讨多年;欢迎交流合作!微信号:andon902
福利

定位:这是信创纵横精心创建的付费知识社群,方向次要包含信创、数字化、新型基础设备、智慧城市、以及AI、大数据等新一代信息技术,希望将该知识星球打造为一个大家频繁沟通、咨询与讨论行业成绩的平台!与行业精英为伴。同时,会提供大量高价值的在线培训及视频回放,并给大家提供一些处理方案/行业报告/PPT模板/电子书等干货素材【目前8000+信创材料及视频,并实时更新】,供大家交流、学习以及自我提升。

欢迎加入信创纵横智库(扫下方二维码)

(, 下载次数: 2)

(, 下载次数: 2)

END

(, 下载次数: 2)

(, 下载次数: 2)

点击图片查看残缺内容:

(, 下载次数: 2)

(, 下载次数: 2)

(, 下载次数: 3)

(, 下载次数: 3)

(, 下载次数: 2)

(, 下载次数: 2)






欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/) Powered by Discuz! X3.5