职贝云数AI新零售门户

标题: DeepSeek V4下周上线?DeepSeek与华为“换道”合力包围 [打印本页]

作者: hd7Jjj 时间: 前天 03:52
标题: DeepSeek V4下周上线?DeepSeek与华为“换道”合力包围
点击信创纵横并设为星标⭐️ 及时获取最新资讯

编者按：据金融时报报道，DeepSeek将于下周发布其最新的大模型V4。当DeepSeek被曝将V4系列的首发适配权独家授予华为等国产芯片，而非英伟达时，这已不只是一次产品迭代。它标志着中国AI产业从“被动追逐”转向“自动定义”，试图在算力封锁线上凿开一道缺口。本文基于多方信源，深度分析此次“海狮”举动背后的技术包围、产业博弈与全球AI格局的潜流。

编辑｜安东
出品 | 信创纵横作者｜陈默
转载｜请注明出处

(, 下载次数: 2)

扫码收费加入“信创开放社区”知识星球社群，了解更多信创+数字化相关资讯

当地工夫2月28日，据金融时报报道，DeepSeek将于下周发布其最新的大模型V4。据两位知情人士泄漏，这是一款具有图片、视频和文本生成功能的多模态模型。在硬件适配方面，DeepSeek为国产算力提供深度支持，DeepSeek努力于优化V4模型以适配中国制造的芯片，此举有望提振中国市场对其半导体产品的需求，并加速AI模型“推理”环节靠拢本土芯片。据一位直接了解相关计划的人士泄漏，DeepSeek估计在发布V4版本的同时，发布一份篇幅较短的技术阐明，并在大约一个月后发布一份更片面的报告。

(, 下载次数: 3)

就在2月26日，一个代号为“海狮”（Sealion-lite）的奥秘模型，在全球科技圈投下了一枚深水炸弹。它并非来自OpenAI或谷歌，而是中国AI新锐DeepSeek即将推出的V4系列轻量版。音讯的引爆点，并非其高达100万tokens的上下文窗口或原生多模态才能——虽然这些参数足以令业界侧目。真正让资本市场与硅谷感到“刺痛”的，是隐藏在技术参数背后的一条关键信息：华为优先适配。

这意味着，DeepSeek在其最关键的新一代模型上，初次将早期访问权限独家授予了以华为为代表的中国芯片供应商，而将曾经的合作伙伴英伟达、AMD扫除在首批名单之外。这被广泛解读为中国AI产业寻求“算力独立”的一声发令枪。

01
“海狮”登场：一场预先张扬的内测

此次事情的导火索，源自X平台开发者Legit的爆料，随后被凤凰科技乃至路透社等多家媒体证明。据传，至少一家推理服务商已签署严厉保密协议，获得了“海狮”的测试权限。

根据流出的信息，V4系列能够采取“轻重结合”的发布策略：

先行者“海狮”（Sealion-lite）：定位为轻量级高功能模型，参数规模约200B，主打100万Token超长上下文和原生多模态推理。这意味着它能一次性处理《三体》三部曲体量的文字，并从底层架构了解图文视频的混合信息，而非后期拼接。

残缺版V4：参数规模或达惊人的1.4T，功能目的直指尚未正式发布的Claude Opus 4.6。

早在2月中旬，DeepSeek已将Web端上下文悄然扩至1M，被业内视为V4系列的预热。但是，此次内测的核心看点早已超越技术本身，聚焦于其极具意味意义的芯片适配策略。

(, 下载次数: 3)

02
DeepSeek V4会有哪些亮点？

截至发稿，DeepSeek官方尚未对V4的任何信息停止正式回应或确认，一切信息均来媒体爆料，详细信息多集中在正在停止机密测试的简化版本V4 Lite（精简版）上。据《科创板日报》综合的音讯，关于V4 Lite：

其代号为“海狮”（Sealion-lite），拥有100万（1M）个tokens的上下文窗口，相比V3系列的128K有近8倍提升，实际上可一次处理如《三体》选集体量的长文本；

为原生多模态架构，意味着模型从预训练阶段就将文本与视觉了解交融，而非后期拼接；

V4 Lite参数规模估算为2000亿，另有猜测以为残缺版V4参数量能够打破1万亿；

效果分明优于网页端/APP端模型；

泄露的测试示例显示，V4 Lite能用极简代码（如54行）生成高质量的SVG图像（如Xbox手柄），在代码优化和视觉还原度上被以为超越了DeepSeek V3.2、Claude Opus 4.6等模型，这暗示了其空间推理和结构化输入才能的提升。

03
“跳票”英伟达：商业选择背后的生活逻辑

要了解这一举动的震撼力，必须回溯中美AI的“算力封锁战”。自2022年起，美国商务部工业与安全局（BIS）延续加码出口管制规则，从制止A100/H100，到限制H800、L40S，甚至将管制范围延伸至先进制程所需的设备。华盛顿的逻辑明晰：经过锁死高端芯片供应，将中国AI锁死在“二流”的赛道上。

DeepSeek曾是这一封锁下的“包围英雄”。2025年1月20日，其仰仗V3模型和R1推理模型的严重更新发布，用仅相当于行业巨头非常之一的成本（约558万美元）和2000余枚“阉割版”H800芯片，训练出了功能比肩GPT-4的开源模型。这直接导致英伟达市值单日蒸发近6000亿美元，黄仁勋不得不出面安抚市场，称“中国AI的打破对一切人都是好事”。

回顾DeepSeek的模型迭代之路，已“冬眠”超一年的DeepSeek，其优化途径非常明晰——提升推理才能、平衡模型功能与推理效率，为大模型“降本”。DeepSeek已发布的次要模型是两条技术道路的代表：追求极致综合功能的V系列“全能助手”和专注于复杂推理的R系列“解题专家”。

2024年5月，DeepSeek V2发布，曾被视作DeepSeek的初次严重打破，其研讨团队提出了多头潜在留意力（MLA）机制，大幅降低推理时的显存占用和成本，以极低的推理费用出圈，确立了混合专家模型（MoE）的技术道路。2024年12月推出的V3是DeepSeek的重要里程碑，其高效的MoE架构确立了弱小的综合功能基础。此后，V3系列经过小版本更新不断打磨，不断提升用户体验和模型Agent才能。

其中，2025年8月发布的DeepSeek-V3.1，是一个里程碑式的更新，初次将V3和R1的才能交融到一个模型中，支持思索形式和非思索形式的自在切换，在SWE-bench等基准上比前代提升超40%；2025年12月推出的V3.2，是DeepSeek首个将深度思索与工具运用无缝交融的版本，推理才能达到GPT-5程度，在H800集群上，128K序列长度的推理成本分明降低，使其成为当时同级别模型中长文本推理成本最低的选择之一。

2025年1月发布的R1，则是其首代公用推理模型，初次证明经过大规模强化学习（RL）能激发模型的推理才能，经过强化学习，该模型在处理数学成绩、代码编程等复杂推理义务上表现杰出，并首创了“深度思索”形式，功能对标OpenAI最强模型o1，但推理成本（仅为约560万美元）不到其非常之一。

可以看出，在大家等待V4时期，DeepSeek不断没有停下脚步，另外，其在多模态才能上的规划比V4更早。从技术演出去看，DeepSeek早在2023年的V3系列和2024年的V2版本中就曾经末尾规划和完成多模态才能。2025年终发布的Janus系列更是专门的、功能弱小的多模态模型。但是，那一次成功，依然建立在英伟达的硬件基础之上。假如说R1是在“带着镣铐跳舞”，那么V4此次的“华为优先适配”，则是自动选择“更换镣铐”，甚至试图“砸碎镣铐”。

04
“换道”而非“超车”：华为与DeepSeek的生态合谋

美国智库乔治城大学报告指出，中国在AI人才培育上已储备了雄厚基础，全球顶尖AI研讨员中，华人占比近半。但人才的转化效率，长期受制于算力底座。DeepSeek+华为的组合，被业界视为破解这一活结的关键尝试。

这不是一次简单的软硬件适配。它包含两层战略意图：

1. 技术验证：在昇腾芯片上跑出媲美甚至超越英伟达H系列的功能。这需求DeepSeek的算法团队与华为的昇腾计算架构（CANN）停止底层结合优化，将模型并行策略、算子库与芯片特性深度耦合。若“海狮”能在华为硬件上完成低延迟、高吞吐的推理，将直接证明“去英伟达”的技术可行性。

2. 生态撬动：AI的竞争本质是生态竞争。英伟达的护城河不只是芯片，更是积淀多年的CUDA软件生态。华为昇腾虽在追逐，但开发者习气与运用迁移是宏大应战。DeepSeek作为全球顶流开源模型，其自动靠拢，将为昇腾生态带来海量开发者和运用场景，加速国产算力平台的成熟。

这不是在英伟达主导的旧赛道上“弯道超车”，而是在开拓一条以“极致工程优化”和“自主可控”为核心的新赛道。

(, 下载次数: 3)

05
市场震颤与行业变局

音讯传出后，市场反应猛烈。虽然英伟达股价尚未出现如R1发布时的暴跌，但长期看空者末尾重估其“垄断溢价”。华尔街的疑虑在于：假如全球AI公司每年数千亿美元的GPU采购中，有相当一部分能够转向性价比更高的“中国方案”，那么英伟达高达90%以上的市占率及其估值逻辑，将面临根本性动摇。

对于中国AI产业而言，这更是一剂强心针。过去，国产芯片常被诟病为“有硬件无生态”，“能用但不好用”。DeepSeek V4的“以身相许”，将极大提振国产芯片的决计。一旦“DeepSeek on Ascend”成为标杆，将吸引更多AI企业投入国产算力怀抱，构成“模型定义芯片，芯片优化模型”的正向循环。

不过，虽然前景诱人，但必须清醒地看到，应战依然严峻。

功能差距：华为昇腾910B等芯片在实际算力上已接近A100，但在实践集群训练中的波动性、互联带宽和能耗比上，与H100等最新产品仍有差距。

软件栈鸿沟：CUDA经过十余年积累，其工具链、库函数的丰富度和易用性，非短期能片面超越。开发者迁移仍面临学习成本。

制程枷锁：华为芯片仍依赖中芯国际的N+2工艺（相当于7nm），与台积电为英伟达代工的4nm工艺存在代际差。这限制了芯片的极限功能。

(, 下载次数: 2)

2026年2月这个夜晚，或许正如一些观察者所言，会被记入中国AI发展的史册。DeepSeek V4的“海狮”举动，其意义已超越一款产品的发布。它向世界宣告：在算力成为战略资源的时代，中国AI不再甘于做英伟达生态的跟随者，而是试图经过算法与硬件的协同创新，构建一套独立、自主的AI价值体系。

再过两天，当“海狮”正式上线，其在华为芯片上的真实表现将接受全球开发者最严苛的检验。无论成败，这条“换道包围”的途径已然开启。英伟达的警报，或许才刚刚拉响。

安东简介：“信创纵横”、“信创咨询”公众号创始人，专栏作者；北京市人社局评定高级工程师、评标专家；北京信息化协会特聘专家；中国工程咨询协会注册咨询工程师（投资）；国家开发银行评标专家；广州信创行业协会特邀讲师；本硕分别毕业于北京交通大学计算机、系统工程；先后就职于多家央国企总部，在信创产业及政策、数字政府、央国企数字化转型等范畴从事咨询研讨多年；欢迎交流合作！微信号:andon902
福利

定位：这是信创纵横精心创建的付费知识社群，方向次要包含信创、数字化、新型基础设备、智慧城市、以及AI、大数据等新一代信息技术，希望将该知识星球打造为一个大家频繁沟通、咨询与讨论行业成绩的平台！与行业精英为伴。同时，会提供大量高价值的在线培训及视频回放，并给大家提供一些处理方案/行业报告/PPT模板/电子书等干货素材【目前8000+信创材料及视频，并实时更新】，供大家交流、学习以及自我提升。

欢迎加入信创纵横智库（扫下方二维码）

(, 下载次数: 2)

(, 下载次数: 2)

END

(, 下载次数: 2)

(, 下载次数: 2)

点击图片查看残缺内容：

(, 下载次数: 2)

(, 下载次数: 2)

(, 下载次数: 3)

(, 下载次数: 3)

(, 下载次数: 2)

(, 下载次数: 2)

欢迎光临职贝云数AI新零售门户 (https://www.taojin168.com/cloud/)