职贝云数AI新零售门户

标题: 【紫月锐评】DeepSeek V4上线在即,AI Agent商业化进程加快 [打印本页]

作者: vW5815vcl    时间: 7 小时前
标题: 【紫月锐评】DeepSeek V4上线在即,AI Agent商业化进程加快
【紫月投研】近日,根据AI科技圈内知情人士泄漏,DeepSeek最新一代的AI大模型DeepSeek V4或于近期正式上线。按照业内人事泄漏的音讯,DeepSeek V4是一款具有图片、视频和文本生成功能的多模态模型;在硬件适配方面,DeepSeek为国产算力提供深度支持,DeepSeek努力于优化V4模型以适配中国制造的芯片,此举有望提振中国市场对其半导体产品的需求,并加速AI模型“推理”环节向本土芯片靠拢。详细来看:

1、DeepSeek公司厚积薄发,V4模型系其立足V3系列研发的新一代功能更强的大模型。

根据公开材料显示,DeepSeek(杭州深度求索人工智能基础技术研讨有限公司)系一家专注于人工智能大模型技术创新研发的初创公司,也是全球抢先的AI大模型公司。

自2023年以来,DeepSeek在推理才能和模型效率方面不断创新,2024年发布DeepSeek V2大模型,2025年推出DeepSeek V3系列。其AI大模型不只确立了弱小的综合功能基础,更经过持续的小版本更新提升了用户体验。本次DeepSeek拟发布的DeepSeek-V4大模型系公司研制的最新一代AI大模型,也是DeepSeek-V3的新一代晋级版本。

2026年2月26日,DeepSeek V4模型的技术细节陆续浮出水面。根据业内牢靠信息披露,DeepSeek代号为“sealion-lite”的DeepSeek V4预览版本已进入封闭式外部测试阶段,参与测试的各方均签署了严厉保密协议,DeepSeek将于近期正式推出全新多模态大言语模型V4版本。当前,DeepSeek-V4大模型尚未正式发布,按照DeepSeek发送给业内芯片公司测试的“V4 Lite”版本,DeepSeek V4相比上一代AI大模型DeepSeek V3迎来了分明的晋级

一是上下文窗口大幅提升,DeepSeek V4具有 100 万 tokens 的上下文窗口,相较于 V3 系列的 128K 提升了近 8 倍,实际上可以一次性处理《三体》选集的文本量。

(, 下载次数: 0)

二是原生支持多模态推理,V4 Lite 采用原生多模态架构(残缺的DeepSeek V4版本亦采用原生多模态架构),这意味着该模型在预训练阶段就将文本和视觉了解相结合,而非后期拼接,可对超长文本、大型代码库等复杂输入停止深度分析与了解。

三是模型参数有很大提升,V4 Lite 估计有 2000 亿参数,而残缺的DeepSeek V4版本参数能够会打破1万亿,DeepSeek V4版本大模型参数规模的提升意味着其在推理才能和输入结果的质量方面,将比上一代的DeepSeek V3版本有较大幅度的提升。

四是SVG图像才能更出色,相比上一代的DeepSeek V3版本,V4 Lite 在生成高精度SVG图形等高难度生成义务大模的表现也愈加出色,其运用极简代码(仅 54 行)即可生成高质量图像,显示出其在空间推理和结构化输入方面的分明提升。

2、V4模型立足原生多模态,支持图文视频一体化生成,无需切换工具即可满足多种需求。

从国内AI大言语模型(Large Language Model的简称,旨在了解和生成人类言语,经过大量的文本数据停止训练,协助人类执行广泛的义务,包括文本总结、翻译和情感分析等)的发展历程来看,大量企业堕入了“参数竞争”的死胡图,业内动辄千亿、万亿参数的AI大言语模型层出不穷,但多数产品都停留在实验室阶段,落地场景较为有限

(, 下载次数: 0)

相比业内其他AI大模型,DeepSeek研发的新一代DeepSeek-V4大模型并未一味地卷“参数”,而是在更底层的架构、算法方面停止工程优化和创新。从DeepSeek模型的前几代产品来看,由于太注重文本,其前几代大模型在写代码、推理方面的才能非常优秀,但是在图像和视频才能方面的短板却非常分明,DeepSeek V4则从根本上补偿了这一短板。

作为原生多模态大模型,DeepSeek V4在保持原代码才能(业内测评显示DeepSeek V4的编码才能比当前的GPT和Claude更强)、推理才能的基础上,支持图文视频一体化生成,无需切换不同工具即可满足多种创作需求。这种一体化才能恰恰击中了当前内容创作、电商设计等范畴的痛点(从业者往往需求在多个AI工具之间来回跳转,经过各种工具互相协同,才能完成目的义务的执行和成果输入,这在很大程度上使得运用效率大打折扣)

更值得一提的是,DeepSeek V4将延续DeepSeek一向的开源道路,可满足当前国内中小企业和开发者群体对高性价比AI工具的庞大需求,能够会催生一批垂直细分范畴的AI运用。例如,餐饮商家可以用DeepSeek V4来开发智能点餐系统,自媒体创作者可以用DeepSeek V4来疾速生成图文视频内容,甚至先生也能借助DeepSeek V4来提升学习效率。

3、V4模型积极婚配国内AI等芯片产业生态,有利于国内AI产业界构成广泛的创新协同。

在人工智能开发范畴,开发者通常会与抢先的芯片制造商共享模型预发布版,以确保软件能在主流硬件上高效运转,DeepSeek此前也曾与英伟达/AMD技术团队保持过严密合作。

不过,本次DeepSeek在DeepSeek V4新模型的测试方面则打破了行业惯例,DeepSeek曾经向包括华为在内的国内硬件供应商提供了DeepSeek V4模型的测试权限,却并未向英伟达和AMD这两家全球抢先的芯片供应商提供预发布版本的访问权限。

(, 下载次数: 0)

长期以来,国内AI大模型的算力依赖海外高端芯片,不只成本高昂,还面临供应链安全风险。一旦海外芯片断供,国内多数大模型项目将堕入停滞。本次DeepSeek V4模型选择优先支持国产硬件,却将英伟达和AMD拒之门外,对国内AI生态建设意义严重:

一方面,DeepSeek V4采用差异化的测试授权方式,使得以华为昇腾、寒武纪、海光等国产芯片为代表的中国芯片厂商可以获得宝贵的抢先工夫,可以提早数周针对自家处理器停止软件层面的深度优化,从而在AI大模型适配与运转效率方面抢占先机。

另一方面,DeepSeek与AI芯片厂商结合优化的底层架构,让DeepSeek V4大模型能在国产算力平台上高效运转,这意味着本土半导体产业链将获得大规模的实践运用场景。此前,国产AI芯片更多停留在AI大模型的测试阶段,缺乏真实业务场景的打磨,而DeepSeek V4的落地将推进国产芯片疾速迭代,进而加速过程芯片完成产业化。

总体而言,DeepSeek这种“AI大模型+AI硬件”深度绑定的做法,为国内AI大模型企业后续的技术创新形式做出了示范,也将吸引更多AI大模型企业将算力支点回归到国内AI产业生态,有利于提升国内AI产业的自主可控才能。将来,从数据处理到算力支撑,AI全链条掌握在本土企业手中,将有效避免外部制裁带来的风险,为AI产业长期发展筑牢根基。

【紫月锐评】当前,全球AI科技的竞争正如火如荼,中国、美国作为全球AI科技竞赛中的两大佼佼者,单方在AI芯片、AI大模型、AI运用范畴的竞争已进入到白热化阶段。随着2026年AI Agent元年开启(详见《【紫月锐评】2026开启AI Agent元年,重点关注三大产业机会》),全球人工智能产业正在阅历一场深入的范式革命。本次DeepSeek V4发布,将加快AI技术提高,推进AI Agent技术2026-2027年迈入商业化运用,后续可重点关注三大核心产业方向:一是下游AI算力侧,在中美科技竞争和供应链脱钩的大趋向下,国产AI芯片、AI服务器、AI智算中心的发展势不可挡(代表企业浪潮信息、寒武纪、中科曙光、拓维信息、海光信息等);二是中游平台工具链开发端,为行业提供波动、牢靠的平台工具必不可少(代表企业字节跳动、智谱、Minimax等);三是下游工业制造、自动驾驶、个人助理等运用范畴,这是产业力气最终的商业化出口(代表企业华胜天成、易点天上等)








欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/) Powered by Discuz! X3.5