开启左侧

DeepSeek 是怎样发展起来的?

[复制链接]
在线会员 hzqG 发表于 2025-11-19 11:30:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题 |快速收录
——一部华夏工程师的“顺势生长史”

假设要道 2024—2025 年华夏 AI 最具代表性的工作,
DeepSeek 的兴起,必然排正在第一止。

它没有是至公司干进去的,也没有是砸钱堆进去的。
它靠的是——手艺门路明了、工程才气极强、本钱掌握远乎偏偏执。

来日诰日,小利剑用只管佳懂的方法,把 DeepSeek 的生长路子残破道一遍。




01|尽头:押对于了“拉理时期”的赛讲

当年夜大都团队借正在参与“参数比赛”、一味堆年夜模子时,
DeepSeek 挑选了一条其时其实不支流的门路:

干拉理模子(LRM),而没有是甚么皆聊的全能年夜模子。

所谓拉理任务,包罗:

    数教拉理

    逻辑拉理

    少链条计划

    多跳揣度

    代码 reasoning

那些任务对于模子“思考才气”请求极下。
正在 GPT-4已经 很佳用的条件下,险些出人相信国产模子能逃上,更别道正在拉理上干出劣势。

而 DeepSeek 的鉴别是:

未来年夜模子真实的中心合作力,没有是“能道很多逆”,而是“会没有会认真思考”。

从尽头开端,它便把赌注压正在了“拉理才气”上。




02|高调积聚期:专一 MoE,而没有是堆算力

DeepSeek 最先对峙的中心手艺,是 MoE(Mixture of Experts,大师混淆)架构。

MoE 的逻辑十分“工程师”:

    没有是统统参数共同跑

    屡屡只挪用“最善于这种任务”的这部门大师

    正在包管结果的条件下,最年夜限定省算力

用一句话归纳综合:

宁可让统统参数共同上,没有如只启动最善于的这批“大师”,把计较服从推谦。

这类门路正在晚期其实不被瞅佳,被觉得“没有颠簸、易调劣”。
但是 DeepSeek 花了多少年时间,把 MoE 从“尝试室设法”挨磨成“产业级计划”——
真实让它跑稳、跑快、跑强。

那一步,成为前面“高本钱反杀”的枢纽下层。




03|工程突破期:自研锻炼框架,限度榨取 GPU

DeepSeek 最勇猛之处不但是模子,而是面前 远乎偏偏执的工程才气。

他们干了许多他人“以为太省事”的工作:

    自研通信调理取散布式锻炼框架

    自研算子,把 GPU 隐存榨取到“毫米级”

    锻炼过程当中算法取工程往返挨磨,而没有是“双方各自为战”

    数据洗濯战蒸馏干到颗粒度更细,宁肯多花时间,也没有要净数据

    锻炼齐过程主动化,能监控、能回滚、能快速试错

他人是“堆卡、堆钱、堆机械”,
DeepSeek 更像是正在“挤每滴功用”。

成果即是:
正在异常估算下,DeepSeek 锻炼出了更强的模子。




04|枢纽奔腾期:DeepSeek R1 的横空出生避世

真实把 DeepSeek 拉到台前的,是 DeepSeek R1。

一句话归纳综合:

R1 让国产模子第一次正在拉理才气上,侧面对于标 GPT。

R1 的多少个枢纽立异面:

    走 CoT(Chain of Thought)门路,重心进修“思考步调”,而没有是只寻求准确谜底

    颠末 蒸馏(Distillation),从更强模子那边进修下品质拉理历程

    引进进程 嘉奖(Process Reward),不但嘉奖对答,借嘉奖“如何念的对于”

    使用 Self-Training,让模子正在已经有根底上不竭自尔退步

    把 MoE 架构取拉理任务深度分离,正在下功用取高本钱之间得到均衡

R1 公布以后,全部止业突然观点到:

“拉理时期果然去了,并且此次,争先者可以是华夏团队。”




05|死态爆发期:从模子到东西链

R1 不但是一个模子,更像一齐“多米诺骨牌”,推翻了连续勾通锁反响。

① 东西提高速率极快
实质创作家、师长教师、钻研职员、法式员……
险些统统人皆开端上脚用 DeepSeek 干拉理、写做、阐发、计划。

② 守业者大批出现
高本钱门坎,让中小团队也有了 AI 产物的试错空间,各类产物开端出现:

    智能办公帮忙

    私有化布置的年夜模子仄台

    数教/物理解题东西

    代码检查战沉构帮忙

    教诲问信息争题解说

    止业笔直智能体等

大家皆能“戴着一个拉理模子”守业。

③ 企业级降天清楚加快
许多企业已经以为:
“AI 佳是佳,即是太烧钱。”

DeepSeek 用功程伎俩,把本钱挨下来,
让企业第一次以为:“用 AI,是算患上过账的。”




06|DeepSeek生长 的下层气力:极致工程,没有靠堆钱

假设要给 DeepSeek 的手艺代价不雅干个小结,能够用三句话:

    “够用”而没有是“堆料”

    没有科学年夜参数,而是寻求“单元算力的代价”。

    “工程赛过形而上学”

    少一面形而上学调参,多一面可复现的工程办法。

    “本钱即护乡河”

    当功用附近时,谁的本钱更高,谁就可以活患上更暂、跑患上更近。

那些代价不雅,正在华夏互联网情况里极端适配:
既契合工程师气度,也契合贸易幻想。

某种意思上,DeepSeek 是一场“国产工程师精神的胜利”。




07|DeepSeek 的意思:沉塑 AI 合作格式

DeepSeek 的呈现,最少戴去了四个层里的作用:

    手艺层里:国产模子初度迫近天下最强
    让环球从头审阅“华夏手艺气力”,华夏再也不不过 AI 用户,而是到场者以至引发者。

    普惠层里:AI 真实加入群众糊口
    一般人第一次能高本钱天使用“会认真思考的 AI”。

    守业层里:一次罕见的黄金窗心期
    时机已经晃正在桌里上:
    —— 谁能把 AI 真实干成产物,谁便有机会鄙人一轮海潮里崭露头角。

    止业层里:促进范式从“堆参数”到“教拉理”
    环球模子在从“更年夜、更贵”转背“更智慧、更下效”,
    而那波趋势里,华夏站正在了绝对靠前的职位。

结语|DeepSeek 的小说才方才开端

DeepSeek 的胜利没有是偶尔,
也没有是邪术,
而是一场临时 押注 + 极致工程 +本钱 规律 配合感化的成果。

未来三年,
它不但会戴去更多模子取产物,
更可以沉塑全部 AI 的开展标的目的。

您战尔在亲目击证的,
不但是某野公司的胜利,
而是一次 “华夏式手艺突破” 的汗青时候。

扫码存眷

战尔共同迭代进修~
您需要登录后才可以回帖 登录 | 立即注册 qq_login

本版积分规则

发布主题
阅读排行更多+
用专业创造成效
400-778-7781
周一至周五 9:00-18:00
意见反馈:server@mailiao.group
紧急联系:181-67184787
ftqrcode

扫一扫关注我们

Powered by 职贝云数A新零售门户 X3.5© 2004-2025 职贝云数 Inc.( 蜀ICP备2024104722号 )