职贝云数AI新零售门户

标题: 穿过DeepSeek的窄门 [打印本页]

作者: 795eQI 时间: 13 小时前
标题: 穿过DeepSeek的窄门
(, 下载次数: 0)

(, 下载次数: 0)
尤洋想知道，梁文锋的目的到底是什么。
文｜《中国企业家》记者闫俊文

编辑｜张晓迪
头图来源｜受访者DeepSeek成了抢手概念，握住它，仿佛就掌握了财富之门的密钥。腾讯、百度等大公司目前都已接入了DeepSeek的R1模型。2月中旬，得益于DeepSeek概念，腾讯股价一度涨超6%，达到506港元，创下近三年的新高。另一些服务器和初创公司也借此造势，或出售一体机，或售卖token，发了一笔热财。一工夫，跟随者如过江之鲫，DeepSeek成了“宽门”，人人都希望经过它来掘金。但偏偏有人例外，要过“窄门”，不跟着DeepSeek的节拍走。3月1日，一家名为潞晨科技的AI Infra‌初创公司发布公告，“潞晨云将在一周后中止提供DeepSeek API服务，请尽快用完您的余额。假如没用完，我们全额退款。”这个公告间隔它在2月4日上线这项业务还不足一个月。疾速接入，而后疾速中止，根源是售卖DeepSeek等开源模型API token的MaaS业务形式带来了盈余。2月9日，潞晨科技创始人尤洋在微博上“掰指头”算账，阿里云、百度云、腾讯云等内卷低价或收费提供服务，满血版的DeepSeek-R1每百万token官方也只能收到16元，假如满血版的DeepSeek-R1每日输入1000亿token，每月支出约为4500万元，但每月的机器成本是4.5亿元，盈余4亿元！用户越多，盈余越多，尤洋得出结论，MaaS（Model as a Service）在中国短工夫内能够是最差的商业形式。这种观点引发了热议。在知乎上，尤洋给出本人的算账过程，但一部分网友以为他将成绩有限拔高，直言其否定了DeepSeek。3月1日半夜，DeepSeek在知乎发表的一篇名为《DeepSeek-V3/R1推理系统概览》的文章提到，实际上一天的总支出为56万美元，成本利润率 545%。但尤洋仍坚持本人的观点，并罗列了三大理由：1.测试速度和实践场景的差距；2.机器应用率峰值和波谷的宏大差距；3.机器的不波动性。他感叹，有点不太想深化讨论，由于很多人甚至想当然地把“DeepSeek不亏钱”当成一种不能撼动的真理。3月1日下午，潞晨科技宣布暂停DeepSeek API服务。3月底和4月底，《中国企业家》两次采访尤洋。他是一位90后，戴着眼镜，身体肥胖，不善言谈，与他在网络上“火力全出”的笼统截然不同。理想上，尤洋要穿过三重“窄门”，一个是大家都在拥抱售卖DeepSeek等开源模型的API服务，但尤洋回绝；另一个则是他坚定选择与华为昇腾等国产算力厂商合作，大部分人还在等待美国政府对英伟达H20芯片的宽限令；最后，他押注视频大模型，这与文本模型的繁华构成了反差。“视频大模型是AI时代的相机。”尤洋说，潞晨开源的视频模型Open-Sora 2.0，近期荣登GitHub Trending全球开源热度榜单第一，以此为基础的AI视频生成平台Video Ocean，仅需用户提供一句话描画，即可在线生成高质量动态视频，发布后登上Product Hunt全球产品热度榜单第一。尤洋履历颇丰，本科毕业后，他先在清华大学攻读硕士研讨生，后赴美国加州大学伯克利分校进修，获得博士学位后，任新加坡国立大学高功能人工智能实验室主任、校长青年教授；2021年，尤洋受投资人约请，在北京创立了潞晨科技，迄今已获得创新工场、真格基金、红杉中国、蓝驰创投、北京市AI产业投资基金等投资机构的数轮融资。
(, 下载次数: 0)
来源：受访者目前，潞晨科技在北京和新加坡等地有近80人的团队，根据2024年披露的数据，该公司合同营收7700万元人民币，账面上有能满足30个月开支的现金流。以下是对话的内容实录（有删减）：
(, 下载次数: 0)
放弃DeepSeek API服务，最次要缘由是盈余《中国企业家》：你们在2月和3月遭遇的网络风波，如今曾经过去了吗？尤洋：对我们来说，其实不断没有什么影响，我个人也没有去与DeepSeek对立的想法。《中国企业家》：如今外界对技术与商业形式的讨论，各种各样的说法都有。尤洋：在知乎上或者其他地方攻击我的那些人，我敢担任任地说，这些人里99%从来没有用300多张卡去真正部署过DeepSeek，甚至没用100张卡部署过。仅去跟风想象一件事情，和实践动手验证，得到的观察是截然不同的。我的确亲手验证过这件事情，假如是业界专家看，我的观点跟DeepSeek发布的数据，是没有任何冲突的。《中国企业家》：但DeepSeek说本人的成本利润率是545%，而你在微博上说MaaS形式下，毛利率是-700%。尤洋：首先，DeepSeek原文中说了，这是实际数字。没有思索用户的体验和商业服务的可用性保障，并且他把那些APP以及网页和MaaS上的token都加在一同计算了支出，但显然很多是大家可以无偿运用的。春节的时分，我感觉DeepSeek的热度有点过于疯狂了。它还在非感性市场，一旦变得市场化，需求侧变得不波动和高要求，那么它的测算还会有非常大的波动。《中国企业家》：您微博上所说的数据，比方说支出4500万元，机器成本3.6亿元，毛利率-700%，这个结论是你们本人跑出来的？尤洋：根据微博上另一位博主在AMD机器上的实测换算得到。补充一个例子，Hugging Face中国区的一位资深专家在冤家圈发图，他把卡的功能发挥到极致，烧了一下午的token，也没有烧够100万个，当然他用的卡能够是低配版。思索到服务全国用户，能够全国有5000万人在用，大多数人每天能够就用一两个小时。但由于我们不能准确预测哪些用户要用多少，什么时分用，同时为了包容高峰保障MaaS服务的商业波动，机器要能包容最高峰，低谷还是得放着，成本还是高峰那么多。我的算力不管是租还是自建，算力成本都是随工夫波动产生的，推理与训练需求的服务器也不一样，这得放多少服务器，能够需求数万台H20等推理服务器时辰运转。比如大家不能接受微信在高峰时段不可用和三天中间崩掉。相似的，作为MaaS供应商，下游商业运用和C端用户也需求有体验和服务的可用性保障。《中国企业家》：速度是指token的输入速度吗？尤洋：赚还是亏，核心的目的就是一台GPU每秒能出多少token，以及对应的成本。比如它终究是一秒钟输入了1000个token还是10000个token，由于它最终是按照token的价格去卖的。
(, 下载次数: 0)

来源：AI生成
《中国企业家》：公司在2月初上线了DeepSeek的API服务，但经过一个月的尝试，决议不做这个业务，这是为什么？尤洋：假如不尝试的话，我感觉没有发言权的。其他初创公司能够会觉得，前几个月我烧一下，然后过几个月再坚持一下，跑不通了，我再把它砍掉，但是我们能够就直接过了不到一个月的工夫就把它砍掉了。《中国企业家》：为什么决断这么迅速？尤洋：有两个缘由，第一，我们海外的潞晨云业务增长比较快，我们应该把资金投入到非常难得的增长机会里；第二，MaaS的商业形式还不太成熟就已堕入内卷，如今中国至少有50个云厂商都在提供开源的DeepSeek模型API服务，它曾经不是一个稀缺的东西了，如今部署起来也比较成熟，利润空间非常有限。根据IDC数据，TOP3公有云已占据MaaS 85%市场份额，截至2024年底，MaaS全国用量10000亿token/天。以较贵的DeepSeek-V3刊例价计算，该业务全国全年市场总计营收希冀值为：10000亿token/天×8元/百万token×365天=29.2亿元。但实践上，为抢占市场，有大量收费和低价token，不计成本恶性竞争，远达不到上述营收希冀。《中国企业家》：公司公告里也说了“暂停”，你也说MaaS暂时是中国最差的商业形式，什么时分会再次尝试？尤洋：我们非常灵敏，只需它符合市场，并且能产生一定的利润，不管用何种方式，只需它能产生健康的利润，我觉得应该去做。《中国企业家》：初创公司很少提利润，普通都是先做规模，扩展市场份额。尤洋：能够不一定公司需求盈利，但是至少这个生意逻辑应该是跑得通的，我的单位经济模型到底是什么？长期来看，它如何产生价值，我觉得产生利润就是一个企业应该追求的东西。《中国企业家》：作为一个创业者，你怎样看Kimi和DeepSeek这样的明星公司？尤洋：我感觉都有点可遇而不可求。根据杨植麟的自述，在2023年但凡晚个几周，他能够就达不到他明天的壮举，他的融资窗口只要一个月，当然，他本身也有张予彤（前金沙江创投主管合伙人）的加持，这种机会难得，可遇而不可求，DeepSeek背后的幻方量化资金非常雄厚，较早就有万卡集群了。这两者的状况其实不像是创业，他们本身就曾经家大业大了，更像在运营一个阿里或者谷歌的研发中心，而不是普通创业者的形式。《中国企业家》：MaaS形式之下，就没有获益的公司？尤洋：MaaS对OpenAI来说是一个很好的商业形式。我一直觉得AI最终应该构成两三家企业，两三家有相对实力的企业停止必然（过度）的垄断，而不是一家。比如中国有三家，这三家的模型非常好，它可以像OpenAI那样去闭源，做成MaaS并获得合理收益。如今MaaS商业形式之所以不好，是由于大都运用开源模型或者没有拉开差距的闭源模型，各家没有本质不同，为了抢占市场，只能打价格战和收费恶性竞争，但成本是根据GPU固定产生的。
(, 下载次数: 0)

初创公司的商业形式是什么？《中国企业家》：你在微博上援用红杉资本合伙人周逵的话，寻觅“难而正确的事”并沉下心来去做，什么是正确的事？尤洋：但凡是高价值的东西，一定会有很多人想去做。由于它有高价值，一定也不会那么简单，首先每个人都选一个本人置信的点，比如我置信将来就是算力平台，加上视频大模型，这两个生意是有光明前景的。《中国企业家》：潞晨的商业形式是什么？尤洋：第一，协助企业去做本人的AI大模型，比如企业自有模型、行业模型，我们面向一些中小型客户以及传统客户，在海外就是潞晨云，国内就是一体机，这是我们不断在做的事情；第二，我们最近特别关注视频大模型，视频大模型将来就是AI的相机。《中国企业家》：视频大模型为什么是将来的机会？尤洋：视频大模型是将来三年少有的持续增长的市场，关键是视频大模型它有两点，第一，它对算力的需求优化极高，一个很小的视频能够都有几百万token，视频大模型将来的三五年核心就是算力优化，这是最重要的事情。
(, 下载次数: 0)

来源：AI生成
第二，视频大模型产品外形很有能够会变成一个算力优化的工作，它跟大言语模型的核心区别是，大言语模型是需务实时交互的，比如说我用ChatGPT或者DeepSeek，假如我问它一个成绩，它过两三分钟才回复，甚至超过20秒回复，我就没有耐烦了。但视频大模型我提交一个义务，比如，我让它生成一个电影，生成一个短视频，我是可以等的。《中国企业家》：视频模型的生意本质还是MaaS形式。尤洋：对，但它的MaaS商业上比较敌对，即便用户同时挤过来，可以队列式处理央求。《中国企业家》：在云上，训练一个中小企业本人专属的模型的话，大概成本是多少钱？尤洋：大概是3万元/月，当然有的能够需求高一点也可以，也有些企业花了几百万。在海外，我们大概每月有100万美元的支出。《中国企业家》：有厂商曾经把一体机的价格卖到了14万元左右，你们的一体机价格在数百万元，差别是什么？尤洋：假如只是买10万元的一体机的话，它跑DeepSeek-R1-671B参数效率不是最高的，也不会有太好的实践意义。其实他们很多是套壳KTransformers这个开源项目。简单做个性价比核算：硬件10万元，Q4量化（一种紧缩模型的技术）的残血DeepSeek-R1/V3模型输入才能10token/s，只能供1个用户运用，每月满载实际输入才能26M token；而从云厂买等量未阉割满血模型的API token价值一两百块，还有收费额度和按量折扣。100多万元的一体机可以服务高精度高并发的商业需求和简单公有模型微调开发，显然适用很多。我们还做了Colossal-AI开源，这是全亚洲最大的大模型训练推理的平台系统，仅就开发工具而言，我们在优化方面积累还是非常深的，播种了5个世界500强客户。
(, 下载次数: 0)

华为是个大机会《中国企业家》：如今你们焦虑吗？毕竟H20受限了。尤洋：还好，国内没有H20的话，我们就做国产芯片，华为昇腾等国产算力发展得很快。《中国企业家》：我看到国外媒体说华为要发新的芯片910C，你们会觉得有差别吗？会对你们的成本结构有什么影响？尤洋：差别不大，我们就是想选一个市场上能买到的最好和最受欢迎的机器，基于它去做优化。其实我觉得对我们是更有利的。由于假定国产芯片能够暂时落后英伟达芯片的话，我们其实有更多优化空间可以做。《中国企业家》：你在微博上也说，华为的芯片优化不能够靠1~2家小公司搞定。尤洋：华为有几千人的团队与芯片业务相关，华为的芯片一定是有中流砥柱的作用。我觉得再配合几十家、上百家公司去协同华为生态，这样比较靠谱，一定不能靠一两家小公司去把这个事情做好。《中国企业家》：目前，国产芯片相较于英伟达芯片，次要差距在哪里？尤洋：一张英伟达芯片卖多少钱，一张国产芯片卖多少钱，受限于消费芯片的成本和暂时的技术限制，所以（国内）消费异样功能的芯片成本就高很多，导致必须得这样定价，定价又导致研发速度跟不上英伟达。
(, 下载次数: 0)

来源：AI生成
比如说异样花了1万块钱，英伟达能每分钟出10万个token，国产芯片只能出3万或者2万个token。我觉得华为等曾经做得很好了，只不过英伟达积累的工夫更长，做了20多年了，饭得一口一口吃。《中国企业家》：在国产芯片上做优化和加速的难点是什么？尤洋：大模型层，首先DeepSeek的难点是，国产芯片没那么波动，它的周边配套也不是特别好，国产芯片很多算子缺失，精度、编译器、集群等又常常出bug，导致运用它开发比较困难，总体上，一定不是一个芯片本身跑分高低的成绩。这相当于我有一个赛车，它的设计实际速度，比如说250公里每小时，但是我能够要精心尝试跑100次才能跑出一个这样的速度，它还没那么波动。《中国企业家》：对于AI Infra企业来说，是模型退化更重要还是加速更重要？尤洋：其实两者并不矛盾，模型的退化能带动需求的旺盛，进一步带动对开发、运用模型的决计和投入，提升对训推加速、算力的需求，进而加速模型退化。《中国企业家》：假如你无机会去见到DeepSeek的梁文锋，你会和他讨论什么成绩？尤洋：其实我最关怀的是，他到底是想做一个成功的商业化公司，还是想经过一些其他手腕做一些非盈利的事情？想知道一下，他的目的到底是什么，由于两者一定差距是非常大的。比如说OpenAI能够还是想做一个Google那样非常高价值的商业化公司，我不知道梁文锋是不是想做中国AI版的谷歌。旧事热线&投稿邮箱：tougao@iceo.com.cn
(, 下载次数: 0)

。END 。

值班编辑：王怡洁审校：张格格制造：姜辰雨

关注“中国企业家”视频号
看更多大佬观点和幕后故事
(, 下载次数: 0)

[ 引荐阅读 ]

(, 下载次数: 0)

欢迎光临职贝云数AI新零售门户 (https://www.taojin168.com/cloud/)