金融投资报评论员 刘柯
上周末,DeepSeek突然抛出一个“王炸”,披露旗下的大模型V3/R1推理系统理论成本利润率高达545%,引起业界一片哗然。
实际上,DeepSeek这么做,是对一家不是很起眼的AI小企业潞晨科技在2月初质疑AI云服务亏损的反驳。按潞晨科技估算,满血版DeepSeek-R1每百万token(输出)定价16元,如果每日输出1000亿token,一个月下来,接入方企业可获得4800万元的收入,而要完成1000亿token的输出,则需要约4000台搭载H800的机器。以目前H800的市价或者折旧来计算,每月仅机器成本就高达4.5亿元。因此,接入企业方可能面临每月4亿元的亏损,于是,潞晨科技宣布将暂停DeepSeek API服务。
理论上讲,做生意不赚钱而暂停服务,是天经地义的。但是,DeepSeek的反驳,似乎又让很多企业看到了希望。尽管DeepSeek的推测也是建立在“理想主义”之上的,但实际上,2024年DeepSeek有关核心人员就说了,“做AI大模型云服务还是有利可图的,特别是在全社会都在‘AI+’的大背景下。”
那么,潞晨科技的痛点在什么地方呢?在于没有规模效应。
潞晨科技的主营业务包括分布式软件系统、大规模人工智能平台和企业级云计算解决方案。通俗地理解就是一个AI云服务的中间商,其主要是利用软件技术给下游企业做云计算解决方案。因此,潞晨科技的盈利模式就是找到下游需要云服务的企业,然后做方案,再去找上游的云计算企业租算力。这样一家企业在DeepSeek快速普及的时代实际上是没有话语权的,因为很多云计算服务企业可以通过一体化的服务解决掉中间商的环节。潞晨科技一年的营业收入仅7700万元,其上游受制于算力,而下游的客户总量也不大,这就是现实。
DeepSeek给市场算的“理论账”,让很多终端企业看到了直接在云端部署DeepSeek的优势,无论是产业变局还是盈利空间,都有很大的想象空间。
因此,这笔“理论账”会吸引越来越多的初创AI企业,利用DeepSeek的大模型进行训练和推理,实现各种垂直细分应用小模型,或者直接应用到自己的产品改良升级之中。而且,DeepSeek公开成本利润率是给众多观望者一个提醒,即越早利用DeepSeek搞训练推理,利润率就越高,能省掉中间商则省。潞晨科技的这种模式迟早会被有自建智算数据中心、能提供Maas(模型即服务)和一体机等综合服务体系的一体化平台云服务企业代替。可以说,拥有1万P以上自有算力,而且大部分是智算算力的中小云企业,是DeepSeek大发展的最大受益者。
此外,从未来的发展趋势看,在全社会接入DeepSeek的情况下,需要训练推理的用户越多,对智算算力的需求就会越大。供求关系发生改变以后,算力输出很可能会涨价。
据说,在DeepSeek诞生以来的短短几个月中,已经榨干了现有的智算算力库存,高端智算机柜已经是一柜难求,而智算数据中心的建设需要一个较长的周期,即便是阿里投资3800亿元搞AIDC(智算数据中心)基建,也需要三五年的时间才能见效。但在三五年后,AI的世界将会发生怎样的变化?只有天知道!