![]()
![]()
图片来源/新华社
核心观点
今天Token的消费量正处于高速增长阶段,中国日均Token调用量从两年前的约1000亿飙升至最近的140万亿,增长了约1400倍。我们看到,需求是真实的、旺盛的、加速增长的,只是还没有被充分货币化。Token经济的未来规模,不取决于人类能用多少Token,而取决于机器能用多少。
■白惠天 袁晓辉
一个困扰市场的问题是:如果AI真的那么有用,为什么好像赚钱的只有卖GPU的,做大模型和做应用的很少见到赚大钱的?
英伟达毛利率超过70%,数据中心年收入逼近两千亿美元。但AI产业链中下游,全球主要模型厂商几乎无一盈利,中国大模型市场经历了百模大战式的激烈竞争后,推理服务价格已被压向成本线。整条产业链呈现出一个清晰的结构:上游的利润已经长出来了,下游的闭环还没有闭上。
一种流行解读是这是AI泡沫。但经济学视角的分析提供了另一种可能——闭环没闭上,不是因为AI没有创造价值,而是因为已经创造的价值没有被充分货币化。要理解这一点,我们需要回到AI经济的基本计量单位——Token。
Token是大语言模型处理和生成信息的基本单位。你向AI提一个问题,会花一些Token;AI给你一个回答,也会花一些Token。英伟达CEO黄仁勋将AI产业拆解为能源、芯片、基础设施、模型、应用五层,并将Token定义为贯穿五层的语言和货币。有了Token,AI经济就有了可以计量、定价和算账的单位——就像千瓦时让电力有了价格,桶让石油有了期货市场。围绕这个单位正在形成的一套经济运行逻辑,我们称之为Token经济学。
以下我们将从价值、生产、需求三个维度,尝试为这个正在成型的新经济体系勾勒轮廓。
AI创造了多少价值?
Token经济的第一个反直觉现象是:Token越便宜,总花费越多。
过去两年多,Token生产成本下降了超过99%。但全球企业AI支出不降反升,翻了三倍多。经济学家对此不会陌生——1865年英国经济学家杰文斯发现,蒸汽机效率的提升不但没有减少煤炭消费,反而让更多使用场景变得经济可行,总消耗量大幅上升。Token正在三年之内重演煤炭使用持续了一个世纪的故事。
但Token与煤炭有一个根本区别。煤炭的价值由物理属性决定,一吨煤就是一吨煤。Token的价值则完全取决于被用来做什么。耶鲁大学Cowles基金会的Bergemann等人在对大模型定价机制的理论研究中指出,Token是“可合同化的计量单位”:数量可精确计量,但价值因任务而异。同一个Token,用来闲聊值几厘钱,用来写代码值几百美元(折合人民币数千元),用来做法律分析可以值上千美元——差出好几个数量级。
我们把这种属性称为可编程性:同一种要素,仅因接收的指令不同,就能产出价值相差万倍的智力成果。钢铁做不到,石油做不到,电力的价值也因用途而异,但必须借助不同的物理设备——没有任何一种传统生产要素能仅凭指令不同就让自身价值跨越多个数量级。所谓平均Token价格,就像用平均房价来描述一个既有茅草屋又有摩天楼的城市——数字正确,但毫无意义。
可编程性直接解释了为什么AI的账面收入远低于其创造的价值。斯坦福大学数字经济学家Brynjolfsson等人(2025)基于大规模意愿支付实验估算,仅2024年生成式AI就为美国消费者创造了约970亿美元的消费者剩余;斯坦福大学2026年AI指数报告沿用同一方法框架更新了估算结果,达到约1720亿美元。无论取哪个数字,结论是一致的:用户获得的价值远超实际支付的费用,且这一差距仍在快速扩大。当一个月20美元的订阅费同时覆盖了闲聊用户和用AI做百万级商业决策的专业用户时,后者获得的消费者剩余显然会高很多。问题的本质在于:当前AI服务是按算力成本定价的,不是按它为用户创造的价值定价的。定价的维度,并不是价值评估的维度。
更值得注意的是,Token消费的结构与多数人的预期不同。当前增长最快的不是企业生产力工具,而是角色扮演、对话娱乐等消费性应用。这意味着Token经济的增长引擎并非“AI替代人力”——这个叙事虽然最吸引眼球,但从数据来看,尚未成为主流。真正驱动增长的,是一种此前不存在的消费形态——我们姑且称之为AI原生消费。这些需求不是替代,而是纯粹的增量。
所以,不是AI没有创造价值,而是价值以消费者剩余的形式留在了用户手中,还没有变成收入。
Token工厂的成本结构
聊天框里冒出一句回答,只要几秒。但背后被拉动的,是一整套体系:持续运转的数据中心、排队等着上架的GPU、被锁定的电力与冷却系统,以及还在不断抬高的资本开支。聊天框是最轻的一层,背后压着的是最重的那几层。
黄仁勋的五层蛋糕每一层解决的问题都不同,但每一层都需要真金白银。能源解决电力供应的问题,芯片解决算力的问题,基础设施解决跑得快不快的问题,模型解决是否能调得出来的问题,应用解决卖不卖得出去的问题。全球头部科技公司的年资本开支已从百亿美元量级跃升至近千亿美元量级,绝大部分投向AI数据中心和配套电力。AI看上去像软件,但骨子里越来越像重工业。用户买到的不是凭空冒出来的智能,而是五层蛋糕最上面那层被产品化之后的切片。
好消息是,Token的生产成本还在以惊人速度下降。哥伦比亚大学研究者Gogerty对150项技术学习率的系统研究显示,GPU算力成本的学习率高达89%——即产量每翻一番,单位成本下降89%——是有记录以来所有技术中的最高值。多项研究显示,大模型推理成本近年来每年下降约一个数量级,尽管这一趋势在不同任务和模型之间差异显著,但整体仍呈现出一条陡峭下行的成本曲线。
但这恰恰解释了利润为什么集中在上游:成本越快下降,越需要前置的重资产投入来推动下一轮降价。谁控制了最稀缺的供给,谁就先拿到利润。英伟达的护城河不只在GPU性能,更在于CUDA生态构成的转换成本——整个行业围绕着这套接口搭建系统。训练层是寡头市场,门槛以十亿美元计;推理层趋向竞争,开源模型已经把价格压低了九成以上。
中国在这场竞争中的位置值得关注。中国模型凭借算法效率、开源策略和极致定价,在全球Token市场迅速崛起,于是有了中国AI模型出海的说法。AI出海,是指中国模型的推理计算部署在海外云节点,本质上是中国的AI算法在出海,而不是中国的电力在出海。竞争越激烈,Token越便宜,最终受益的是全球所有开发者和用户。
回到开篇的问题:上游赚钱、下游亏损,是泡沫吗?这与2000年前后伴随互联网经济狂飙突进的光纤泡沫有本质区别。光纤泡沫的问题在于需求没有跟上——资本提前大规模铺设了光纤,但实际使用量长期不足。而今天Token的消费量正处于高速增长阶段,中国日均Token调用量从两年前的约1000亿飙升至最近的140万亿,增长了约1400倍。我们看到,需求是真实的、旺盛的、加速增长的,只是还没有被充分货币化。
Token的最大买家:从人到智能体
如果说前两节描述的是Token经济的现状,那么接下来正在发生的变化,可能才是真正改变量级的力量。
过去两年,Token需求的消费主要来自人类用户。但人类消费有一个天花板——认知带宽。Zheng和Meister在2025年发表于《Neuron》的研究中测算,人类有意识地处理信息的速度大约只有每秒10比特——尽管我们的感官系统每秒接收的数据高达十亿比特。这是生理上限,不会因为AI变强而改变。一个人一天能读多少字、能处理多少信息,终归有上限。
但智能体(Agent)正在打破这个天花板。智能体不是聊天机器人——它是能自主执行多步骤任务的AI程序。你给它一个目标,它自己去搜索、比较、计算、决策。一个编程智能体执行一个复杂任务,可以消耗数百万Token,而且24小时不间断运行。一家企业部署上千个智能体,年Token消耗量可能超过一个中等国家全部人类用户消耗Token的总和。
更深层次的变化在于市场结构本身。智能体不只消耗Token,还能自主采购——执行任务中自行决定调用哪个模型、消耗多少资源。当一个智能体在为用户做机票比价时,它可能在几秒内调用三个不同的模型、消耗数万Token,全程不需要用户干预。Token市场正在出现一种全新的买方:非人类买家。它们全天候运行,对延迟敏感但对价格不敏感,可以在毫秒间切换供应商。
从经济史看,这并不新鲜。每一代通用技术都经历过需求主体的转换——电力从照明进入工业动力时,需求量级跃升了数十倍;互联网从人类浏览进入机器间通信时,数据流量实现了指数级增长。Token经济正站在类似的拐点上。
这也回应了经济学界长期讨论的索洛悖论——AI投资井喷,但生产率提升有限。斯坦福大学经济学教授Jones在其2026年的研究中指出,AI的生产率提升受制于系统中的最薄弱环节:组织适配、制度变革、人类认知。如果瓶颈在于人类组织无法以AI的速度运转,那么让AI将自己组织自己——智能体网络——可能正是释放生产率潜力的路径。
Token经济的未来规模,不取决于人类能用多少Token,而取决于机器能用多少。
结 语
三节论述沿着一条追问展开:Token创造了多少价值?这些价值是怎么被生产出来的、利润卡在哪里?需求接下来由谁来驱动?
这些答案尝试勾勒出Token经济学的基本轮廓。杰文斯悖论与可编程性解释了为什么价格暴跌而支出暴涨;消费者剩余解释了为什么账面收入远低于真实价值创造;五层蛋糕与算力瓶颈解释了为什么AI像软件却赚着重工业的利润;智能体的崛起则解释了为什么当前的增长可能只是起点。
煤炭的推广用了一个世纪走完杰文斯循环,电力用了四十年实现从照明到工业动力的跃迁,互联网用了二十年完成从人到机器的流量转换。Token经济正在将这些历史进程压缩到数年之内。
我们今天能观察到的,不过是这场变革的开头几页。最后一个问题留给每位读者:你现在的工作中,有多少环节可以被拆解为“输入信息、处理、输出结果”?凡是符合这个模式的,都有更大的可能会被Token化。留给人类的,是判断、创意、关系和不确定性——而这些恰恰是Token做不好的事。
(作者单位:腾讯研究院)
总 监 制丨王列军车海刚
监 制丨陈 波 王 彧 杨玉洋
主 编丨毛晶慧 编 辑丨蒋 帅
![]()
![]()