
众所周知,过去二十年,网络世界最重要的资源是“流量”,那么今天,AI 世界最稀缺、也最炙手可热的资源,只剩下一个看起来毫不起眼的单位——Token。
这个原本躲在技术文档里的词,如今被官方赋予了一个正式中文名:词元。更重要的是,它被定义为“智能时代的价值锚”,甚至成为连接技术供给与商业需求的“结算单位”。
所以,当一个技术概念被国家层面命名、统计并纳入政策体系时,它就不再只是技术细节,而开始像电力、石油那样,成为一种基础性资源。
同时,数据方面则令人震惊。2024年初,中国每天消耗的 Token 还只有约1000亿,而到了2026年3月,这个数字已经飙升至140万亿,两年增长超过1000倍。
在 AI 模型聚合平台 OpenRouter 上,中国模型一周消耗7.36万亿 Token,占全球36%,并连续三周超过美国。换句话说,中国不仅在“做 AI”,还在“用 AI”,而且用得极其猛烈。
显然,如果我们把 Token 理解成“AI 消耗的电量”,那这台机器显然已经开到了最大功率。
更有意思的是,全球真正进入“ 万亿 Token 俱乐部”的公司,只有三家:OpenAI、谷歌,以及字节跳动。字节在2024年上线时每天仅1200亿 Token,到2026年已经达到120万亿,增长同样超过千倍。
而且,它的大部分使用量还集中在中国本土市场——这意味着,仅靠一个国家,就能支撑起全球顶级的 AI 算力消耗规模。
为什么会这样?答案藏在另一个更反直觉的现象里:Token 价格在暴跌,但总支出却在暴涨。2022年,每100万 Token 的价格大约是20美元;到2024年底降到0.07美元;2026年已经低于0.02美元,两年下降了280倍。
按常理,价格下降,成本应该降低。但现实恰恰相反:企业在 AI 上的支出,从2024年的115亿美元暴涨到2025年的370亿美元,增长320%。甚至有45%的公司,每个月在 AI 上的花费超过10万美元。
而这反应出的是一个古老的经济规律——杰文斯悖论。19世纪,蒸汽机让煤炭使用效率大幅提升,人们以为煤会用得更少,结果却是需求爆炸,因为更便宜的能源催生了更多工厂、更多机器、更多产业。今天,Token 正在复制这一过程:越便宜,使用场景越多,最终消耗反而更大。
2024年,科技巨头在 AI 基础设施上的投入约为2600亿美元,2026年已经超过6000亿美元,预计2027年将达到1.15万亿美元。马斯克在孟菲斯砸下约180亿美元建设数据中心,部署50万块芯片。
OpenAI、软银和甲骨文联合推动的“Stargate”项目,计划四年投资5000亿美元;甚至连 SpaceX 都在申请部署100万颗计算卫星,把数据中心搬到太空。
他们都最终都指向同一个东西:Token 的生产与消耗能力。
更关键的转折发生在2026年——AI 行业第一次出现“推理成本超过训练成本”。更高效地“用模型”取代了模型的迭代与升级。当前,生成与执行已经占到云端 AI 支出的55%,未来可能达到70%甚至80%。
正式在这样的背景下,中国把 Token 纳入国家统计体系,其意义就不难理解了。这不仅是在记录 AI 使用量,更是在尝试建立一种新的经济核算方式——一种以“智能消耗”为核心的指标体系。
就像工业时代用千瓦时衡量电力,信息时代用 GB 衡量流量,AI 时代将会用 Token 来衡量生产力。但问题也随之而来:Token 的增长,真的等于价值的增长吗?
当140万亿 Token 每天被消耗时,我们需要问三个更现实的问题:是谁在付钱?价格是否可持续?这些计算到底创造了什么结果?
如果大量 Token 只是用于低价值任务,甚至是AI之间的“自我循环”,那么这个看似繁荣的数字,可能更像是一种“算力泡沫”。
而石油之所以重要,不只是因为它被开采出来,更因为它驱动了汽车、工业和整个现代经济。Token 如果要成为“数字石油”,也必须证明自己不仅能被消耗,还能真正推动生产力跃迁。
现在,我们或许正站在一个类似19世纪初的时刻。那时,人们还不知道蒸汽机会如何改变世界;而今天,我们也未必完全理解 Token 会把经济带向哪里。但可以确定的是,一场围绕“AI 消耗”的新工业革命,已经启动,而且正在加速。