提要

据BT财经2026年消息,2026年3月中国日均Token调用量达140万亿次较2024年初增长超千倍,主流AI大模型API调用价格普跌80%-99%,但算力租赁企业订单大增、GPU租赁价格涨幅近40%,这源于算力通胀悖论即单价降总花费涨,且定价模式从固定时长租赁转向按Token调用量分成,还带来算力稀缺性上升、AI应用层定价权向算力层转移、Token经济形成新利润分配机制等结果,此悖论可迁移到个人电费、带宽经济等,对普通用户、企业决策者、AI产业投资者均有不同影响【维科网链接

商机眼

2026年3月,中国日均Token调用量达到140万亿次,较2024年初增长超千倍。2023 - 2026年,主流AI大模型API调用价格普遍跌去80% - 99%,百万token调用成本从2023年的几十元降到几分钱。2023年多数企业一个月用不了100万token,2026年普通AI编程工具一天调用量超1亿token。算力租赁企业东阳光云智算签下160亿至190亿元算力服务大单,GPU租赁价格从2025年10月的1.70美元/小时涨至2026年3月的2.35美元/小时,涨幅近40%。2026年,算力租赁行业从「固定时长租赁」切换到「按Token调用量分成」模式。谷歌将2026年资本支出上调至1800 - 1900亿美元,亚马逊、微软同步加码,三家合计超4500亿美元用于建设2028年交付的数据中心。算力通胀导致算力稀缺性上升、AI应用层定价权向算力层转移、Token经济形成新利润分配机制。此通胀悖论可迁移到个人电费账单、带宽经济等场景,提醒普通用户关注AI功能收费变化,企业做好算力成本预算管控,投资者重新审视AI产业投资方向。