AI 公司巨亏,你却用得越来越便宜 你大概也注意到一个挺拧巴的事。一边新闻天天说 AI 公司在疯狂烧钱、巨额亏损——做 ChatGPT 的 OpenAI据估算一年要亏一百多亿美元马斯克的 xAI 更夸张传出来的数字是每赚一块钱、要倒贴大概二十六块。整个行业今年在 AI 基础设施上砸的钱估算有六千多亿美元。另一边你自己用 AI 的体感却是越来越便宜甚至越来越多免费。国产的 DeepSeek 前阵子又永久降价把同等能力的价格打到了对手的几十分之一。拉长看达到同一个水平的 AI每年价格大概降十倍。更怪的还在后头2026 年上半年AI 这行其实还在同时涨价——内存HBM半年涨了五倍多、高端显卡抢不到货好几家云厂商的 API 价格往上调有的涨幅夸张到四倍多。烧钱、涨价、白菜价。三件方向完全相反的事在同一个行业、同一段时间里同时发生。这到底怎么回事钱到底是怎么算的我把这事从头捋了一遍发现关键就一句话——这压根不是一笔账是三笔账各走各的。把这三笔账拆开你就看懂了 2026 年 AI 行业几乎所有的拧巴。第一笔账训练烧的是赌明天的钱AI 公司烧的那些天文数字绝大部分不是花在「伺候你这次提问」上是花在训练下一代模型 抢算力上。这是一场军备竞赛。谁的模型强一档谁就可能赢家通吃所以谁也不敢停——拼命买显卡、建数据中心、囤算力赌的是一个还没到来的未来。这笔钱有多吓人据估算光是几家最大的云巨头今年在 AI 基础设施上的预算就有四千多亿美元。而且越往后越烧有泄露出来的内部预测说OpenAI 的年亏损会从今年的一百多亿一路涨到几年后的四百多亿。更要命的是这笔账没法对冲。Anthropic 的 CEO 自己说过一句很实在的话大意买算力这件事世上没有任何对冲手段——买多了万一需求没跟上能把公司拖垮买少了又会在竞争里掉队。所以第一笔账的特点是赌未来越赌越烧。它跟你这次用 AI 花了几分钱几乎没关系。第二笔账硬件涨价的是卖铲子的第二笔账解释了为什么 2026 还在「涨价」。淘金热里最稳赚的从来是卖铲子的。AI 这波铲子就是显卡和内存。需求太猛供给跟不上——高端 GPU 长期抢不到那个专门给 AI 用的高带宽内存HBM据报道半年价格涨了五倍多。卖铲子的做芯片、做内存的赚翻了而买铲子的云厂商、模型公司成本被狠狠抬高。于是你会看到好几家云厂商把 AI 相关的服务往上调价有的涨幅到了四倍多国内也有大模型厂商一年之内连着涨了三次价。注意这一层的涨价涨的是算力和硬件的价不是终端模型调用的价。这两层方向正好拧着。第三笔账推理白菜价是真本事现在到了最关键、也最反直觉的一笔——你天天感受到的「越来越便宜」到底怎么来的。先分清一个事AI 的成本九成以上其实不在训练在推理——也就是你每发一次问、它每答一次要花的那些实打实的算力开销。训练是一次性的推理是每次调用都要花的跑一辈子。而推理这一层的单次成本这两年是结构性地往下掉的。靠两样东西。第一样是工程。这两年业界把「怎么让模型答得又快又省」卷出花了我尽量用人话说这几招MoE混合专家模型很大但每次回答只激活其中一小部分「专家」不用整个大脑全开省算力。稀疏注意力不让模型对每个字都死磕只盯重要的省下大量计算。量化把模型里的数字精度降一降比如从高精度压到低精度内存少一半、速度更快质量几乎不掉。KV 缓存压缩把对话里反复要用的中间结果压小省显存——这块去年到今年进步特别大。推测解码用一个小快模型先「抢答」几个字大模型一次性批量核对省掉一个一个憋字的功夫。这些招叠起来单次推理成本能砍掉六到八成。国产的 DeepSeek 是个典型——据报道它新一代模型在超长上下文下算力开销只要上一代的两三成、缓存只要一成靠的就是自研的一套注意力架构顺带也用上了国产算力。第二样是竞争。开源模型这一年集体逼近了第一梯队——好几个开源模型家族在发布后几个月内就摸到了接近顶级闭源模型的水平价格却便宜十倍以上。这就给所有人的报价压了一个硬顶你卖太贵客户干脆自己跑个开源的。DeepSeek 带头把价格打到全球新低小米这些也跟着压价格战就这么烧起来了。工程把成本压下来竞争把利润挤出去。两头一夹推理价格就成了白菜价。但有两件事你得想明白讲到这「三笔账」的拧巴就解开了烧钱烧在训练、涨价涨在硬件、白菜价降在推理。三层各走各的一点都不矛盾。但白菜价这件事还藏着两件反直觉的事不说清楚你会被带偏。第一你享受的便宜是「昨天的智能」在打折。价格暴跌的是「达到某个固定水平」的能力。去年的顶级模型今年变成了便宜货——这部分确实每年降十倍。但「当前最强的那一档」价格一直很坚挺。研究机构的数据也印证固定能力的价格每年能降几十倍可前沿模型几乎不降。而且现在最强的那批「会思考」的推理模型答一个问题前要先在心里「想」一大通这些思考也是要烧 token 的。所以哪怕单价在降你真用最强的模型干活账单不一定少。便宜的永远是昨天的前沿今天的前沿永远贵。这是这门生意的铁律。第二越便宜大家反而花得越多。这就是经济学里有名的「杰文斯悖论」——东西越便宜用得越凶总开销不降反升。AI 这儿体现得淋漓尽致。单 token 是便宜了但现在的 agent 干个活动不动调用模型几十上百次长上下文、反复自我检查都是成倍地吃 token。结果就是据报道Uber 四个月就烧光了全年的 AI 预算——因为内部用 Claude Code 写代码的人从三成飙到八成多每个工程师一个月的 API 账单冲到几百上千美元。所以「白菜价」没让任何人真省到钱它只是把整个盘子做得更大了。这也正是模型公司那个怪现象的根源——客户越多亏得越狠每多一个用户、每多一次调用它都得垫上实打实的算力成本。那这对你意味着什么把三笔账和这两件事摞一块落到实处如果你是用 AI 的人别一上来就用最贵最强的。分清档位——要顶尖推理的活用前沿模型大量重复、简单的活用便宜档连谷歌的 CEO 都在劝大客户多用便宜的 Flash 档说能省下十亿美元级的钱。还有别按「每 token 多少钱」算账要按「干成一件事总共花多少」算——前者在降后者可能在涨。如果你关心这行往哪走盯两个东西。一是谁烧得起——同样在亏有的公司选择不自己建数据中心、而是租算力把烧钱比例压得低有的背着一大堆免费用户烧钱比例下不来。资本轻的活下去的概率更大。二是价格的地板在哪——只要开源模型能逼近前沿价格的底就是「你自己跑一个开源等价模型要花多少」而这个底每年还在往下掉三到五成。换句话说靠卖「通用模型调用」赚大钱会越来越难。还有一个容易被忽略的红利推理白菜价的意义其实不在帮你省钱是解锁了以前做不起的东西。以前一个任务调模型上百次、喂几十万字上下文、让它反复自检——这些想都不敢想因为烧不起。现在做得起了。机会就在这些「过去太贵、现在突然可行」的应用里。最后所以别再纠结「AI 到底是在烧钱还是白菜价」了——它同时是。烧的是赌明天的钱涨的是中间卖铲子的价降的是卖给你今天的价。三笔账各走各的方向。看懂这三笔账2026 年 AI 行业那些看着拧巴的事全都顺了为什么巨亏还要拼命降价推理账上不降价就抢不到客户为什么降价了还是活不下去训练账上烧得更凶以及——为什么这场淘金热里最稳赚的可能不是挖金子的做模型的而是卖铲子的做芯片和算力的。便宜的是昨天烧钱的是明天。你我享受着昨天打折的智能而这些公司在赌一个还没到来的明天。