近日◈◈✿◈,小米公司旗下大模型MiMo-V2.5宣布调价◈◈✿◈,相比原始API定价◈◈✿◈,新定价最高降幅可达99%◈◈✿◈,其词元套餐加量不加价◈◈✿◈,用量提升至原来的5到8倍◈◈✿◈。经历一季度词元“涨价潮”◈◈✿◈,小米成为少数在价格上跟进DeepSeek调降的大模型厂商尊龙凯时 - 人生就是搏◈◈✿◈。
随着AI智能体应用的不断推广◈◈✿◈,词元消耗量将保持高速增长◈◈✿◈。短期内算力紧张难以缓解◈◈✿◈,降价主要来自软件层面的技术进步和算法优化◈◈✿◈。长期来看◈◈✿◈,词元将成为和手机流量一样的基础供应◈◈✿◈。
在本轮小米降价之前◈◈✿◈,DeepSeek以其开源和普惠成为大模型中独一档的存在◈◈✿◈。自发布以来◈◈✿◈,DeepSeek模型多次调价◈◈✿◈,先是从4月26日开始将输入缓存命中的价格降至首发价格的1/10◈◈✿◈,后是5月份推出DeepSeek-v4-pro的2.5折优惠活动◈◈✿◈;近日◈◈✿◈,又宣布将这项原本限时的优惠活动常态化◈◈✿◈。
截至5月28日◈◈✿◈,DeepSeek-v4-flash缓存命中和缓存未命中的百万词元输入价分别为0.02元和1元◈◈✿◈,百万词元输出价格为2元◈◈✿◈;DeepSeek-v4-pro的缓存命中和缓存未命中的百万词元输入价为0.025元和3元◈◈✿◈,百万词元输出价为6元◈◈✿◈。
记者5月份体验发现◈◈✿◈,在DeepSeek-v4-pro月消耗4.75亿词元◈◈✿◈、DeepSeek-v4-flash月消耗24.33亿词元的情况下◈◈✿◈,累计消费约为375元◈◈✿◈。相比之下◈◈✿◈,多款国产大模型每月299元套餐仅包含3.2亿词元◈◈✿◈。
不过◈◈✿◈,两家企业官方宣传资料显示◈◈✿◈,与DeepSeek-v4两款纯文本大模型不同◈◈✿◈,MiMo-V2.5还支持图像◈◈✿◈、视频◈◈✿◈、语音处理◈◈✿◈,这意味着它除了输出文字和代码◈◈✿◈,还能读图◈◈✿◈、听音川村亚纪◈◈✿◈、看视频◈◈✿◈,综合能力更为全面◈◈✿◈。
因此◈◈✿◈,小米大模型降价消息一出◈◈✿◈,吸引不少开发者抢先体验◈◈✿◈,其开放平台一度难以登录◈◈✿◈。记者连续两日体验发现◈◈✿◈,MiMo-V2.5的API响应速度会间歇性出现明显放慢甚至断联尊龙凯时 - 人生就是搏◈◈✿◈。
记者查询其他国产旗舰大模型价格文档发现◈◈✿◈,目前DeepSeek和MiMo的价格只有其他模型的几分之一甚至几十分之一◈◈✿◈,价格差距显著◈◈✿◈。
仅在一个月以前尊龙凯时 - 人生就是搏◈◈✿◈,不少国产大模型还因词元消耗量骤增◈◈✿◈、成本增长过快◈◈✿◈,接连取消优惠套餐或者涨价◈◈✿◈。如今◈◈✿◈,词元降价潮信号初显◈◈✿◈。
随着词元价格分化◈◈✿◈,大模型定价进入博弈区间◈◈✿◈,对于供需两端都会带来巨大影响川村亚纪◈◈✿◈。从供给端看◈◈✿◈,算力紧张短期内难以有效缓解◈◈✿◈,大模型公司的硬件投入仍将持续增加◈◈✿◈。但从需求端看川村亚纪◈◈✿◈,尽管大模型和智能体的进步带来明显的效率提升◈◈✿◈,但快速增长的词元成本也让用户不得不审视投入产出比◈◈✿◈。
多位资深业内人士告诉记者◈◈✿◈,2026年国内头部互联网企业的GPU采购预算都以千亿元计算◈◈✿◈,后续还会增长◈◈✿◈。包括DeepSeek◈◈✿◈、Kimi◈◈✿◈、阶跃星辰等大模型企业的融资金额屡创新高◈◈✿◈,主要也是为了满足持续快速增长的算力需求◈◈✿◈。
算力成本的上涨◈◈✿◈,让大模型企业涨价冲动明显◈◈✿◈。截至发稿时◈◈✿◈,阿里云按请求次数计价的CodingPlan◈◈✿◈,每天9点30开售即迅速售罄◈◈✿◈;作为替代方案◈◈✿◈,成本相对更高◈◈✿◈、词元限量的TokenPlan尚能稳定供应尊龙凯时 - 人生就是搏◈◈✿◈。同时◈◈✿◈,腾讯云的CodingPlan则“已售罄”◈◈✿◈,仅TokenPlan可正常购买◈◈✿◈。
“这反映出外部需求正呈现爆发式增长◈◈✿◈。此轮调整基本围绕需求侧变化展开◈◈✿◈,全球头部大模型及云计算厂商◈◈✿◈,尤其是具备底座能力的企业◈◈✿◈,都在进行相应调整◈◈✿◈。”腾讯相关负责人向记者表示◈◈✿◈,一是大模型应用正向产业端持续延伸◈◈✿◈,直接带动了使用量的攀升◈◈✿◈;二是智能体(Agent)与对话机器人(Chatbot)形态存在本质差异◈◈✿◈,使得词元消耗呈指数级增长◈◈✿◈。大模型厂商销售模式的调整◈◈✿◈,也会逐步传导至云厂商及终端客户层面◈◈✿◈。
由于算力紧张◈◈✿◈,原本免费的AI应用开始收费◈◈✿◈,原本收费的套餐则开始涨价尊龙凯时 - 人生就是搏◈◈✿◈。前不久◈◈✿◈,字节跳动旗下的豆包App针对进阶功能推出订阅计划◈◈✿◈,引发市场关注◈◈✿◈。另一款大模型Kimi早在2025年9月就推出了订阅计划◈◈✿◈。
从需求端看◈◈✿◈,持续增加的词元用量叠加一路涨价◈◈✿◈,使得不少用户已经越来越难以承受◈◈✿◈。近日◈◈✿◈,网约车公司Uber高管公开表示◈◈✿◈,由于词元开支远超预期◈◈✿◈,该公司5000名工程师4个月便花光了全年在AI方面的预算◈◈✿◈。
目前词元成本已经成为团队的主要开支◈◈✿◈。一位从事AI影视的创作者告诉记者◈◈✿◈,他平时和团队开玩笑说◈◈✿◈,务必要多用脑◈◈✿◈,因为这样不消耗词元◈◈✿◈,而且可以提升AI使用效率◈◈✿◈。
市场咨询公司IDC预计◈◈✿◈,2026年中国MaaS(大模型即服务)市场的词元消耗量将达到40000万亿◈◈✿◈,较2025年进一步增长约20倍◈◈✿◈。2024年至2030年的年复合增长率约为1154.9%◈◈✿◈。这一加速增长的主要驱动因素◈◈✿◈,是多模态大模型的逐步成熟以及智能体类应用的规模化落地◈◈✿◈。市场正在从“文本生成”向“多模态理解与自动执行”扩展◈◈✿◈,每一次交互所消耗的词元量级也相应大幅提升◈◈✿◈。
对此◈◈✿◈,IDC中国研究总监卢言霞认为◈◈✿◈,正如工业时代的企业必须预算电力成本◈◈✿◈,AI时代的企业必须学会预算词元成本◈◈✿◈。未来3年内◈◈✿◈,是否具备“词元精细化管理能力”◈◈✿◈,将成为企业AI成熟度的重要分水岭◈◈✿◈。
记者采访多位业内人士了解到◈◈✿◈,作为人工智能的燃料◈◈✿◈,词元价格从源头决定了人工智能的应用深度和广度◈◈✿◈。词元价格的下探幅度◈◈✿◈,取决于算力成本◈◈✿◈、技术优化水平和大模型公司的商业策略◈◈✿◈。
算力成本从源头决定着词元价格◈◈✿◈。对于DeepSeek在5月份的降价常态化◈◈✿◈,多位业内人士告诉记者◈◈✿◈,这一方面与DeepSeek新一轮融资有关◈◈✿◈,另一方面可能与华为昇腾芯片研发符合预期甚至超出预期有关◈◈✿◈。此前◈◈✿◈,DeepSeek官方表示◈◈✿◈,受限于高端算力◈◈✿◈,目前Pro的服务吞吐量十分有限◈◈✿◈,预计下半年昇腾950超节点批量上市后◈◈✿◈,Pro的价格会大幅下调◈◈✿◈。
同时◈◈✿◈,全球算力市场定价在趋于透明和有序◈◈✿◈。“GPU正在变成一种金融资产”尊龙凯时 - 人生就是搏◈◈✿◈,市场分析机构AI超维度分析师告诉记者◈◈✿◈,通过采集分析全球GPU算力市场实时数据发现◈◈✿◈,截至5月13日◈◈✿◈,同一块H100芯片最低报1.47美元/小时川村亚纪◈◈✿◈,最高报3.07美元/小时◈◈✿◈,相差超过一倍◈◈✿◈。所以◈◈✿◈,市场需要的不是更多供应商◈◈✿◈,而是好的价格发现机制◈◈✿◈。
对此◈◈✿◈,AI超维度分析师认为◈◈✿◈,中国的算力更偏向于公共资源定位◈◈✿◈,短期内不太可能出现同样的期货产品◈◈✿◈,但中国AI公司面对的算力焦虑是一样的——供给紧张◈◈✿◈、价格不透明川村亚纪◈◈✿◈、长期成本难以预测◈◈✿◈。当算力有了公开的价格曲线◈◈✿◈,AI产业会多了一个新的参照维度◈◈✿◈,有利于行业健康可持续发展◈◈✿◈。
此外◈◈✿◈,DeepSeek和小米的低价策略正搅动市场◈◈✿◈,或将引发行业变局◈◈✿◈。研究机构FundAI评测发现◈◈✿◈,成本是DeepSeek-v4最值得关注的变量之一◈◈✿◈。从单任务成本来看◈◈✿◈,Flash约0.007美元◈◈✿◈,FlashThinking约0.008美元◈◈✿◈,Pro约0.10美元◈◈✿◈,ProThinking约0.15美元◈◈✿◈。按此数据◈◈✿◈,在不考虑前期投入的情况下◈◈✿◈,DeepSeek每次调用服务都有一定毛利空间◈◈✿◈。
对于本次大幅降价的背后动力◈◈✿◈,小米公司表示◈◈✿◈,是小米技术团队在推理系统上的持续优化◈◈✿◈,显著提升了缓存命中率和推理效率◈◈✿◈,在保障服务质量的前提下持续降低单位词元服务成本◈◈✿◈。
业内人士认为◈◈✿◈,尽管词元需求持续增加◈◈✿◈,但是在用户的总预算相对稳定甚至有所削减前提下尊龙凯时 - 人生就是搏◈◈✿◈,大模型企业必须综合考虑成本覆盖和市场份额◈◈✿◈,以确保行业的健康有序发展◈◈✿◈。尊龙凯时人生就是搏·官方(中国)◈◈✿◈,凯时◈◈✿◈!尊龙凯时人生就是博·(中国)官网◈◈✿◈,凯时平台◈◈✿◈,尊龙APP◈◈✿◈,

