DeepSeek API输入缓存降价只有首发价格的1/10

0 快科技 2026-04-26 23:48:15

摘要：

国产大模型DeepSeek官方宣布，全系API输入缓存命中价格下调至首发价的1/10，叠加限时优惠后，V4-Pro缓存输入低至0.025元/百万Tokens，创全球大模型价格新低。本次调价覆盖DeepSeek-V4-Pro、V4-Flash全系列，核心降幅集中在输入缓存命中场景。

DeepSeek-V4-Pro：从1元降至0.1元/百万Tokens，5月5日前叠加2.5折，实付0.025元。

DeepSeek-V4-Flash：从0.2元降至0.02元/百万Tokens，无额外折扣。

缓存未命中与输出价格同步下调：V4-Pro输入（未命中）3元、输出6元；V4-Flash输入（未命中）1元、输出2元，均为原价1/4。

此次降价直击行业痛点，缓存输入价仅为GPT-5.5 Pro的1/700，大幅降低企业长文本、高频调用场景成本。

对RAG知识库、智能客服、文档分析等缓存命中率高的应用，成本可降90%以上。

技术端，DeepSeek-V4采用自研稀疏注意力架构，支持160k超长上下文，长文本处理效率领先。目前已适配华为云、阿里云等8大云平台及多家智算中心。

业内认为，DeepSeek此举将重塑行业定价体系，加速AI应用普惠化，倒逼海外模型降价，巩固国产大模型成本优势。

最新资讯