DeepSeek API输入缓存降价 只有首发价格的1/10
国产大模型DeepSeek官方宣布,全系API输入缓存命中价格下调至首发价的1/10,叠加限时优惠后,V4-Pro缓存输入低至0.025元/百万Tokens,创全球大模型价格新低。本次调价覆盖DeepSeek-V4-Pro、V4-Flash全系列,核心降幅集中在输入缓存命中场景。
DeepSeek-V4-Pro:从1元降至0.1元/百万Tokens,5月5日前叠加2.5折,实付0.025元。
DeepSeek-V4-Flash:从0.2元降至0.02元/百万Tokens,无额外折扣。
缓存未命中与输出价格同步下调:V4-Pro输入(未命中)3元、输出6元;V4-Flash输入(未命中)1元、输出2元,均为原价1/4。
此次降价直击行业痛点,缓存输入价仅为GPT-5.5 Pro的1/700,大幅降低企业长文本、高频调用场景成本。
对RAG知识库、智能客服、文档分析等缓存命中率高的应用,成本可降90%以上。

技术端,DeepSeek-V4采用自研稀疏注意力架构,支持160k超长上下文,长文本处理效率领先。目前已适配华为云、阿里云等8大云平台及多家智算中心。
业内认为,DeepSeek此举将重塑行业定价体系,加速AI应用普惠化,倒逼海外模型降价,巩固国产大模型成本优势。


