是夯爆了还是拉完了？Deepseek V4第一波测评来了（附排行榜）

DeepSeek V4 预览版开源上线后，第一波来自第三方榜单的测评结果已经出炉。多家测评显示，DeepSeek V4性能尤其在代码任务上冲进开源第一梯队，同时以“百万级上下文+低价”把开发者侧的使用门槛进一步压低

从第三方评测来看，评测平台 Arena.ai 在 X 上将V4 Pro（思考模式）定性为"相较DeepSeek V3.2的重大飞跃"，在其代码竞技场中列开源模型第3位、综合第14位；另一家测评方 Vals AI 则称，V4在其Vibe Code Benchmark中以"压倒性优势"拿下开源权重模型榜首，击败Gemini 3.1 Pro等闭源模型，较上代V3.2实现约10倍性能跃升

定价层面，V4-Flash输出价格为每百万token 0.28美元，较Claude Opus 4.7低逾99%；V4-Pro输出价格为3.48美元，是同级别前沿模型中定价最低的选项之一。对比表格显示，Flash 处于小模型区间最低档，Pro 也处于“大模型前沿”区间低位。围绕实际体验的讨论开始分化

多位网友在 X 上称其性价比“打穿”，而DeepSeek在自述材料中则保持克制，称在知识与推理上接近闭源系统但仍有约3到6个月差距，同时提示“受限于高端算力”，Pro 服务吞吐有限，后续价格存在下调预期