DeepSeek V4 开源:MoE 架构,激活参数仅 21B,性能直逼 GPT-4o
总参数 671B、激活参数 21B,HumanEval 91.3、MATH 84.7,单卡 H800 可推理,已上传 HuggingFace。
2026-05-25
约 1 分钟阅读
#AI#DeepSeek#开源
DeepSeek 团队开源 V4 模型,继续走 MoE 路线。
- 总参数 671B、激活 21B,单卡 H800 即可推理
- HumanEval 91.3、MATH 84.7、MMLU 88.2
- Apache 2.0 协议,商用免费
权重已上传 HuggingFace。
阅读原文
机器之心
https://www.jiqizhixin.com/