
这次国产AI平台在大模型支持上的进步,也给关注技术生态发展的同行一个可以一起看的背景。

DeepSeek V4推理性能谁最强? 事件脉络与关键事实
2026年6月,开源大模型DeepSeek V4发布,引发全球AI硬件与软件生态的推理性能比拼。SemiAnalysis发布深度分析,对比NVIDIA、华为昇腾和AMD三大平台对V4的适配效率与推理表现。NVIDIA凭借CUDA生态和vLLM、SGLang框架,实现Day0全栈支持,搭配GB200/300最新硬件,推理成本低且性能稳定,延续其在AI训练与推理领域的领先地位。华为昇腾950DT搭配CANN框架同样实现Day0支持,标志着国产AI平台在软件优化和硬件协同方面取得重大突破,成为首个能与CUDA生态比肩的本土方案。尽管当前昇腾硬件算力仍落后于NVIDIA旗舰产品,但全栈自主能力已获验证。AMD方面,尽管MI355X显卡初期仅支持FP8、性能不佳,但其ROCm生态下的SGLang团队在26天内实现100倍推理性能提升,展现强大追赶潜力。分析指出,生态完善度仍是AMD和国产平台的关键短板,但快速迭代能力为市场格局变化提供可能。
事实
- 2026年6月10日,DeepSeek V4发布,成为检验各大AI生态圈支持能力的关键节点。
- NVIDIA CUDA生态搭配vLLM及SGLang框架,实现Day0全栈支持,GB200/300硬件开箱即用。
- 华为昇腾950DT+CANN框架同样实现Day0支持,为国产AI平台首次达到NVIDIA同等支持水平。
- AMD MI355X显卡初期性能不佳,但SGLang团队在26天内实现100倍推理性能提升。
- SemiAnalysis分析指出,NVIDIA生态最稳定,华为展现全栈能力,AMD生态进步空间大但尚未完善。
Canto 的可视化新闻解读。制作过程可能有 AI 辅助。 编辑政策





