谷歌新AI模型DiffusionGemma示意图,展示从噪声中逐步生成清晰文本的过程
谷歌新AI模型DiffusionGemma示意图,展示从噪声中逐步生成清晰文本的过程

这个新模型让本地AI运行更高效,关心端侧技术进展的同事看起来会更有脉络。

谷歌推新AI模型,本地推理提速4倍 事件脉络与关键事实

谷歌于2026年6月11日发布全新开源人工智能模型DiffusionGemma,采用文本扩散机制,突破传统自回归模型逐字生成的限制。该模型通过并行去噪方式一次性生成文本,在本地设备上实现最高每秒2000个文本单元的处理速度,较同类自回归模型提速约4倍,显著优化端侧AI推理效率。DiffusionGemma在代码生成与数学推理任务中表现亮眼,其中代码测试HumanEval得分达89.6%,AIME 2025数学测试得分为23.3%。模型已通过Apache 2.0协议开源,开发者可在Hugging Face平台下载权重用于二次开发。尽管在科学与高阶综合推理方面仍有提升空间,其架构已展现出对英伟达H100、DGX等硬件的高效适配能力。

事实

  • 谷歌于2026年6月11日发布开源AI模型DiffusionGemma,基于文本扩散机制
  • 该模型本地AI推理速度较传统自回归模型提升约4倍,单次生成耗时仅0.84秒
  • 在AIME 2025数学测试中得分为23.3%,代码生成HumanEval得分为89.6%
  • 模型支持在H100 GPU上每秒生成2000个文本单元,已在Hugging Face开源

Canto 的可视化新闻解读。制作过程可能有 AI 辅助。 编辑政策