谷歌推新AI模型，本地推理提速4倍

谷歌新AI模型DiffusionGemma示意图，展示从噪声中逐步生成清晰文本的过程

科学作者 June 2026年6月11日 22:38

这个新模型让本地AI运行更高效，关心端侧技术进展的同事看起来会更有脉络。

谷歌推新AI模型，本地推理提速4倍 事件脉络与关键事实

谷歌于2026年6月11日发布全新开源人工智能模型DiffusionGemma，采用文本扩散机制，突破传统自回归模型逐字生成的限制。该模型通过并行去噪方式一次性生成文本，在本地设备上实现最高每秒2000个文本单元的处理速度，较同类自回归模型提速约4倍，显著优化端侧AI推理效率。DiffusionGemma在代码生成与数学推理任务中表现亮眼，其中代码测试HumanEval得分达89.6%，AIME 2025数学测试得分为23.3%。模型已通过Apache 2.0协议开源，开发者可在Hugging Face平台下载权重用于二次开发。尽管在科学与高阶综合推理方面仍有提升空间，其架构已展现出对英伟达H100、DGX等硬件的高效适配能力。

事实

谷歌于2026年6月11日发布开源AI模型DiffusionGemma，基于文本扩散机制
该模型本地AI推理速度较传统自回归模型提升约4倍，单次生成耗时仅0.84秒
在AIME 2025数学测试中得分为23.3%，代码生成HumanEval得分为89.6%
模型支持在H100 GPU上每秒生成2000个文本单元，已在Hugging Face开源

Canto 的可视化新闻解读。制作过程可能有 AI 辅助。编辑政策

事实

谷歌Gemini Omni生成视频首曝

谷歌发布全能AI模型Gemini Omni

AI数学家上午出题，下午交证明

DeepSeek V4推理性能谁最强？

何恺明首秀语言模型：连续扩散新路线