
这个新模型让本地AI运行更高效,关心端侧技术进展的同事看起来会更有脉络。

谷歌推新AI模型,本地推理提速4倍 事件脉络与关键事实
谷歌于2026年6月11日发布全新开源人工智能模型DiffusionGemma,采用文本扩散机制,突破传统自回归模型逐字生成的限制。该模型通过并行去噪方式一次性生成文本,在本地设备上实现最高每秒2000个文本单元的处理速度,较同类自回归模型提速约4倍,显著优化端侧AI推理效率。DiffusionGemma在代码生成与数学推理任务中表现亮眼,其中代码测试HumanEval得分达89.6%,AIME 2025数学测试得分为23.3%。模型已通过Apache 2.0协议开源,开发者可在Hugging Face平台下载权重用于二次开发。尽管在科学与高阶综合推理方面仍有提升空间,其架构已展现出对英伟达H100、DGX等硬件的高效适配能力。
事实
- 谷歌于2026年6月11日发布开源AI模型DiffusionGemma,基于文本扩散机制
- 该模型本地AI推理速度较传统自回归模型提升约4倍,单次生成耗时仅0.84秒
- 在AIME 2025数学测试中得分为23.3%,代码生成HumanEval得分为89.6%
- 模型支持在H100 GPU上每秒生成2000个文本单元,已在Hugging Face开源
Canto 的可视化新闻解读。制作过程可能有 AI 辅助。 编辑政策





