
生成速度が最大4倍になるこの技術で、ローカルでのAI利用を進める同僚と見たい文脈が少し見えてきます。

Google、最大4倍高速なLLMを無償公開 記事の流れと主な事実
Googleは2026年6月10日、テキスト生成速度を最大4倍高速化できる実験段階のマルチモーダル言語モデル「DiffusionGemma」を発表しました。このモデルはApache 2.0ライセンスでHugging Faceを通じて無償公開されており、誰でもモデル重みをダウンロードして利用できます。DiffusionGemmaは260億の総パラメータ数を持つエキスパート混合モデル(MoE)で、40億のパラメータをアクティブに使用します。
主な事実
- Googleは2026年6月10日に「DiffusionGemma」を発表した
- DiffusionGemmaは最大4倍のテキスト生成速度を実現する実験段階のLLM
- モデルはApache 2.0ライセンスでHugging Faceで無償公開されている
- 総パラメータ数は260億、アクティブパラメータ数は40億のMoEモデル
- NVIDIA H100では1,000トークン/秒以上、RTX 5090では700トークン/秒以上の生成速度
- 生成品質はGemma 4より低く、速度重視の設計となっている
Cantoのビジュアルニュース解説です。制作にはAIツールが補助的に使われることがあります。 編集方針
