Google、最大4倍高速なLLMを無償公開

Googleが公開した高速LLM「DiffusionGemma」のロゴと、従来モデルとの速度比較を示すグラフ

IT June 2026/06/11 18:32

生成速度が最大4倍になるこの技術で、ローカルでのAI利用を進める同僚と見たい文脈が少し見えてきます。

Google、最大4倍高速なLLMを無償公開 記事の流れと主な事実

Googleは2026年6月10日、テキスト生成速度を最大4倍高速化できる実験段階のマルチモーダル言語モデル「DiffusionGemma」を発表しました。このモデルはApache 2.0ライセンスでHugging Faceを通じて無償公開されており、誰でもモデル重みをダウンロードして利用できます。DiffusionGemmaは260億の総パラメータ数を持つエキスパート混合モデル（MoE）で、40億のパラメータをアクティブに使用します。

主な事実

Googleは2026年6月10日に「DiffusionGemma」を発表した
DiffusionGemmaは最大4倍のテキスト生成速度を実現する実験段階のLLM
モデルはApache 2.0ライセンスでHugging Faceで無償公開されている
総パラメータ数は260億、アクティブパラメータ数は40億のMoEモデル
NVIDIA H100では1,000トークン/秒以上、RTX 5090では700トークン/秒以上の生成速度
生成品質はGemma 4より低く、速度重視の設計となっている

Cantoのビジュアルニュース解説です。制作にはAIツールが補助的に使われることがあります。編集方針