Google、1GB未満メモリでGemma 4を動作

Googleがリリースした低メモリ対応のAIモデルGemma 4のロゴと、スマートフォンやエッジデバイスで動作する様子を描いたイメージ

IT June 2026/06/09 0:31

Gemma 4が1GB未満のメモリで動作可能になり、エッジAIの実用化が近づきました。この進展を追う技術関係者や開発者と見たい文脈が少し見えてきます。

Google、1GB未満メモリでGemma 4を動作 記事の流れと主な事実

Google DeepMindは2026年6月5日、低リソース環境でも高品質な動作を実現する大規模言語モデル『Gemma 4』のQAT（Quantization-Aware Training）最適化チェックポイントを無償公開しました。この技術により、モデルのトレーニング段階で量子化をシミュレートし統合するため、性能低下を抑えつつメモリ要件を大幅に削減できます。特に『Gemma 4 E2B』は1GB未満のメモリ消費で動作可能とされ、エッジデバイスやコンシューマ向けGPU、モバイルプロセッサでのローカルAI実行が現実味を帯びてきました。

一般的な後量子化（PTQ）とは異なり、QATはトレーニング中に量子化を組み込むことで精度を維持。GoogleはQ4_0フォーマットに適用し、広く利用可能な形で提供しています。また、モバイル環境向けには独自の量子化スキームを導入。静的アクティベーションの事前計算やチャネルごとの量子化、2bit圧縮、語彙リストやKVキャッシュの最適化を組み合わせて効率を高めています。

この技術革新により、個人端末でのプライバシー保護型AI処理や、ネット接続が不安定な環境でのローカルAI利用が進むと期待されます。今後の展開として、音声や画像処理を統合したマルチモーダルモデルへの拡張が注目されます。