Intel Arc Pro B70を4枚搭載したワークステーションでローカルAIを実行する様子。性能とコスト効率の比較データが示されている。
Intel Arc Pro B70を4枚搭載したワークステーションでローカルAIを実行する様子。性能とコスト効率の比較データが示されている。

ローカルAIのコストが数十円単位まで下がる中、この動きを追う同僚や技術チームと見たい文脈が少し見えてきます。

Intel Arc Pro B70、32GB VRAMでローカルAIを低コスト運用 記事の流れと主な事実

Intel Arc Pro B70は32GBのVRAMを搭載するプロ向けGPUで、複数枚構成により中規模言語モデルをローカルで実行できる性能を持つ。Puget Systemsが4枚搭載したワークステーションでベンチマークを実施し、Qwen3.6-27BやQwen3.6-35B-A3Bといった27B~35B級モデルをFP16のまま動かすことに成功した。一方、単体の処理速度はNVIDIA GeForce RTX 5090に比べて遅く、特に8B級モデルの推論速度は毎秒35~67トークンとやや低調。ただし、複数GPU構成により処理速度がほぼ2倍に向上し、同時ユーザー数の増加に伴ってトークン単価が大幅に低下する点が強み。電気代のみのコスト計算では、Qwen2.5 3Bモデルで100万出力トークンあたり0.43ドル(約69円)まで下がり、クラウドAIサービスと比べて数十倍安価になる。初期投資は約290万円と高額だが、運用が長期間にわたればコスト回収が可能とされる。画像生成タスクでも実用性が確認され、ComfyUI+Z-Image Turboの組み合わせで1024×1024ピクセルの画像を平均3.9秒で生成した。

主な事実

  • Intel Arc Pro B70は1枚あたり32GBのVRAMを搭載し、4枚構成で合計128GBのVRAM環境を構築可能
  • Qwen3.6-27Bモデルを4枚構成でFP16のまま動作させ、1ユーザー時で毎秒13.1トークン、8ユーザー時で毎秒95.9トークンを記録
  • Qwen2.5 3Bモデルの100万出力トークンあたりの電気代は0.43ドル(約69円)で、クラウドAIのGemini 3.1 Proの3.8分の1のコスト
  • 4枚構成のテストシステムは2026年6月時点で約290万円と高額だが、運用が長期間にわたればコスト回収が可能
  • ComfyUI+Z-Image Turboによる1024×1024ピクセル画像生成で、平均3.9秒の生成時間を達成し、ピークVRAM使用量は19.3GB

Cantoのビジュアルニュース解説です。制作にはAIツールが補助的に使われることがあります。 編集方針