Intel Arc Pro B70、32GB VRAMでローカルAIを低コスト運用

Intel Arc Pro B70を4枚搭載したワークステーションでローカルAIを実行する様子。性能とコスト効率の比較データが示されている。

IT June 2026/06/19 17:22

ローカルAIのコストが数十円単位まで下がる中、この動きを追う同僚や技術チームと見たい文脈が少し見えてきます。

Intel Arc Pro B70、32GB VRAMでローカルAIを低コスト運用 記事の流れと主な事実

Intel Arc Pro B70は32GBのVRAMを搭載するプロ向けGPUで、複数枚構成により中規模言語モデルをローカルで実行できる性能を持つ。Puget Systemsが4枚搭載したワークステーションでベンチマークを実施し、Qwen3.6-27BやQwen3.6-35B-A3Bといった27B～35B級モデルをFP16のまま動かすことに成功した。一方、単体の処理速度はNVIDIA GeForce RTX 5090に比べて遅く、特に8B級モデルの推論速度は毎秒35～67トークンとやや低調。ただし、複数GPU構成により処理速度がほぼ2倍に向上し、同時ユーザー数の増加に伴ってトークン単価が大幅に低下する点が強み。電気代のみのコスト計算では、Qwen2.5 3Bモデルで100万出力トークンあたり0.43ドル（約69円）まで下がり、クラウドAIサービスと比べて数十倍安価になる。初期投資は約290万円と高額だが、運用が長期間にわたればコスト回収が可能とされる。画像生成タスクでも実用性が確認され、ComfyUI＋Z-Image Turboの組み合わせで1024×1024ピクセルの画像を平均3.9秒で生成した。

主な事実

Intel Arc Pro B70は1枚あたり32GBのVRAMを搭載し、4枚構成で合計128GBのVRAM環境を構築可能
Qwen3.6-27Bモデルを4枚構成でFP16のまま動作させ、1ユーザー時で毎秒13.1トークン、8ユーザー時で毎秒95.9トークンを記録
Qwen2.5 3Bモデルの100万出力トークンあたりの電気代は0.43ドル（約69円）で、クラウドAIのGemini 3.1 Proの3.8分の1のコスト
4枚構成のテストシステムは2026年6月時点で約290万円と高額だが、運用が長期間にわたればコスト回収が可能
ComfyUI＋Z-Image Turboによる1024×1024ピクセル画像生成で、平均3.9秒の生成時間を達成し、ピークVRAM使用量は19.3GB

Cantoのビジュアルニュース解説です。制作にはAIツールが補助的に使われることがあります。編集方針

主な事実

Ryzen AI 9 HX 470搭載ミニPCの実力

QwenがMTPで速くなる？実測結果

Intel Arc G3でAMDを逆転

128GBメモリ搭載AIミニPC発売

Radeon新GPU、価格下落で注目