このページの本文へ

前へ 1 2 3 4 次へ

最新パーツ性能チェック 第457回

“Battlemage”世代の尖兵「Arc B580」レビュー【前編】

インテル新GPU、Arc B580の実力は?AI&動画エンコードは前世代より超強力に

2024年12月12日 23時00分更新

文● 加藤勝明(KTU) 編集● ジサトラユージ/ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

AI処理においてもB580は強い

 ここからはUL Procyonを利用して、GPU上でさまざまなAI処理を実行させた時の性能を比較する。まずは“AI Computer Vision Benchmark”、すなわち物体認識や超解像といった映像系のAI処理におけるパフォーマンスを検証する。推論エンジンのAPIは(Procyonに実装されている中で)各GPUに適したものを選択した。ArcシリーズではOpenVINO、RTX 4060ではTensorRT、RX 7600ではWindows MLとなる。

UL Procyon:AI Computer Vision Benchmarkの総合スコアー

UL Procyon:AI Computer Vision Benchmarkで使用しているテストにおいて、GPUごとの推論回数を比較したもの(その1)

UL Procyon:AI Computer Vision Benchmarkで使用しているテストにおいて、GPUごとの推論回数を比較したもの(その2)

 テスト前はTensorRTが利用できるRTX 4060が最強かと考えていたが、総合スコアーではB580がRTX 4060に15%以上の差をつけてトップ。同じOpenVINOを利用するA750に対しては約57%上という驚くべきスコアー差を叩き出した。テスト別の推論回数を見ると、B580はどのテストにおいても満遍なくライバルに差を付けている。

 総合スコアーで3番手にとどまったA750はMobileNet V3をはじめとする前半3つのテストではRTX 4060に完敗しているが、後半のDeepLab V3のテストでは推論回数においてRTX 4060を大幅に上回っているのが興味深い。このあたりはOpenVINOを根気よく育て続けてきたインテルの努力の成果と言えるだろう。

 続いては画像生成……ではなくLLMを用いた文章生成能力を見る“AI Text Generation Benchmark”を試す。学習モデルは「Phi-3.5-mini-instruct」「Mistral-7B」「LLama-3.1-8B」「LLama-2-13B」の4つであり、それぞれに対し7種類の課題を出し、スコアー化する。今回は各学習モデルごとのスコアーのほかに1秒あたりのトークン生成数ならびに最初のトークン出力までの時間を比較する。APIはArcシリーズはOpenVINO、その他のGPUはONNXを利用した。

UL Procyon:AI Text Generation Benchmarkのスコアー

UL Procyon:AI Text Generation Benchmarkにおける1秒あたりの生成トークン数

UL Procyon:AI Text Generation Benchmarkにおける最初のトークン出力までの時間

 まず今回の検証環境では、RTX 4060とRX 7600は4つのテストすべてを完走することはできなかった。特にRX 7600は一番軽いPhi-3.5-mini-instructしか突破できず、Mistral-7Bではシステムごと固まる、あるいはドライバーが落ちるなど安定度にかなり疑問が残った。

 RTX 4060は最もパラメーター数の多いLLama-2-13Bの実行に失敗したが、正しく失敗して結果を出力することができた。RTX 4060/RX 7600の失敗はVRAM用量が少ないことが原因と考えられるが、同じVRAM 8GBのA750が完走していることを考えると、ONNX側にも失敗の原因がありそうだ。

 そしてArcシリーズに目を向けると、A750が強いテスト(Phi-3.5-mini-instructやLLama-3.1-8B)がある一方、パラメーター数の多いLLama-2-13BはB580が圧勝している。Xe2アーキテクチャーの優位性も原因の1つだろうが、B580のVRAMが12GBと余裕があることが最大の原因と考えられる。特にパラメーターが大きくなるほどトークン生成数が増える傾向にあるなど、VRAM搭載量の重要性が再確認できた形だ。

 ただ、RTX 4060はArcシリーズに完敗というわけではない。総合スコアーが低い理由は最初のトークンまでの時間がArcシリーズよりも長く、総合判断としてスコアーが低くなったという形だ。そう簡単にはAI分野のGeForceの強さは崩せない、ということだ。

ゲーム検証は後編にて

 以上で前編は終了だ。後編はゲーム11本を利用し、Arc B580の実ゲームにおけるパフォーマンスと、ワット当たりのパフォーマンスの両面から評価していく予定だ。

■関連サイト

前へ 1 2 3 4 次へ

カテゴリートップへ

この連載の記事

注目ニュース

ASCII倶楽部

ピックアップ

ASCII.jpメール アキバマガジン

ASCII.jp RSS2.0 配信中