このページの本文へ

GeFore RTX 50シリーズまとめ 第6回

RTX 4080 SUPERやRadeon RX 7900 XTXには勝てるのだけど……

GeForce RTX 5080、RTX 4090に下剋上ならず

2025年01月29日 23時00分更新

文● 加藤勝明(KTU) 編集●ジサトライッペイ/ASCII

  • お気に入り
  • 本文印刷

CGレンダリングでもRTX 4090には勝てず……

 CGレンダリング系のテストは、「Blender Benchmark」と「V-Ray Benchmark」で試してみよう。BlenderはRX 7900 XTXも比較に加えているが、V-Ray BenchmarkはRTXシリーズが必須であるため、RX 7900 XTXは除外している。

GeForce RTX 5080、RTX 4090に下剋上ならず

Blender Benchmark:「monster」「junkshop」「classsrom」のスコアー

GeForce RTX 5080、RTX 4090に下剋上ならず

V-Ray Benchmark:RTXのスコアー

 これらのテストでは、単純にGPUの回路規模が効いてくる。そのため、CUDAコア数で約1.5倍の規模となるRTX 4090にRTX 5080が勝てないのは自明である。

AIでも前世代と比べれば進化しているが……

 ここからはAI利用の性能に迫る。まずは、「UL Procyon」の「AI Text Generation Benchmark」を使用し、大規模言語モデル(LLM)を利用したAIのパフォーマンスを比較。大小4つの学習モデルを用い、それぞれに7つのテキスト生成タスクを課した。

 その際に出力されるトークン(単語)生成スピードと、最初のトークンまでの待ち時間からスコアーを導き出すというものである。どのGPUにおいても同じ学習モデル、同じAPI(ONNX)を利用している。

GeForce RTX 5080、RTX 4090に下剋上ならず

UL Procyon:AI Text Generation Benchmarkのスコアー。学習モデルの重さはPhi-3.5-mini-instructが最も軽く、LLama-2-13Bが最も重い

GeForce RTX 5080、RTX 4090に下剋上ならず

UL Procyon:AI Text Generation Benchmarkにおけるトークン生成スピード(OTS:Output Token Speed)。テストごとに平均値で集計している

GeForce RTX 5080、RTX 4090に下剋上ならず

UL Procyon:AI Text Generation Benchmarkにおける最初のトークンまでの時間(TTFT:Time to First Token)

 RTX 5090と比べるとRTX 5080が霞んでしまうことは避けられない。ここでもRTX 5080はRTX 4090を超えることができていない。最初のトークンまでの時間では、RTX 4080 SUPERを超えてRTX 4090に並んでいるものの、トークン生成スピードにおいては負けてしまった。ちなみに、RX 7900 XTXは生成スピードにおいても応答性においても、GeForce勢に及ばなかった。

 続いて、「LM Studio」で検証しよう。学習モデルは「Phi-4 14B Q8_0」を選択し、「消えた1ドルの謎」を解説させるべく、以下のプロンプトを入力した。シードは固定し、GPUオフロードは最大(GPUを最大限利用する)に設定。1度回答を得るたびにモデルをロードしなおし、3回の平均値で比較する。

 ある男性3人がホテルに泊まることになった。宿泊料は1人10ドル。男性客たちは合計30ドルを受付係に払った。しかし実際の宿泊料は3人で25ドルであったため、5ドルを返金しなければならないと気がついた。しかし受付係は「5ドルは3人で割り切れない」と考え、2ドルを自分のポケットにしまい残りの3ドルを客たちに返した。ここで男性客たちは1人9ドルで合計27ドル支払ったことになる。そこに受付係がポケットにしまった2ドルを足すと29ドルになり、最初に支払った30ドルにはならない。残りの1ドルはどこに消えたのか? 解説してください。
GeForce RTX 5080、RTX 4090に下剋上ならず

LM Studio:トークン生成スピード

GeForce RTX 5080、RTX 4090に下剋上ならず

LM Studio:最初のトークンまでの時間

 トークン生成スピードの平均値を見る限り、UL Procyon以上にRTX 4090の壁が高いことがわかる。VRAM 16GBでは、Phi-4の14Bパラメーターの学習モデルは手に余るようだ。ただし、VRAMが多くてもRX 7900 XTXのようにGPU的に処理が苦手な場合もあるので、16GBの割には良好と言える。とはいえ、RTX 4080 SUPERとの差があまりにも小さすぎるのが残念でならない。

カテゴリートップへ

この連載の記事

注目ニュース

ASCII倶楽部

ピックアップ

ASCII.jpメール アキバマガジン

ASCII.jp RSS2.0 配信中