「Blender Benchmark」(4.5)による性能チェック
「AMD Ryzen Threadripper 9000」シリーズの性能を探るため、実際にさまざまなベンチマークを実行した結果を紹介しよう。まずは、「Blender Benchmark」(4.5)は、3D CGレンダリングにおける性能をチェックできるベンチマークだ。ここでは、「AMD Ryzen Threadripper 9980X」「AMD Ryzen Threadripper 9970X」の性能を計測した。その結果が下の表で、どちらも高い数値を叩き出していることが分かる。
| Blender Benchmark 4.5(単位:スコア) | ||
|---|---|---|
| ― | AMD Ryzen Threadripper 9980X | AMD Ryzen Threadripper 9970X |
| monster | 899.96 | 527.82 |
| junkshop | 638.57 | 373.59 |
| classroom | 474.29 | 280.8 |
「SPECworkstation 4.0」でプロ向けワーステーション用性能を確認
「SPECworkstation 4.0」は、プロ向けワーステーションで実行する処理を通じて性能を数値化しようというもの。23個あるテストのうち、ここではCPU性能の比較に使えるテスト結果を抜粋して紹介する。
ひとつ目は、Autodesk Inventorを利用したテストだ。ファイルを開く・作成する、リビルドやレンダリングするといった作業ごとに要した時間の比較となる。単位はms(ミリ秒)で、数値が小さいほど性能が高いことを示す。
| 「SPECworkstation 4.0」Autodesk Inventor処理時間(単位:ms) | ||
|---|---|---|
| ― | AMD Ryzen Threadripper 9980X | AMD Ryzen Threadripper 9970X |
| Open Document | 5831 | 5972 |
| Create/Update Files | 5814 | 5694 |
| Rebuild | 10072 | 10446 |
| Render Style/Material | 896 | 920 |
2つ目は、マルチスレッドに分類されるテストとなっているData Scienceの結果だ。Pythonを利用したライブラリー(Pandas/Scikit-learn/XGBoost)を利用し、AIや機械学習におけるワークフローの処理時間を比較するテストである。こちらも単位はms(ミリ秒)で、数値が小さいほど性能が高い。
| 「SPECworkstation 4.0」Data Science処理時間(単位:ms) | ||
|---|---|---|
| ― | AMD Ryzen Threadripper 9980X | AMD Ryzen Threadripper 9970X |
| Pandas | 109.83 | 111.62 |
| Scikit-learn | 93.2 | 126.44 |
| XGBoost | 44.83 | 45.44 |
3つ目のLuxCoreRenderは、3D CGのレンダリングをCPUで実行するテストだ。4種類のシーンにおけるレンダリング性能を数値化しており、数値が大きいほど性能が高い。
| 「SPECworkstation 4.0」LuxCoreRender処理時間(単位:Msamples/sec) | ||
|---|---|---|
| ― | AMD Ryzen Threadripper 9980X | AMD Ryzen Threadripper 9970X |
| DLSC | 17.19 | 11.72 |
| Food | 14.13 | 8.39 |
| Danish Mood | 11.25 | 8.45 |
| Procedual Leaves | 7.95 | 5.24 |
4つ目は、PyTorchをソースコードからコンパイルするというテストだ。このテストでは複数のプロセス(CMake/ninja/LLVM/Clang)が使われているため、マルチスレッドというよりもマルチプロセス環境におけるパフォーマンスを比較している。
| 「SPECworkstation 4.0」LLVM Clangコンパイル時間(単位:ms) | ||
|---|---|---|
| ― | AMD Ryzen Threadripper 9980X | AMD Ryzen Threadripper 9970X |
| PyTorch | 223.1 | 226.72 |
5つ目は、AIの推論処理をCPUで行なうONNX Inferenceテストだ。用意されているもののうち、画像分類で利用されるResNet50の結果、それも1秒あたりの推論回数のみにフォーカスしている。演算精度はFP32またはINT8の2通りとし、スレッド数をCPUに搭載されている論理コア数に等しく設定した場合(nTと表記)と、論理コア数の半分に設定した場合(1/2 nT)で計測した。数値は1秒あたりの推論回数を示しており、数値が大きいほど優秀だ。
| 「SPECworkstation 4.0」ONNX Inference(単位:推論回数/ms) | ||
|---|---|---|
| ― | AMD Ryzen Threadripper 9980X | AMD Ryzen Threadripper 9970X |
| CPU ResNet50-FP32-batch8 Throughput(nT) | 86.88 | 82.63 |
| CPU ResNet50-FP32-batch8 Throughput(1/2 nT) | 96.04 | 60.53 |
| CPU ResNet50-INT8-batch8 Throughput(nT) | 281.16 | 257.78 |
| CPU ResNet50-INT8-batch8 Throughput(1/2 nT) | 292.33 | 200.39 |
また以下は、ONNX Inferenceテストのうち、超解像(Super Resolution)処理における推論回数を計測したものだ。
| 「SPECworkstation 4.0」ONNX Inference 超解像度(単位:推論回数/ms) | ||
|---|---|---|
| ― | AMD Ryzen Threadripper 9980X | AMD Ryzen Threadripper 9970X |
| CPU ResNet50-FP32-batch8 Throughput(nT) | 136.49 | 101.38 |
| CPU ResNet50-FP32-batch8 Throughput(1/2 nT) | 90.92 | 67.36 |
| CPU ResNet50-INT8-batch8 Throughput(nT) | 173.35 | 174.33 |
| CPU ResNet50-INT8-batch8 Throughput(1/2 nT) | 174.16 | 126.97 |
「LM Studio」を利用したLLMのパフォーマンス
LLMのパフォーマンスを検証するため、「LM Studio」を使った計測も実施した。今回は学習モデルに容量の大きい「Qwq 32B Q8_0」を使用した。学習モデルのサイズは約34GBだ。「AMD Ryzen Threadripper 9000」シリーズ用検証システムはメインメモリーが128GBあるので、メインメモリーで処理したらどうなるか? という検証となっている。GPUを使わずCPUによる処理にするため、「GPU Offload」を最少である0にして、CPUのThread Pool Sizeは最大値に設定してある。
ここでの検証は以下のようなプロンプトを入力し、しばらくシンキングさせるというものである。ただ今回のお題はかなり意地悪なため、Qwq 32Bの場合答えを出せずに延々とシンキングを続けてしまう。そこでこのお題を10分間シンキングさせ、トークン出力スピード(OTS:Output Token Speed)を比較した。
あなたの手には長さ50メートルのロープがあり、高さ100メートルはありそうなビルの高さを測ろうとしています。ただし、あなたの身体(身長は170cm)とロープ(1本しかありません)以外になにも使わず、なるべく正確にビルの高さを計測するにはどうすればよいでしょうか。詳しく解説してください。計算をともなう場合は、その際に使用した数式も提示してください。可能なら図示もしてください。
| 「LM Studio」(0.3.20) トークン出力スピード(tokens/sec) | ||
|---|---|---|
| ― | AMD Ryzen Threadripper 9980X | AMD Ryzen Threadripper 9970X |
| トークン出力スピード(OTS)、Qwq 32B Q8_0、GPU Offload=0/64 | 4.18 | 3.44 |



