メモリー編8回目はメインメモリーから外れて、「GDDR」について解説しよう。GDDRは「Graphics DDR」の略で、ようするにグラフィック専用のメモリーである。
理屈では速いデュアルポートのVRAM
採用事例は伸び悩む
もともとグラフィック専用メモリーでは、「デュアルポートDRAM」を「VRAM」と称して利用することが多かった。デュアルポートDRAMには色々な種類があるのだが、VRAMとして使われたのは図1のようなものだ。
左は従来のDRAMで、右がSerial OutがついたVRAMである。通常のDRAMを使ってグラフィックスカードを構成する場合、画面の描画と画面出力(画面リフレッシュ)を、ひとつのDRAMインターフェース(I/F)でまとめて行なわねばならない。図2の左側がこれで、描画(赤線)と画面リフレッシュ出力(青線)が同一のDRAM I/Fを経由している。そのためグラフィックコントローラーは、画面リフレッシュの合間に描画命令を発行するといった配慮が必要だった。当然その分描画性能も落ちることになる。
これを解決したのがVRAMである。内部に「ラインバッファ」と呼ばれる画面1列分のバッファが別途用意されており、ホスト側からの指示で、DRAMセルからまとめてデータをコピーできる。コピーされたデータは、Serial Outと呼ばれるポートから(本来のDRAMのデータバスとは別のタイミングで)読み出すことが可能だ。そしてこれを使うと、グラフィックスカードを図2右側のように構成できる。画面リフレッシュ用のデータはSerial Outから取得できるので、通常のデータバスを占有する必要もなく、より性能を上げられるというわけだ。
もっとも、理論と実際が一致していないというのもまたよくある話。筆者の記憶だと、かつてのS3の第2世代製品のうち、「S3 801/805」がDRAMのみ、「S3 928」がこのVRAM対応になっていた。ところが、これらを搭載したグラフィックスカード「Diamond Stealth 24」(S3 801/805)と「Diamond Stealth Pro」(S3 928)を比較してみると、VRAMを搭載して高価だったDiamond Stealth Proの方が遅かった、なんてケースを実際に体験している。
VRAMで問題となったのは、1ライン分のコピーをする間はDRAMセルのアクセスができないことだった。またSDRAMと異なり、コマンドをパケットで送るような機能もないので、RAS/CASやそのほかの制御線やアドレスを使いながら、「1ライン分のコピーをする」コマンドを送るのが、結構なオーバーヘッドになっていた。
とはいえ、この「複数のポートを持つグラフィック専用DRAM」というアイデアは、その後も生き残った。しばらく後の話だが、1995年にサムスン電子が開発した「WRAM」(Window RAM)はやはりデュアルポート構成で、さらにDRAMチップ上で簡単な演算が可能というものだった。WRAMは当時の人気グラフィックスカード「Matrox Millennium」に搭載されたことで一躍有名になったが、これに続くベンダーがなかった。Matrox自身も、Millenniumと後継の「Millennium II」ではWRAMを採用したが、それで終わってしまっている。
WRAMに続いて、「SGRAM」(Synchronous Graphic RAM)という製品がインテルから発表された。SGRAMはSDRAMに描画用の演算回路を搭載した、言うなれば「WRAMのSDRAM版」であるが、WRAMと異なり出力は1ポートになっている。Matroxをはじめとして、いくつかのチップベンダーがSGRAMを採用したものの、こちらも長期的には使われずに終わってしまった。
この連載の記事
-
第774回
PC
日本の半導体メーカーが開発協力に名乗りを上げた次世代Esperanto ET-SoC AIプロセッサーの昨今 -
第773回
PC
Sound Blasterが普及に大きく貢献したGame Port 消え去ったI/F史 -
第772回
PC
スーパーコンピューターの系譜 本格稼働で大きく性能を伸ばしたAuroraだが世界一には届かなかった -
第771回
PC
277もの特許を使用して標準化した高速シリアルバスIEEE 1394 消え去ったI/F史 -
第770回
PC
キーボードとマウスをつなぐDINおよびPS/2コネクター 消え去ったI/F史 -
第769回
PC
HDDのコントローラーとI/Fを一体化して爆発的に普及したIDE 消え去ったI/F史 -
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ - この連載の一覧へ