ロードマップでわかる!当世プロセッサー事情 第581回
謎が多いGeForce RTX 3000シリーズのプロセスとGDDR6X NVIDIA GPUロードマップ
2020年09月21日 12時00分更新
謎が多いエラー訂正とチップの素性
さて、ここまではそのPAM-4の仕組みの概略であるが、実はまだ現時点では見えないことがいろいろある。1つ目はエラー訂正だ。先にネットワークやPCI ExpressでPAM-4は広く使われているという話をしたが、PAM-4にするとEYE Heightが大幅に減ることもあり、BER(Bit Error Rate)が急速に劣化することが多い。
これを避けるために、FEC(Forward Error Collection)という誤り訂正符号の手法を併用している。ネットワークではかなり強力なFECが採用されるが、ロジックが複雑なうえにレイテンシーも大きくなる。
そこでPCI Express Gen6では非常に軽量なFECにFLITと呼ばれる独自の再送メカニズムを追加して、レイテンシーの悪化を最小限に抑えてエラー抑制を図った。
ではGDDR6Xは? というと、Ralf Ebert氏(Director, Micron Worldwide Graphics Business)によれば「なにもしていない。データバスにPAM-4を入れただけだ」という信じがたい回答が返ってきた。
Ebert氏は営業の人で、あまり技術的に詳しくない可能性があるが、10GHzを超える、それもSingle Endedの配線にPAM-4を入れて、前述のような綺麗な波形になるというのはやや常識的には考えにくい。
もっともこのPAM-4の波形をどこで測ったのか(GPUの根元、GDDR6XチップのBall、途中の配線のど真ん中、などで波形が変わってくるからだ)にも寄るのだが、なにかしらアナログイコライザー的なものが入っているのか、あるいはGPUとGDDR6Xチップの間の距離が短いからこれで行けるのか、そのあたりの技術的なノウハウが今回一切明らかにされていない。
実はDDR5チップには、DFE(Decision feedback Equalizer)と呼ばれる波形調整機構が入ることがもう決定しており、これを先んじてGDDR6Xに突っ込んだ可能性はなくもないのだが、それにしても異様に綺麗な波形、というのが筆者の率直な印象である。
ただこれ、NVIDIAのリファレンスデザインに沿ったカードであれば同じように通信できるかもしれないが、OEMベンダーの独自設計カードで、このGDDR6X周りの配線をいじると、いきなりEYEの形が変わってまともに通信できない、なんてことが起きそうな予感がする。なかなか設計はタイトそうだ。
2つ目の問題はメモリーチップの素性である。今回PAM-4で信号速度は抑えつつ実効データレートは引きあがったわけだが、メモリーチップそのものからすると16Gbpsで動いていたセルを21Gbpsで動かすことになる。
もちろんこんな速度で動くメモリーセルはないので、そこでBurst lengthが効いてくる。GDDR6の場合はプリフェッチが16n構成で、Burst Lenghtもこれにあわせているので、16Gbpsの場合は1GHzでアクセスできるセルを同時に16個から読み出すことで16Gbpsを維持することになる。
ところがGDDR6XはBurst Lenghtが16のまま(正確に言えばPAM-4の8)なので、プリフェッチも16nのままだと想像される。ということは、21Gbpsのケースではセルが1.3125GHzで駆動されることになる。
現状、Micronのプロセスでこれを実現できるものは存在しない。MicronはGDDR6Xの詳細に関しては未公表であるが、質疑応答の中でEbert氏はGDDR6Xのプロセスについて聞かれて「一般的に言ってGDDR6と同じ世代のプロセス」「ダイサイズもおおむね同じ」「消費電力もほぼ変わらない」と曖昧な表現での答えとなった。
現在Micronは1znmプロセスがGDDR6に採用されているが、これはどう考えても1GHzが限界で、1.3GHzともなると次の1αnmプロセルへの移行が必須である。ところが1αnmはやっとES(Engineering Sample)が始まったばかりの段階のはずで、まだ量産に耐える状況ではない。
となると、1.25V/1.35Vを受けて、これを内部で昇圧してセルのオーバークロック動作を噛ましているのか、それとも他のなにかしらのテクニックを使っているのか、まったくわからない。
もしオーバークロック動作を噛ましているとすれば、消費電力も相応に引きあがるだろう。Ebert氏の「消費電力もほぼ変わらない」だって、「(動作周波数あたりの)消費電力もほぼ変わらない」だったりする可能性もあるわけで、するとGDDR6Xはやはり性能の代償としてかなり熱いチップになるだろう。
このあたりも、GeForce RTX 3080/3090の320W/350WのBoard Powerの達成に貢献している(?)と言えるだろう。

この連載の記事
-
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第851回
PC
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 -
第844回
PC
耐量子暗号対応でセキュリティ強化! IBMのPower11が叶えた高信頼性と高速AI推論 -
第843回
PC
NVIDIAとインテルの協業発表によりGB10のCPUをx86に置き換えた新世代AIチップが登場する? -
第842回
PC
双方向8Tbps伝送の次世代光インターコネクト! AyarLabsのTeraPHYがもたらす革新的光通信の詳細 - この連載の一覧へ












