ロードマップでわかる!当世プロセッサー事情 第581回
謎が多いGeForce RTX 3000シリーズのプロセスとGDDR6X NVIDIA GPUロードマップ
2020年09月21日 12時00分更新
謎が多いエラー訂正とチップの素性
さて、ここまではそのPAM-4の仕組みの概略であるが、実はまだ現時点では見えないことがいろいろある。1つ目はエラー訂正だ。先にネットワークやPCI ExpressでPAM-4は広く使われているという話をしたが、PAM-4にするとEYE Heightが大幅に減ることもあり、BER(Bit Error Rate)が急速に劣化することが多い。
これを避けるために、FEC(Forward Error Collection)という誤り訂正符号の手法を併用している。ネットワークではかなり強力なFECが採用されるが、ロジックが複雑なうえにレイテンシーも大きくなる。
そこでPCI Express Gen6では非常に軽量なFECにFLITと呼ばれる独自の再送メカニズムを追加して、レイテンシーの悪化を最小限に抑えてエラー抑制を図った。
ではGDDR6Xは? というと、Ralf Ebert氏(Director, Micron Worldwide Graphics Business)によれば「なにもしていない。データバスにPAM-4を入れただけだ」という信じがたい回答が返ってきた。
Ebert氏は営業の人で、あまり技術的に詳しくない可能性があるが、10GHzを超える、それもSingle Endedの配線にPAM-4を入れて、前述のような綺麗な波形になるというのはやや常識的には考えにくい。
もっともこのPAM-4の波形をどこで測ったのか(GPUの根元、GDDR6XチップのBall、途中の配線のど真ん中、などで波形が変わってくるからだ)にも寄るのだが、なにかしらアナログイコライザー的なものが入っているのか、あるいはGPUとGDDR6Xチップの間の距離が短いからこれで行けるのか、そのあたりの技術的なノウハウが今回一切明らかにされていない。
実はDDR5チップには、DFE(Decision feedback Equalizer)と呼ばれる波形調整機構が入ることがもう決定しており、これを先んじてGDDR6Xに突っ込んだ可能性はなくもないのだが、それにしても異様に綺麗な波形、というのが筆者の率直な印象である。
ただこれ、NVIDIAのリファレンスデザインに沿ったカードであれば同じように通信できるかもしれないが、OEMベンダーの独自設計カードで、このGDDR6X周りの配線をいじると、いきなりEYEの形が変わってまともに通信できない、なんてことが起きそうな予感がする。なかなか設計はタイトそうだ。
2つ目の問題はメモリーチップの素性である。今回PAM-4で信号速度は抑えつつ実効データレートは引きあがったわけだが、メモリーチップそのものからすると16Gbpsで動いていたセルを21Gbpsで動かすことになる。
もちろんこんな速度で動くメモリーセルはないので、そこでBurst lengthが効いてくる。GDDR6の場合はプリフェッチが16n構成で、Burst Lenghtもこれにあわせているので、16Gbpsの場合は1GHzでアクセスできるセルを同時に16個から読み出すことで16Gbpsを維持することになる。
ところがGDDR6XはBurst Lenghtが16のまま(正確に言えばPAM-4の8)なので、プリフェッチも16nのままだと想像される。ということは、21Gbpsのケースではセルが1.3125GHzで駆動されることになる。
現状、Micronのプロセスでこれを実現できるものは存在しない。MicronはGDDR6Xの詳細に関しては未公表であるが、質疑応答の中でEbert氏はGDDR6Xのプロセスについて聞かれて「一般的に言ってGDDR6と同じ世代のプロセス」「ダイサイズもおおむね同じ」「消費電力もほぼ変わらない」と曖昧な表現での答えとなった。
現在Micronは1znmプロセスがGDDR6に採用されているが、これはどう考えても1GHzが限界で、1.3GHzともなると次の1αnmプロセルへの移行が必須である。ところが1αnmはやっとES(Engineering Sample)が始まったばかりの段階のはずで、まだ量産に耐える状況ではない。
となると、1.25V/1.35Vを受けて、これを内部で昇圧してセルのオーバークロック動作を噛ましているのか、それとも他のなにかしらのテクニックを使っているのか、まったくわからない。
もしオーバークロック動作を噛ましているとすれば、消費電力も相応に引きあがるだろう。Ebert氏の「消費電力もほぼ変わらない」だって、「(動作周波数あたりの)消費電力もほぼ変わらない」だったりする可能性もあるわけで、するとGDDR6Xはやはり性能の代償としてかなり熱いチップになるだろう。
このあたりも、GeForce RTX 3080/3090の320W/350WのBoard Powerの達成に貢献している(?)と言えるだろう。
この連載の記事
-
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU -
第792回
PC
大型言語モデルに全振りしたSambaNovaのAIプロセッサーSC40L Hot Chips 2024で注目を浴びたオモシロCPU -
第791回
PC
妙に性能のバランスが悪いマイクロソフトのAI特化型チップMaia 100 Hot Chips 2024で注目を浴びたオモシロCPU -
第790回
PC
AI推論用アクセラレーターを搭載するIBMのTelum II Hot Chips 2024で注目を浴びたオモシロCPU -
第789回
PC
切り捨てられた部門が再始動して作り上げたAmpereOne Hot Chips 2024で注目を浴びたオモシロCPU -
第788回
PC
Meteor Lakeを凌駕する性能のQualcomm「Oryon」 Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ