このページの本文へ

前へ 1 2 3 4 次へ

ロードマップでわかる!当世プロセッサー事情 第581回

謎が多いGeForce RTX 3000シリーズのプロセスとGDDR6X NVIDIA GPUロードマップ

2020年09月21日 12時00分更新

文● 大原雄介(http://www.yusuke-ohara.com/) 編集●北村/ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

謎が多いエラー訂正とチップの素性

 さて、ここまではそのPAM-4の仕組みの概略であるが、実はまだ現時点では見えないことがいろいろある。1つ目はエラー訂正だ。先にネットワークやPCI ExpressでPAM-4は広く使われているという話をしたが、PAM-4にするとEYE Heightが大幅に減ることもあり、BER(Bit Error Rate)が急速に劣化することが多い。

 これを避けるために、FEC(Forward Error Collection)という誤り訂正符号の手法を併用している。ネットワークではかなり強力なFECが採用されるが、ロジックが複雑なうえにレイテンシーも大きくなる。

 そこでPCI Express Gen6では非常に軽量なFECにFLITと呼ばれる独自の再送メカニズムを追加して、レイテンシーの悪化を最小限に抑えてエラー抑制を図った。

 ではGDDR6Xは? というと、Ralf Ebert氏(Director, Micron Worldwide Graphics Business)によれば「なにもしていない。データバスにPAM-4を入れただけだ」という信じがたい回答が返ってきた。

 Ebert氏は営業の人で、あまり技術的に詳しくない可能性があるが、10GHzを超える、それもSingle Endedの配線にPAM-4を入れて、前述のような綺麗な波形になるというのはやや常識的には考えにくい。

 もっともこのPAM-4の波形をどこで測ったのか(GPUの根元、GDDR6XチップのBall、途中の配線のど真ん中、などで波形が変わってくるからだ)にも寄るのだが、なにかしらアナログイコライザー的なものが入っているのか、あるいはGPUとGDDR6Xチップの間の距離が短いからこれで行けるのか、そのあたりの技術的なノウハウが今回一切明らかにされていない。

 実はDDR5チップには、DFE(Decision feedback Equalizer)と呼ばれる波形調整機構が入ることがもう決定しており、これを先んじてGDDR6Xに突っ込んだ可能性はなくもないのだが、それにしても異様に綺麗な波形、というのが筆者の率直な印象である。

 ただこれ、NVIDIAのリファレンスデザインに沿ったカードであれば同じように通信できるかもしれないが、OEMベンダーの独自設計カードで、このGDDR6X周りの配線をいじると、いきなりEYEの形が変わってまともに通信できない、なんてことが起きそうな予感がする。なかなか設計はタイトそうだ。

 2つ目の問題はメモリーチップの素性である。今回PAM-4で信号速度は抑えつつ実効データレートは引きあがったわけだが、メモリーチップそのものからすると16Gbpsで動いていたセルを21Gbpsで動かすことになる。

 もちろんこんな速度で動くメモリーセルはないので、そこでBurst lengthが効いてくる。GDDR6の場合はプリフェッチが16n構成で、Burst Lenghtもこれにあわせているので、16Gbpsの場合は1GHzでアクセスできるセルを同時に16個から読み出すことで16Gbpsを維持することになる。

 ところがGDDR6XはBurst Lenghtが16のまま(正確に言えばPAM-4の8)なので、プリフェッチも16nのままだと想像される。ということは、21Gbpsのケースではセルが1.3125GHzで駆動されることになる。

上から7つ目のBurst lengthの項目に注目。GDDR6XはGDDR6と同じ16だ

 現状、Micronのプロセスでこれを実現できるものは存在しない。MicronはGDDR6Xの詳細に関しては未公表であるが、質疑応答の中でEbert氏はGDDR6Xのプロセスについて聞かれて「一般的に言ってGDDR6と同じ世代のプロセス」「ダイサイズもおおむね同じ」「消費電力もほぼ変わらない」と曖昧な表現での答えとなった。

 現在Micronは1znmプロセスがGDDR6に採用されているが、これはどう考えても1GHzが限界で、1.3GHzともなると次の1αnmプロセルへの移行が必須である。ところが1αnmはやっとES(Engineering Sample)が始まったばかりの段階のはずで、まだ量産に耐える状況ではない。

 となると、1.25V/1.35Vを受けて、これを内部で昇圧してセルのオーバークロック動作を噛ましているのか、それとも他のなにかしらのテクニックを使っているのか、まったくわからない。

 もしオーバークロック動作を噛ましているとすれば、消費電力も相応に引きあがるだろう。Ebert氏の「消費電力もほぼ変わらない」だって、「(動作周波数あたりの)消費電力もほぼ変わらない」だったりする可能性もあるわけで、するとGDDR6Xはやはり性能の代償としてかなり熱いチップになるだろう。

 このあたりも、GeForce RTX 3080/3090の320W/350WのBoard Powerの達成に貢献している(?)と言えるだろう。

前へ 1 2 3 4 次へ

カテゴリートップへ

この連載の記事

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン