今週からしばらくは中休みということで、用語集をお届けする。「なぜ用語集?」というと、ジサトラメンバーから「用語は知ってるけれど、ちゃんと理解してない」言葉がいくつかある、という話が出てきていたので「それじゃ中休みがてら説明しましょう」ということである。そんなわけで単語の選定は、主にジサトラメンバーからあがってきたものである。その一発目はRing Busである。
そもそもバスって何よ? という話は以前連載105回や218回で簡単に触れたが、要するにPCの内部のコンポーネント同士をつなぐのがバスである。
CPUとメモリーをつながないと、CPUが処理をするためのデータが永遠に手に入らない。メモリーとGPUをつながないと、いくら待っても画面は真っ暗なままである。そんなわけで、バスもまたPCの内部では非常に重要(ただし陽があたらない、影の存在)である。
さて、以前の連載では規格別にバスを紹介したが、少し別の観点からバスを分類してみる。トポロジー(つまりつなぎ方)で言うと、バスには以下の3種類がある。
(1) 共有バス
複数のデバイスが1本のバスを共有する形だ。この方式は以下の特徴がある。
共有バスの仕組み | ||||||
---|---|---|---|---|---|---|
メリット | 構造がシンプルで、デバイスの数を簡単に増やしやすい。 1つのデバイスからほかのデバイスに一斉にデータを送れる(Broadcast)。 バスのデータ幅を増やしても、実装面積が最小に抑えられる。 |
|||||
デメリット | あるDeviceの送信中は、ほかのデバイスが送信できない。 信号が高速になると、波形が乱れやすい(特にデバイス数が増えると顕著)。 デバイス間の調停機構(誰がいつまでの間送信できるか、を決める)が必要。 |
この共有バスは、かつてはインテルのFSB(Front Side Bus)で利用されており、ほかにもISA/PCIやLPC、Enhanced IDEなど非常に幅広く使われていた。現在もメインメモリーや、周辺回路でもI2Cなどは引き続き共有バス形式である。また広義に言えば、Wi-FiやBluetoothなど無線を利用したネットワークは、分類としては共有バスということになる。
(2) Point-to-Point
個々のデバイスが一対一接続する形だ。この方式の場合以下の特徴がある。
Point-to-Pointの仕組み | ||||||
---|---|---|---|---|---|---|
メリット | 速度やバスのデータ幅を自由に選べるし、特に速度を非常に上げやすい。 小規模な構成であれば、最小の面積で実装できる。 |
|||||
デメリット | デバイスの個数が増えると、途端に配線の数が爆発的に増えることになる。 ある程度以上の構成ではハブをはさむ形にすることが多いが、大規模になるとハブを複数個つなげることになり、これのレイテンシーや消費電力がバカにならない。 大規模なハブは、内部が複雑化する。 |
Point-to-Pointが現在の主流であって、Nehalem以降のCPUの接続やPCI Express、Serial ATA、GDDR、USB、Thunderbolt、HDMI、DisplayPortなどさまざまなI/Fがこの構造を取っている。ネットワークでも、10BASE-T以降のすべてのイーサネットはこの方式である。
ちなみにこのハブの内部構造はこれも2種類あり、大別すると共有バス方式のものと、Switch(Fabricという言い方をする場合もある)方式である。下図が共有バス方式のもので、昔のUSB 1.1/2.0のハブなどはこうした実装であった。
この方式ではコストが安く済む一方、共有バス方式のデメリットを全部引き継ぐことになってしまうため、最近はあまり使われていない。
一方のSwitchは、最小構成では下の構図になっている。それぞれのデバイス用のI/Fから、縦横構造の配線に信号が渡されて、目的のデバイスにつながる形だ。
この方式、昔は電話交換機に使われており、縦方向の信号線に横方向のショートカット(横木)を当てる形なのでCrossbar、と呼ばれていた。最近では縦横の配線がまるで織物のようだ、ということでFabricと呼ばれることもあるが、Switch/Crossbar/Fabricのいずれも同じものを指している。
このSwitchは、たとえばDevice AとBが通信しながら、同時にDevice CとDが通信することもできるといったメリットがあり、レイテンシーも共有バス方式よりもずっと少ない反面、つながるデバイス(この図で言えば縦方向の配線)の数の2乗のサイズで回路規模が大きくなる、という欠点がある。
したがって大規模なSwitchは高コストになるという欠点もある。そこで複数個のスイッチをツリー状につなげる、という使われ方をする場合もある。スーパーコンピューターのASCI QがElite(これがSwitch)を3層のFat Treeにしたというのも、1個で3000台をブラ下げられるSwitchを作ることが技術的に不可能だからこその対策である。
この連載の記事
-
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU -
第792回
PC
大型言語モデルに全振りしたSambaNovaのAIプロセッサーSC40L Hot Chips 2024で注目を浴びたオモシロCPU -
第791回
PC
妙に性能のバランスが悪いマイクロソフトのAI特化型チップMaia 100 Hot Chips 2024で注目を浴びたオモシロCPU -
第790回
PC
AI推論用アクセラレーターを搭載するIBMのTelum II Hot Chips 2024で注目を浴びたオモシロCPU -
第789回
PC
切り捨てられた部門が再始動して作り上げたAmpereOne Hot Chips 2024で注目を浴びたオモシロCPU -
第788回
PC
Meteor Lakeを凌駕する性能のQualcomm「Oryon」 Hot Chips 2024で注目を浴びたオモシロCPU -
第787回
PC
いまだに解決しないRaptor Lake故障問題の現状 インテル CPUロードマップ - この連載の一覧へ