並列化への対応と同期処理がFSB方式の足かせに
特に問題だったのは、性能面での足かせである。CPUの数を増やしても、無尽蔵に性能が上がるわけではないというのは、1967年に「アムダールの法則」として提唱されていた。CPUの数が増えても、そこで動かすプログラムの方が並列化に対応していないと効果がない、という話である。
例えば図4のように、1CPUでしか実行できない処理A・Cと、複数のCPUで分散して実行できる処理Bがある場合を想定する。CPUが2つだと、処理Bは処理B1/B2に分割することで半分の時間で済むが、処理A・Cは分割できないので、トータルの処理時間はそれほど減らない、というものである。
そのため、いかにして並列処理できるようにプログラムを記述するかが、ポイントになる。だが、これはあくまでもひとつのプログラムを分割する話だ。図5のように、同時に2つ以上のプログラムが走っていれば、それぞれを別々のCPUに割り当てることで、性能は見かけ上倍になるわけだ。
ただし、(アムダールの法則を含めて)ここまでの話では考慮していないことがある。それは同期の時間である。例えば図4の場合、本来は入らない「処理B1とB2を並行に実行させる」「処理B1とB2の両方が終わることを確認する」という、2つの処理を同期させる処理が必ず入ることになる(図6)。この同期に要する時間が長いと、図6のようにさらに効率が落ちることになる。
これは、図5のケースでも当てはまる。1CPUの場合は、OSがそれぞれを切り替えながら処理していたが、2CPUになると、2つのCPUにまたがる形でOSがそれぞれの処理を走らせることになり、結果として図7のように、ここでも見かけ上の処理性能が落ちることになる。FSBを利用してのMCMパッケージは、この同期に要する時間が長くなる、というのが最大の問題だったわけだ。
この連載の記事
-
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ -
第759回
PC
プリンター接続で業界標準になったセントロニクスI/F 消え去ったI/F史 -
第758回
PC
モデムをつなぐのに必要だったRS-232-CというシリアルI/F 消え去ったI/F史 - この連載の一覧へ