IBM 801より倍以上処理速度が遅いが
2チップに収めることに成功
ハードウェア的には、IBM 801で搭載されていた命令/データキャッシュが廃止になった。これはターゲットとなる2μmプロセスのNMOSではダイサイズが大きくなりすぎてしまうと判断されたためだ。
その代わり16Bytesのプリフェッチ・バッファが用意された。これにより、分岐におけるIBM 801方式のBRANCH AND EXECUTE(要するにDelay Slot)方式がROMPでも効果的に機能するようになったほか、プリフェッチ・バッファに簡単なループ認識機能の仕組みを入れたことで、ループ処理の際のレイテンシーを削減することにもつながっている。
画像の出典は、Internet Archives保有のBYTE Magazine Volume 11, Number 11の“Inside the IBM PCs”という特集号
平均してROMPの命令は平均2.3サイクルで処理できるように設計された。サイクルタイムが100ns(つまりクロックが10MHz)の場合、ROMPの性能はおおよそ4.3MIPS程度となった。
IBM 801のサイクルタイムが63ns(クロックが15.87MHz)で性能が15.1MIPS(つまり1命令の実行は平均1.05サイクル)だったので、倍以上遅くなった計算になる。その代わりに、最終的にROMPは2チップに収まったわけで、性能とコストのトレードオフを考慮するとこれは十分許容範囲と判断された。
言うまでもなく浮動小数点演算機能はサポートされていない。これについては、必要ならFPUを外付けで対処することになった。実際後で出てくるRT PCでは、10MHz駆動のNS32081 FPUを接続し、Memory Mapped I/Oで通信するという、わりと力業の解決方法がとられている。
この連載の記事
-
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ -
第759回
PC
プリンター接続で業界標準になったセントロニクスI/F 消え去ったI/F史 -
第758回
PC
モデムをつなぐのに必要だったRS-232-CというシリアルI/F 消え去ったI/F史 - この連載の一覧へ