電話交換機用の安価な
プロセッサー開発が中止
Cocke博士が目指していたのは、電話交換機用の新しいプロセッサーであった。この電話交換機は、平均して300通話/秒の接続をさばく必要があり、おのおのの通話の接続処理に2万命令ほどを費やす必要があったという。
もちろん電話交換機なので、この処理を迅速に行なう必要がある。結果として、概算ではあるが12MIPSほどの処理性能が必要と推定された。
この電話交換機用プロセッサーを開発するプロジェクトは1974年に正式に発足したようだが、すでにこの時点でSystem/370は存在しているから、12MIPSという数字そのものは不可能ではなかった。
問題はこれを交換機に統合できる程度の低価格で実現しないといけないことだった。幸運なのか不幸なのかはともかく、この電話交換機のプロジェクトそのものが1975年に中止になったが、プロセッサーデザインはこの時点でかなり進んでおり、非常に素性の良い汎用高性能プロセッサーになりそうだった。特徴は以下の通り。
- 命令キャッシュとデータキャッシュを分離することで、CPUとメモリー間の帯域を大きくできた
- 演算命令が直接メモリーアクセスを行なわない(必ずレジスターに対してのアクセスとなる)ことで、パイプラインを簡単化できた
- 命令長を固定とすることで設計をシンプルにでき、それゆえにサイクル時間を短縮できる(=動作周波数を上げられる)
なぜこの構成をCocke博士が考えたかというと、IBMが製造した過去の製品からのフィードバックだった。
博士によれば、命令のトレース結果を見てみると実行時間の3割はCPUとメモリーの間のデータ移動に費やされている特徴とともに、分岐命令の処理がやはり実行時間の1/3を占めているというデータを重視した。
大昔のSTRETCHことIBM 7030のころから、分岐予測に成功した場合と失敗した場合のパフォーマンスに大きな差があることが認識されていたという。
もちろんその意味では分岐予測を正確に行なうことが重要ではあるが、100%の確率で分岐予測はできない。であれば、分岐予測が失敗した場合にもそれほど性能が落ちない仕組みを考える必要がある。
そのためにはパイプラインの段数を減らせばいい。パイプラインの段数を減らしても性能を落とさないためにはどうするかといえば、命令を簡単化することで、パイプライン1段あたりの処理を減らせばいいことになる。
この連載の記事
-
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ -
第759回
PC
プリンター接続で業界標準になったセントロニクスI/F 消え去ったI/F史 -
第758回
PC
モデムをつなぐのに必要だったRS-232-CというシリアルI/F 消え去ったI/F史 - この連載の一覧へ