詳細解説　これがSandy Bridgeのアーキテクチャーだ

2011年01月06日 11時30分更新

CPUコア

図2　Sandy BridgeのCPUコアの内部構造

　図2はSandy BridgeのCPUコアの内部構造である。基本的な構造はNehalem/Westmere(32nmプロセスのCore iシリーズ、以下略)世代のアーキテクチャーを踏襲しており、4命令同時フェッチ/デコードのインオーダー部と、6命令分の実行ポートを持つアウトオブオーダー部の組み合わせとなっている。

　ただし、当然ながら細かいところでは、いろいろと相違点がある。まずインオーダー部(図2ではスケジューラーより上側)に関しては、従来から引き続いて「Loop Stream Detector」(LSD)^※1という仕組みが設けられている。
^{※1　プログラム中の繰り返し構造を認識し、小規模なループであれば命令デコーダーを動かさずに内部バッファから命令を供給する。}

　Nehalem世代の場合、このLSDは28μOp(マイクロオプス、CPU内部で実際に処理される小命令)分のバッファを持っていたが、Sandy Bridgeではこれが一挙に1500μOp分まで大幅拡張された。これに加えて、「分岐予測も従来より強化された」という話であるが、その点については詳細不明である。

　デコーダーに関してはもうひとつ、新たに「Zeroing Idioms」という機構も搭載された(図2ではAllocateの辺りに含まれる)。これは、実行ユニットを動かすまでもない命令^※2は、命令を発行せずに処理を済ませてしまうというものだ。これにより、実行ユニットの効率向上と省電力化の両方を狙う。
^{※2　例えば「XOR AX,AX」といった、AXレジスターをクリアするだけの命令。}

　続くアウトオブオーダー部も見てみよう。先述のとおり、6命令分の実行ポートという構成や、ALUが3ポート、LSU(Load Store Unit)が3ポートという配分などは、Nehalem世代と同じである。その意味では、Sandy Bridgeのアウトオブオーダー部は「Nehalemのアウトオブオーダー部を改良したもの」と言っても差し支えない。その改良点であるが、大きく目立つものとして以下の2点が挙げられる。

AVX命令の実装
Load/Store Addressのスループットを倍に強化

　まずAVXの実装について説明しよう。図3のようにALUはPort 0、1、5に割り当てられている。Nehalem世代の場合、整数演算ならば汎用レジスターを、整数演算のSSE命令ならばSSEレジスターをInteger型(整数型)として、浮動小数点演算のSSE命令ならばSSEレジスターをFloat/Double型(浮動小数点型)として、それぞれ扱うようになっている。

図3　ALUポートの構造

　AVX命令では、このSSEレジスターへの操作をそのまま流用するように実装されている。そのためAVXレジスターは256bit幅にも関わらず、128bit幅のSSE演算ユニットを使って、計算できるようになったわけだ。

　例えば、Port 1でAVXの加算命令を行なう場合、まず前半128bit分をSSEのInteger用インターフェース(I/F)「SSE INT ADD」を流用して演算結果を書き込む。次に、SSE Float/Double用のI/F「FP ADD」を流用して、後半128bit分の演算結果を書き込む、という処理を行なう。演算ユニットそのものを256bit化するのは、性能面ではメリットがあっても、消費電力や回路規模の増大の観点から好ましくない、と判断したようだ。

　なおAVXの詳細については、こちらの記事も参照していただきたい。

前へ 1 2 3 4 5 6 次へ

ツイートする

カテゴリートップへ

詳細解説 これがSandy Bridgeのアーキテクチャーだ

CPUコア

この連載の記事

この記事の編集者は以下の記事をオススメしています

PC Sandy Bridgeこと第2世代Core i7/i5/i3、ついに発表

自作PC 内蔵GPUの存在を大きく変える「Sandy Bridge」の性能とは？

PC 見えてきたSandy Bridgeの詳細 4つの特徴を解説

PC IDF 2010でインテルの次の主役 Sandy Bridgeが披露

PC インテル、第2世代Core i向けの映像配信サービス発表

自作PC ついに登場！ 新型Core i7/i5シリーズの価格をチェック

PCパーツ 自作ユーザー集結！ インテル新CPUが深夜に販売解禁！

PCパーツ 5万円で組むSandy Bridge自作PC

PCパーツ 10万円で組むSandy Bridge自作PC

PCパーツ 15万円で組むSandy Bridge自作PC

PC チップセット問題が響くインテル モバイルCPUの現状

sponsored パワフルな富士通「ESPRIMO DH70/CN」を買う4つの理由

PCパーツ 知ったかできるパーツ基礎知識【CPU/マザー/メモリ編】

自作PC 22nmプロセスのIvy BridgeはSandy Bridgeと何が違うのか？

PC インテルが第3世代Coreプロセッサーを発表、29日に販売開始

PC インテルCPU進化論 細かく変わって性能向上Sandy Bridge

PCパーツ Intel50周年、勤続30年のインテル常務が語る「Pentium M」と「Centrino」の思い出

注目ニュース

ピックアップ

アスキーストア's 人気ランキング ベスト5

詳細解説　これがSandy Bridgeのアーキテクチャーだ

PC
Sandy Bridgeこと第2世代Core i7/i5/i3、ついに発表

自作PC
内蔵GPUの存在を大きく変える「Sandy Bridge」の性能とは？

PC
見えてきたSandy Bridgeの詳細　4つの特徴を解説

PC
IDF 2010でインテルの次の主役 Sandy Bridgeが披露

PC
インテル、第2世代Core i向けの映像配信サービス発表

自作PC
ついに登場！　新型Core i7/i5シリーズの価格をチェック

PCパーツ
自作ユーザー集結！　インテル新CPUが深夜に販売解禁！

PCパーツ
5万円で組むSandy Bridge自作PC

PCパーツ
10万円で組むSandy Bridge自作PC

PCパーツ
15万円で組むSandy Bridge自作PC

PC
チップセット問題が響くインテルモバイルCPUの現状

sponsored
パワフルな富士通「ESPRIMO DH70/CN」を買う4つの理由

PCパーツ
知ったかできるパーツ基礎知識【CPU/マザー/メモリ編】

自作PC
22nmプロセスのIvy BridgeはSandy Bridgeと何が違うのか？

PC
インテルが第3世代Coreプロセッサーを発表、29日に販売開始

PC
インテルCPU進化論細かく変わって性能向上Sandy Bridge

PCパーツ
Intel50周年、勤続30年のインテル常務が語る「Pentium M」と「Centrino」の思い出

アスキーストア's 人気ランキングベスト5