このページの本文へ

Sandy Bridgeこと新Core iシリーズが登場 第2回

詳細解説 これがSandy Bridgeのアーキテクチャーだ

2011年01月06日 11時30分更新

文● 大原雄介(http://www.yusuke-ohara.com/

  • この記事をはてなブックマークに追加
  • 本文印刷
図2

図2 Sandy BridgeのCPUコアの内部構造

 もうひとつの改良点である「Load/Store Addressのスループット強化」も説明しよう。図2を見ると、Port 2とPort 3の両方ともLoadとStore Addressとなっているが、Nehalem世代ではPort 2がLoad、Port 3がStore Addressとなっていた。つまりNehalem世代に比べると、同時に2つの128bit Loadか、2つの128bit Store Addressを発行することが可能になった。

 この強化の一義的な理由はAVXへの対応だ。これにより1サイクルでAVXレジスターのLoadあるいはSaveが可能になった。もちろんこれは非AVXな従来のx86命令、あるいはSSE命令でも効果的であり、これによるIPC※3の改善効果も期待できることになる。
※3 Instructions Per Cycleの略。1サイクル辺りの命令処理数で、命令実行効率を示す。

図4

図4 Nehalem世代のRe-Order Buffer~スケジューラー~ALU

図5

図5 Sandy BridgeのRe-Order Buffer~スケジューラー~ALU

 目立ちにくいかもしれないが、図4と図5でもうひとつ変わっている部分がある。従来までは、データのLoadなりSaveなりを行なうと、それが「Re-Order Buffer」に反映されていた。それがSandy Bridgeでは、すべて単一の「Physical Register File」に収められて、Re-Order Bufferはポインタ(データの位置情報)のみを格納する形に変更されている。これはSandy Bridgeの隠れた大きな変更点のひとつである。

 Nehalem世代までは、図6のように複数のバッファ(A/B/C)が、演算パイプラインと並行に用意されていた。例えば、あるデータを読み込んで演算を行なおうとした場合、以下のような動きになる。

図6

図6 Nehalem世代までのパイプラインとバッファ

  • ①メモリーコントローラーからキャッシュ経由で、Load Buffer(C)に読み込む。
  • ②Loadが完了したら、取り込んだ結果をRetirement Unitに戻す。その際にLoad Buffer(C)の内容をRegister File(A)にコピーする。
  • ③実際に演算するタイミングで、Register File(A)の内容をExecute Unit内のBuffer(B)にコピー。
  • ④Buffer(B)からデータを取り込んで演算する。値が変更されない場合はこれで終わりだが、書き換わった場合はその結果をBuffer(B)に書き戻す。
  • ⑤ ④で値が書き換わった場合、それをRegister File(A)に反映する。

 結果として、3つのバッファ間をデータが行き来しているわけだ。しかし、こうしたデータの移動には、当然余分な消費電力が掛かることになる。そこでSandy Bridgeでは、図7のような構造に内部を変更している。こちらの場合の手順はこうなる。

図7

図7 Sandy Bridgeのパイプラインとバッファ

  • ①データのロード用にRegister File(A)を割り当てて、その情報をポインタに格納。
  • ②格納した情報をメモリーコントローラーに通知。
  • ③通知されたRegister File(A)の場所にデータを読み込んで格納。
  • ④次の命令に合わせて、改めて場所をポインタに指定。
  • ⑤Execute Unitがポインタから場所の通知を受ける。
  • ⑥Register File(A)からデータを読み込んで演算を実行。
  • ⑦必要なら結果をRegister File(A)に書き戻す。

 この方式の場合、手順そのものは煩雑になる。また、従来ならそれぞれ(メモリーコントローラー/Execute/Retirement)のユニットの傍らにバッファを置けたが、Sandy BridgeではRegister File(A)の位置が各ユニットから遠くなるため、物理的な配線遅延が問題になりやすい。

 その反面、あくまでもポインタだけを管理すればいいので、データを書き換えるよりも消費電力が少なく済む。また結果として、必要とされるバッファの数が減るので、その分個々のバッファのエントリ数を増やせるといったメリットがある。

 実際Sandy BridgeとNehalemの各種バッファの数を比較すると以下のようになる。大雑把に比較して、Nehalemから3割程度は同時に保持できるデータ量を増やせるので、性能改善に効果的である。

Sandy Bridge Nehalem
Load Buffer 64 48
Store Buffer 36 32
Scheduler Entry 54 36
ROB(Re-Order Buffer) 168 128

 同様の技法は、省電力性が強く求められる組み込み向けプロセッサーなどでは、すでに採用例がある。また直近では、AMDのモバイル向けCPUコア「Bobcat」が、やはり同様の技法で省電力化を図ることを明らかにしている。だが、Sandy BridgeのようなハイパワーCPUで、この技法を採用した例を、筆者は他に知らない。

カテゴリートップへ

この連載の記事

ASCII倶楽部

注目ニュース

  • 角川アスキー総合研究所

プレミアム実機レビュー

ピックアップ
1
Anker PowerLine III Flow USB-C & USB-C ケーブル Anker絡まないケーブル 240W 結束バンド付き USB PD対応 シリコン素材採用 iPhone 17 / 16 / 15 / Galaxy iPad Pro MacBook Pro/Air 各種対応 (1.8m ミッドナイトブラック)
Anker PowerLine III Flow USB-C & USB-C ケーブル Anker絡まないケーブル 240W 結束バンド付き USB PD対応 シリコン素材採用 iPhone 17 / 16 / 15 / Galaxy iPad Pro MacBook Pro/Air 各種対応 (1.8m ミッドナイトブラック)
¥1,890
2
Anker USB Type C ケーブル PowerLine USB-C & USB-A 3.0 ケーブル iPhone 17 / 16 / 15 /Xperia/Galaxy/LG/iPad Pro/MacBook その他 Android 等 USB-C機器対応 テレワーク リモート 在宅勤務 0.9m ホワイト
Anker USB Type C ケーブル PowerLine USB-C & USB-A 3.0 ケーブル iPhone 17 / 16 / 15 /Xperia/Galaxy/LG/iPad Pro/MacBook その他 Android 等 USB-C機器対応 テレワーク リモート 在宅勤務 0.9m ホワイト
¥740
3
CIO フラットスパイラルケーブル CtoC 1m (Type-C/USB-C) PD 急速充電 平型 磁石 マグネット吸着 まとまる 充電ケーブル PD 240W データ転送 480Mbps (ライトブラック, 1m)
CIO フラットスパイラルケーブル CtoC 1m (Type-C/USB-C) PD 急速充電 平型 磁石 マグネット吸着 まとまる 充電ケーブル PD 240W データ転送 480Mbps (ライトブラック, 1m)
¥1,980
4
エレコム 電源タップ 6個口 3m 雷ガード 個別スイッチ ほこりシャッター付 耐熱 PSE技術基準適合 ブラック T-K6A-2630BK
エレコム 電源タップ 6個口 3m 雷ガード 個別スイッチ ほこりシャッター付 耐熱 PSE技術基準適合 ブラック T-K6A-2630BK
¥2,111
5
Anker iPhone充電ケーブル PowerLine II ライトニングケーブル MFi認証 超高耐久 iPhone 14 / 14 Pro Max / 14 Plus / 13 / 13 Pro / 12 / 11 / X/XS/XR / 8 Plus 各種対応 (0.9m ホワイト)
Anker iPhone充電ケーブル PowerLine II ライトニングケーブル MFi認証 超高耐久 iPhone 14 / 14 Pro Max / 14 Plus / 13 / 13 Pro / 12 / 11 / X/XS/XR / 8 Plus 各種対応 (0.9m ホワイト)
¥990
6
【Amazon.co.jp限定】 ロジクール 静音 ワイヤレス トラックボール マウス M575SPd Bluetooth Logibolt 無線 windows mac iPad OS Chrome トラックボールマウス ブラック M575 M575SP 国内正規品 ※Amazon.co.jp限定 壁紙ダウンロード付き
【Amazon.co.jp限定】 ロジクール 静音 ワイヤレス トラックボール マウス M575SPd Bluetooth Logibolt 無線 windows mac iPad OS Chrome トラックボールマウス ブラック M575 M575SP 国内正規品 ※Amazon.co.jp限定 壁紙ダウンロード付き
¥7,035
7
Verbatim バーベイタム 1回録画用 ブルーレイディスク BD-R 25GB 50枚+3枚増量パック インクジェットプリンタ対応 ホワイト 片面1層 1-6倍速
Verbatim バーベイタム 1回録画用 ブルーレイディスク BD-R 25GB 50枚+3枚増量パック インクジェットプリンタ対応 ホワイト 片面1層 1-6倍速
¥2,480
8
UGREEN USB Type Cケーブル PD対応 100W/5A 超急速充電 USB C ナイロン編み 断線防止 iphone17/16/15シリーズ/iPad/MacBook Pro/Galaxy S24/Matebook/iPad/Xperia等USB-C各種対応(1m, ブラック)
UGREEN USB Type Cケーブル PD対応 100W/5A 超急速充電 USB C ナイロン編み 断線防止 iphone17/16/15シリーズ/iPad/MacBook Pro/Galaxy S24/Matebook/iPad/Xperia等USB-C各種対応(1m, ブラック)
¥1,299
9
Amazon Kindle - 目に優しい、かさばらない、大きな画面で読みやすい、6週間持続バッテリー、6インチディスプレイ電子書籍リーダー、ブラック、16GB、広告なし
Amazon Kindle - 目に優しい、かさばらない、大きな画面で読みやすい、6週間持続バッテリー、6インチディスプレイ電子書籍リーダー、ブラック、16GB、広告なし
¥19,980
10
KIOXIA(キオクシア)【日本製】USBフラッシュメモリ 32GB USB2.0 国内サポート正規品 KLU202A032GL
KIOXIA(キオクシア)【日本製】USBフラッシュメモリ 32GB USB2.0 国内サポート正規品 KLU202A032GL
¥1,100

Amazonのアソシエイトとして、ASCII.jpは適格販売により収入を得ています。

デジタル用語辞典

ASCII.jpメール デジタルMac/iPodマガジン