このページの本文へ

ブレードサーバの楽しみ方(その2)

2003年07月31日 23時02分更新

文● 渡邉 利和

  • この記事をはてなブックマークに追加
  • 本文印刷

■シェルフの特徴

ブレードサーバ全体のイメージ。左端の取っ手に「BLADE 0」の表示が確認できる。上部左端にはシェルフの状態を示すインジケータがあり、さらに2~15までのブレード番号が明示される。ブレード側も、ハンドル上部に3つのインジケータ(上から、脱着可、障害発生、通電中、を示す)がある。ブレードのハンドル下部は、汎用ブレードがオレンジ、スペシャリティブレードが水色に色分けされる。写真ではBLADE12~15の4つがスペシャリティブレードだ。
汎用ブレードのイメージ。ブレードは全体がカバーで厳重に覆われ、内部の部品は見えない。ハンドル裏のスリットから吸気し、背面のコネクタ部から排気する。

 今回は前回にひき続き、ブレードに対して設置のためのスロットを提供している、シェルフ(エンクロージャ)について見ていこう。
 B1600は、型番からも想像できるとおり、ブレード用に16スロットを備えたエンクロージャだが、Sunではこれを「インテリジェントシェルフ」と呼んでいる。インテリジェントという理由は、当然ながらB1600が単なるスロットの集合ではなく、高度な制御機能を持ち、最低限のパーツしか備えないブレードを独立したサーバとして動作/運用させるために必要な機能を提供するからだ。

 B1600の筐体は、実際のところ各コンポーネントを接続し、支えるための“ドンガラ”に電源ユニットとスイッチ/システムコントローラユニットが組み合わされて構成されている。電源ユニットは文字通りの電源で、標準で2台セットされて冗長構成が採られている。スイッチ/システムコントローラユニットも最大2台を内蔵することが可能だが、標準では1台となっている。

 スイッチ/システムコントローラユニットは、背面から見るとネットワークポートがまず目に入る。これが「スイッチ」であり、Gigabit Ethernetスイッチとなっている。背面に用意されているのは、ユニット単体のステータス表示用のインジケータ、8ポートのEthernetコネクタ、2つの管理用ポート(シリアル×1、Ethernet×1)である。ブレードを最大16個搭載できることから考えて、背面のEthernetポートが8個なのはどういうことかと思われるかもしれないが、これは、各ブレードごとのネットワークポートというわけではない。スイッチ/システムコントローラユニットは、内部的には24ポートのGigabit Ethernetスイッチングハブである。24ポートのうち、16ポートがブレードの接続に利用され、残る8ポートが背面に配置されている。ブレードサーバ全体をネットワークに接続する場合で、最低で1本のEthernetケーブルを背面のコネクタに接続するだけで全16ブレードが同時に繋がるということだ。残るポートは、他のネットワーク機器と相互接続したり、あるいは帯域を確保するために並列接続したりといった使い方ができる。さらに、スイッチ/システムコントローラユニットを2台搭載した場合は、各ブレードに対して2系統のEthernet接続が行なわれることになる。



シェルフの上にブレードとスイッチ/システムコントローラユニットを置いて真横から見たところ。ブレードの奥行きは意外に大きい。両者のホンのわずかな隙間のところには、コネクタとバックプレーンボードがはさまる。
電源ユニットとスイッチ/システムコントローラユニットのコネクタ部分が見える
背面。スイッチ/システムコントローラユニットと右側の電源ユニットを外してシェルフの上に積み上げてある。電源ユニットが入る開口部(右下)はバッフルボードで塞がれている。脱着用のレバーについた大きなリングは、ケーブルを通してまとめておくためのもの。絡み/外れを防止する。
電源ユニット上面に貼られた警告。交換は10分以内にと指定されている。電源ユニットが故障した場合も冷却ファンは動作可能なため、電源ユニットが故障した場合も、代替品が到着するまでは故障したユニットを挿したままにしておき、代替品が到着したら引き抜いて、10分以内に代替品を挿入する、という手順になる。
スイッチ/システムコントローラユニットの背面。ネットワーク接続用のEthernetポートが8ポートと、システム管理用のコンソールポートがシリアルとEthernet各1用意されている。
ブレード用のスロットの様子。シェルフとフレー度はコネクタ1つで接続される。

 電源に関しても、単に2重化してある、というだけに留まらない工夫が行なわれている。ブレードサーバの弱点の1つに、熱対策がある。何しろ高密度実装であるため、発生する熱量も大きい。これを適切に放熱しないとトラブルに繋がることは容易に想像できる。2台の電源ユニットはシステム冷却用のファンも兼ねているが、電源は故障する可能性もある。万一の故障に備え、実は電源ユニットとファンは独立性を高めた設計となっており、一方の電源ユニットの冷却ファンをもう1基の電源ユニットからの給電で回転させることができるようになっているという。つまり、電源ユニットが故障した場合でも、冷却ファンが回転可能な状態にあるのであれば、残った電源ユニットからの給電によって冷却能力を維持することが可能なのだ。そして、筐体側の工夫としては、電源ユニットを引き抜いたときに生じる開口部を塞ぐためのバッフルボードの装備が興味深い。仕掛けとしてはバネ仕掛けの単なる板であり、ローテクな仕掛けである。電源ユニットを差し込む際には自然と筐体壁面に押しつけられるため邪魔にならず、電源ユニットを引き抜いた際にはバネの力で開口部を塞ぐ。運用中に電源ユニットを交換する場合、電源ユニットを引き抜いてしまった際にできる開口部が空気の抜け道になってしまい、冷却に必要な筐体内部の空気の流れが阻害されることを防ぐために備えられているものだ。なお、電源ユニットの交換は10分以内に終了するよう指定されているのも、冷却能力の低下による悪影響を回避するためで、熱対策が重大な問題であることを示している。

 このようにシェルフの機能を見てみると、各種インターフェイスの提供や電源供給、熱対策など、本来的なサーバとしての要素の多くが作り込まれ、実態としてはサーバそのものといった構造になっていることが分かる。ブレードは単体サーバとして動作すると言っても、それだけでは何もできないCPU/メモリ/HDDモジュールに過ぎないと言ってもよいほどだ。

 このほか、ブレードサーバでは、ブレードの抜き差しなどの作業が多いと想像されるためか、今回発表になったB1600やブレードサーバでは、特に設置や日常のメンテナンス作業などに配慮した設計もいろいろ工夫されている。電源ユニット、スイッチ/システムコントローラユニットはいずれも抜き差しの際に使う頑丈な取っ手が付けられた上に、筐体側にはロックを兼ねたテコ状のレバーが付けられている。ユニットを脱着する際にはこのレバーを確実に操作しないとユニットが抜けないため、外れてはいけないユニットを間違って外してしまう、といった事故への防止策となっている。また、各ユニットには統一された形式のインジケータが付けられており、障害を起こしたユニットを見分けるのも簡単だ。この配慮はブレードについても同様で、ブレードを抜くときには下部のプラスチックのラッチを起こしてロックを解除し、次いで取っ手状のレバーを起こすことでスロットから引き抜くようになっており、単に取っ手を引っ張っただけで外れてしまうことはない。また、シェルフ自体をラックから引き抜く際に使用するための取っ手も付いており、しかも角が丸められたプラスチック部品なので怪我をする可能性はまずない。しかも、正面から見て左側の取っ手には「BLADE 0」という文字が印字してある。これは、正面から見て左端のブレードが0番で、以降右に向かって1~15番まで並んでいることを示している。各ブレードの上部にはそれぞれ番号が記してあるが、左側2スロットは、上部にシェルフの状態表示用のインジケータがあるため、番号を記すスペースがないためこのようになっている。番号が0から始まるか1から始まるかというのは、コンピュータではあちこちで顔を出す問題だが、コンソールの画面で「ブレード1に障害」と表示された際に、左端のブレードなのか左から2番目のブレードなのかをうっかり間違うことがないようにわざわざ明示されたのだという。

カテゴリートップへ

アスキー・ビジネスセレクション

ASCII.jp ビジネスヘッドライン

ピックアップ