このページの本文へ

前へ 1 2 次へ

ネットアップが考える失敗しないフラッシュ活用術 第2回

フラッシュへのデータ配置を手間なく最適化できる

HDDとフラッシュのいいとこ取り!「VST」の実力を検証する

2013年08月02日 09時00分更新

文● 大谷イビサ/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

Flash CacheとFlash Poolって本当に効果あるの?

 さて、ここまでの話でVSTの機能やメリットは理解してもらっただろう。とはいえ、果たしてVSTに効果があるのかという懐疑的に考えるユーザーも多いはずだ。そこで、以下ではネットアップの日本法人による独自検証を元にVSTの効果について見ていこう。詳細な結果については、ネットアップのテクニカルレポート「Oracleデータベース環境におけるNetAppバーチャルストレージティアの有効性と次世代統合インフラの実現」を参照してもらいたい。

 この検証では、シスコとHPのx86サーバー上にOracle DBのシステムを構築し、データベース本体をネットアップのストレージに格納するという構成で行なわれている。コントローラーのFAS3270Eには512GBのFlash Cache、ディスクシェルフのDS4243には100GBのSSD×12、2TB SATA HDD×12がそれぞれ搭載されている。ディスクシェルフのSSDとHDDはそれぞれRAIDグループが構成されており、Flash Poolとして利用できる。

 検証ではこの環境において、①VSTを使用しないでHDDのみで使用した場合、②Flash Cacheを①の構成に使用した場合、③Flash Poolを①の構成に使用した場合、の3つの構成に対して同じ負荷をかけ、性能とリソース使用率を調べた。検証においては、読み出しのみのトランザクション(TX1)、読み出しと書き込みを混在させたトランザクション(TX2)を用意した。

 まず、オンラインショッピングサイトでのOLTP系のワークロードを想定し、ユーザー数を100から1600まで増加させた検証を見ていこう。ここではトランザクションはTX1とTX2を50%ずつとし、キャッシュ領域はウォームアップを済ませ、キャッシュヒット率を100%に挙げておいた。以下がその結果だ。

ユーザ数の増加に伴うスループットの傾向

 HDDオンリーの場合、100ユーザーの時点で性能が頭打ちとなっている。HDDがボトルネックになっているため、ユーザー数を増やしてもスループットは上がらないのが見て取れる。一方、Flash CacheとFlash Poolではユーザー数を増加した場合にもきちんとスループットが増加している。

 次にHDDとSSDの使用率を見てみよう。HDDのみの構成ではそもそも100ユーザーで100%に達している。しかし、Flash Cacheを使用した場合では、800ユーザーの時点でHDD使用率が100%に達した。読み出しを効率化するFlash Cacheを用いることで、HDDのみの場合に比べて、はるかに多くのユーザー数をカバーできることがわかる。

ユーザー数の増加に伴うHDD、SSD使用率の傾向

 一方、Flash Poolを使用した構成ではHDD使用率が大きく減少し、SSDの使用率が増加した。読み込みキャッシュのFlash Cacheに対し、Flash Poolは書き込みまでキャッシュできる。そのため、SSDが書き込みキャッシュとして活用され、書き込み処理の負荷がHDDからSSDにオフロードされたことがわかる。

 テクニカルレポートでは、書き込みの比率を増加させたり、キャッシュヒット率を90%に下げた場合の性能やリソース使用率の傾向を見ているので、興味がある方は参照してもらいたい。

Flash Poolの活用でデータベースを統合できる?

 Flash Poolの検証においては、書き込み処理がHDDからSSDにオフロードされたことで、HDDの使用率が減少したことがわかった。この使用率の下がったHDDを有効活用すべく、別のデータベースまで統合してしまおうというシナリオが次の検証だ。

 検証環境は、Flash Pool構成のアグリゲート上に3つのOLTP系データベースシステム、1つのDWH/BI(DataWare House/Business Intellignce)系データベースのシステムを構築した。このDWH/BI系のデータベースシステムが他のシステムから移行してきたという仮定である。

OLTP系DBとDWH/BI系DBの統合

 検証では、3つのOLTP系データベースに読み出しメインの負荷をかけつつ、一定時間が過ぎた後にDWH/BI系のデータベースに大規模な表のフルスキャンをSQLで行なった。以下の結果を見れば、DWH/BI系のSQLを実行中もOLTP系データベースのスループットがまったく落ちていないことがわかる。同じアグリゲート内に各データベースの構成ファイルが同居しているにもかかわらず、他のデータベースに影響を与えていないわけだ。

OLTP系データベースシステムのスループット合計値の推移

ストレージ リソース使⽤率の推移

 こうした芸当が可能になったのも、DWH/BI系のデータベースをフルスキャンする場合に、HDDからシーケンシャルリードしているからにほかならない。リソースを複数のデータベースに分散した上で、ランダムな読み出しをフラッシュに任せ、シーケンシャルリードをHDDで担うことで、異なるデータベースを効率的に統合できたわけだ。ランダム、シーケンシャルそれぞれ得意とするドライブにまかせる、それをData ONTAPが自動的に振り分けてくれるのである。テクニカルレポートでは、サーバー側のキャッシュを併用することで、ストレージ側の負荷を軽減させる事例も載っており、こちらも興味深い。

 ●

 さて、今回はフラッシュとHDDのハイブリッド環境を最適化するVSTの技術や効能について見てきた。次回は、オールフラッシュストレージがどのような場面で活きるのかが大きなテーマだ。

■関連サイト

(提供:ネットアップ)

前へ 1 2 次へ

カテゴリートップへ

この連載の記事