フラッシュへのデータ配置を手間なく最適化できる
HDDとフラッシュのいいとこ取り!「VST」の実力を検証する
2013年08月02日 09時00分更新
Flash CacheとFlash Poolって本当に効果あるの?
さて、ここまでの話でVSTの機能やメリットは理解してもらっただろう。とはいえ、果たしてVSTに効果があるのかという懐疑的に考えるユーザーも多いはずだ。そこで、以下ではネットアップの日本法人による独自検証を元にVSTの効果について見ていこう。詳細な結果については、ネットアップのテクニカルレポート「Oracleデータベース環境におけるNetAppバーチャルストレージティアの有効性と次世代統合インフラの実現」を参照してもらいたい。
この検証では、シスコとHPのx86サーバー上にOracle DBのシステムを構築し、データベース本体をネットアップのストレージに格納するという構成で行なわれている。コントローラーのFAS3270Eには512GBのFlash Cache、ディスクシェルフのDS4243には100GBのSSD×12、2TB SATA HDD×12がそれぞれ搭載されている。ディスクシェルフのSSDとHDDはそれぞれRAIDグループが構成されており、Flash Poolとして利用できる。
検証ではこの環境において、①VSTを使用しないでHDDのみで使用した場合、②Flash Cacheを①の構成に使用した場合、③Flash Poolを①の構成に使用した場合、の3つの構成に対して同じ負荷をかけ、性能とリソース使用率を調べた。検証においては、読み出しのみのトランザクション(TX1)、読み出しと書き込みを混在させたトランザクション(TX2)を用意した。
まず、オンラインショッピングサイトでのOLTP系のワークロードを想定し、ユーザー数を100から1600まで増加させた検証を見ていこう。ここではトランザクションはTX1とTX2を50%ずつとし、キャッシュ領域はウォームアップを済ませ、キャッシュヒット率を100%に挙げておいた。以下がその結果だ。
HDDオンリーの場合、100ユーザーの時点で性能が頭打ちとなっている。HDDがボトルネックになっているため、ユーザー数を増やしてもスループットは上がらないのが見て取れる。一方、Flash CacheとFlash Poolではユーザー数を増加した場合にもきちんとスループットが増加している。
次にHDDとSSDの使用率を見てみよう。HDDのみの構成ではそもそも100ユーザーで100%に達している。しかし、Flash Cacheを使用した場合では、800ユーザーの時点でHDD使用率が100%に達した。読み出しを効率化するFlash Cacheを用いることで、HDDのみの場合に比べて、はるかに多くのユーザー数をカバーできることがわかる。
一方、Flash Poolを使用した構成ではHDD使用率が大きく減少し、SSDの使用率が増加した。読み込みキャッシュのFlash Cacheに対し、Flash Poolは書き込みまでキャッシュできる。そのため、SSDが書き込みキャッシュとして活用され、書き込み処理の負荷がHDDからSSDにオフロードされたことがわかる。
テクニカルレポートでは、書き込みの比率を増加させたり、キャッシュヒット率を90%に下げた場合の性能やリソース使用率の傾向を見ているので、興味がある方は参照してもらいたい。
Flash Poolの活用でデータベースを統合できる?
Flash Poolの検証においては、書き込み処理がHDDからSSDにオフロードされたことで、HDDの使用率が減少したことがわかった。この使用率の下がったHDDを有効活用すべく、別のデータベースまで統合してしまおうというシナリオが次の検証だ。
検証環境は、Flash Pool構成のアグリゲート上に3つのOLTP系データベースシステム、1つのDWH/BI(DataWare House/Business Intellignce)系データベースのシステムを構築した。このDWH/BI系のデータベースシステムが他のシステムから移行してきたという仮定である。
検証では、3つのOLTP系データベースに読み出しメインの負荷をかけつつ、一定時間が過ぎた後にDWH/BI系のデータベースに大規模な表のフルスキャンをSQLで行なった。以下の結果を見れば、DWH/BI系のSQLを実行中もOLTP系データベースのスループットがまったく落ちていないことがわかる。同じアグリゲート内に各データベースの構成ファイルが同居しているにもかかわらず、他のデータベースに影響を与えていないわけだ。
こうした芸当が可能になったのも、DWH/BI系のデータベースをフルスキャンする場合に、HDDからシーケンシャルリードしているからにほかならない。リソースを複数のデータベースに分散した上で、ランダムな読み出しをフラッシュに任せ、シーケンシャルリードをHDDで担うことで、異なるデータベースを効率的に統合できたわけだ。ランダム、シーケンシャルそれぞれ得意とするドライブにまかせる、それをData ONTAPが自動的に振り分けてくれるのである。テクニカルレポートでは、サーバー側のキャッシュを併用することで、ストレージ側の負荷を軽減させる事例も載っており、こちらも興味深い。
●
さて、今回はフラッシュとHDDのハイブリッド環境を最適化するVSTの技術や効能について見てきた。次回は、オールフラッシュストレージがどのような場面で活きるのかが大きなテーマだ。
(提供:ネットアップ)
この連載の記事
-
第3回
サーバー・ストレージ
性能だけでOK?オールフラッシュアレイの存在価値を考える -
第1回
サーバー・ストレージ
万能デバイスって本当?フラッシュにまつわる5つの誤解を解消 -
サーバー・ストレージ
ネットアップが考える失敗しないフラッシュ活用術 - この連載の一覧へ