3月23日、さくらインターネットは「さくらインターネット プレゼンツ メルカリ×はてなの夕べ~巨大サービスを支えるインフラ事情を語りつくす~」を開催。クラウド時代における物理サーバーをテーマにセッションやパネルを繰り広げた。
クラウドの特性を取り込んだ最新の専用サーバーサービス
クラウド全盛となった昨今、物理サーバーはなにかとレガシー扱いされがちだ。クラウドのように迅速にサーバーを調達するのも難しいし、障害も物理的な故障に直結してしまう。しかし、物理サーバーだからこそ実現できることもあるはずだし、実際その良さを理解して使っているユーザーも多い。そんなユーザーの生の声を聞き、物理サーバーの使いどころを再確認しようというのが、今回のイベントの趣旨になる。
冒頭、「クラウドノーマルの時代に物理サーバーを選択する意義」というタイトルで講演を行なったのが、さくらインターネットの加藤直人氏。加藤氏は同社で15年間、インフラ関係を担当しており、現在は「さくらの専用サーバ」のサービスを担当している。
現在、IT企業のインフラ担当は、クラウドでサーバーを調達するのが主流となりつつある。これに対して、物理サーバはほかのユーザーの影響を受けない安定したパフォーマンスが実現でき、物理パーツを使った柔軟なカスタマイズも可能だ。反面、クラウドに比べて、コスト高になる部分もありつつ、納期も長くなりがち。加藤氏は「クラウドの利用者からすると物理サーバーの導入はお手軽じゃないイメージがある」と語る。
しかし、最近はクラウドの特性を活かした物理サーバーのサービスが現れている。ベアメタルクラウドという言葉を広めたIBM Bluemix(Softlayer)、クラウド2.0を標榜してARMサーバーを展開するPacketなどのグローバル事業者のほか、IDCフロンティア、NTTコミュニケーションズなども物理サーバーサービスを提供している。「物理サーバーをクラウド上で提供するのは、業界でも流行ってきている」(加藤氏)というのも間違いではない。
これら最新の物理サーバーサービスは、すばやく必要なだけという「従量課金」や、物理サーバーを直接扱える「コントロールパネル」などのクラウド的な特徴を持ちつつ、物理サーバーならではの高いパフォーマンス、プライベートネットワークが用意されている。また、物理と仮想を併用できるサービスも増えており、両者のいいとこどりが可能になっている、そのため、ハイスペックが求められるデータベースサーバー、負荷が高く安定度を求められるシステムなどで物理サーバーでの利用は多いという。
オンプレ一辺倒の事例もサービス利用の流れへ
一方で物理サーバーにはデメリットもある。サーバーやパーツの故障はそのままサービス停止のリスクにつながるし、スペックアップにもサービス停止が伴う。また、複数台の構成の場合、費用は台数に比例することになる。「仮想のクラウド以上に比べて、気を遣うところも多い。クラウドに慣れている方からすると、がっかりしてしまうこともあるかもしれない」と加藤氏は語る。
リリースから5年を経たさくらの専用サーバは、最速10分で使える「クラウドの俊敏性」、コントロールパネルによる「セルフサービス」、クラウドとの連携を前提とした「スケールアウト」などの特徴を持つ。また、さくらのクラウドと専用サーバーを相互接続したハイブリッドでの利用も可能になり、スケールアウトとスケールアップなど用途にあわせて使い分けることができる。
こうしたさくらの専用サーバはHi-Matでの導入が発表されている。「こうしたスーパーコンピューター用途はもれなくオンプレミスでの利用だったが、Hi-Matの事例ではサービス利用という形に仕上げた」と加藤氏は語る。Xeon E5搭載のサーバーを1024台(!)用意し、カスタマイズとなる100GbpsのInfiniband EDRで相互を接続。全体で3万2768のコア、162TBのメモリを持つ強力な演算環境を構築し、それらを運用含めたサービスとして提供しているのが今回の事例の特筆すべきポイントと言える。
グローバルで事業者が異なるメルカリ、ハウジングから移すはてな
後半はモデレーターのさくらインターネット コミュニティマネージャーの法林浩之氏と加藤氏に加え、メルカリ プリンシパルエンジニアの長野雅広氏、はてなのシステムプラットフォーム部長の渡辺起氏などが登壇し、「なぜ専用サーバーを選んだのか」というテーマでパネルディスカッションが行なわれた。
メルカリの長野氏が所属しているSREチームは、名前の通りサイトの信頼性に関わることを担当するチームで、基本的にはインフラ系を見ているという。メルカリは現在、日本、米国、英国の3箇所でサービスを展開しているが、それぞれの3つの地域で使うクラウドを分けている。日本ではさくらインターネットの専用サーバだが、米国ではAWS、さらに英国ではGoogle Cloud Platformを採用する。地域ごとに異なるクラウドを利用しているのがユニークだ。
日本では専用サーバー中心にサービスを構成し、ioMemoryやNVMeなどの高いI/Oのパーツを数多く配置しつつ、適材適所でさくらのクラウドを利用している。専用サーバーとクラウドをハイブリッド接続して、使い分けている。「いわゆるマネージドサービスはあまり使っていない。なるべく同じようなコンピューターをそのまま使っている」(長野氏)とのことで、クラウド事業者のサービスに依存しない点がポイントと言える。
メルカリが国内でさくらの専用サーバを選定した理由に関しては、「メルカリを立ち上げたときにの担当が、AWSより、さくらのサービスの方が詳しかったからと聞いている」という。当初はVPSだったが、そのうちさくらのクラウドに移行。「ioMemoryのデータベースサーバーとしてさくらの専用サーバを使い始め、今はアプリケーションサーバーも移行しつつある」と長野氏は語る。他社と比べたメリットはやはり「コストとパフォーマンス」だった。
一方、渡辺氏が所属するはてなは、はてなブログやはてなブックマークのほか、監視サービスのMackarelなどを展開しているWebサービスの老舗。2007年からさくらのハウジングサービスを使っていたが、2011年のはてなブログのリリースを機にAWSを利用し始めているという。
現在、はてなはハウジングから専用サーバ・クラウドへの移行を進めており、こちらもハイブリッド接続を行なっている。両者ともリソースはほぼ仮想化しているものの、高性能が求められるデータベースやElastiSearchなどは物理サーバーをそのまま使っているという。
当初は自作サーバーのハウジングだったが、システムを作り直す際にさくらの専用サーバに移すことになった。導入のきっかけは、機材調達とネットワークのスピード。他社との比較すると「古いシステムからの移転しやすさ」が大きな鍵で、クラウドでメリットが出やすいバースト性よりコストパフォーマンスをとった結果として、さくらの専用サーバになったという。
物理サーバーを知らずに育った世代も台頭
続いてモデレーターの法林氏が専用サーバの使い勝手や性能面などについて聞く。今回登壇した長野氏は、「物理サーバーだと、なにやっているのか見えるというは安心感がある」と答えたが、最近はそもそも物理サーバーを知らない人も多い。
これについてメルカリの長野氏は、「SREチームに限ると、若い人はあまりいないので(笑)、前職などで使ったことがありますね。でも、新卒の開発メンバーは見たことないので、さくらさんの協力を得て、データセンターでサーバー見せてきました」と語る。
はてなの渡辺氏は、「開発の若いエンジニアの中では、サーバーを見たことないとか、SSHでログインしたことない人もいるはいます。逆にインフラ系詳しい若者は、まあまあいるなあと思っています」と語る。
続いて法林氏が専用サーバーの導入でよかったことを聞くと、渡辺氏は「ハードウェアの管理が必要ないので、楽させてもらっていると思います。昔にデータセンターに行って修正していたサーバーのファームウェアのアップデートを気にしないのはやはりうれしいなと」(渡辺氏)とコメント。長野氏は、「動き出してしまえば、楽だし、ストレージI/O周りも速い。ただ、動かすまではコンソールも若干重いし、5~10台のときはポチポチやらないといけない。やっぱりAPIがほしい」とリクエストを出す。
カリカリにチューニングできる物理サーバーのメリット
ベンチマークに関して聞くと、「レイテンシの部分だとAWSに比べて、当然ながら1桁くらい速い」(長野氏)という実感。コストや性能の比較対象はやはりAWSだったり、過去のベンチマーク履歴などになるという。気になる障害について、長野氏は「3年間くらいサーバーを運用しているが、圧倒的に安定している」とコメントする。ディスクのRAID化やSSDの導入でディスク自体が故障することも少なくなっており、サーバーより上位のシステムでの障害の方が大きいという。とはいえ、性能面で見ると、CPUとディスクI/Oのバランスをとるのが難しくなっているのも事実。「ほとんどの用途はSSDで満足するようになったが、データベースはあればあるだけI/O使うなあと感じます」(渡辺氏)。
クラウドサービス全盛期に物理サーバーを選択する理由とはなにか? やはり「パフォーマンスとコストから考えれば、物理サーバーを選択する意味はある」と長野氏は語る。使い分けとしては、バーストせず安定性が必要な場合は物理サーバー、複数のIPアドレスが必要なところ、スケールアウトさせる場合はクラウドや仮想サーバーという選択になるという。長野氏は、「うちのSREチームは人数が少ないので、サーバーの台数を減らしつつ、I/Oの高速化は今後も進めていきたい」とさくらへの要望を語る。
渡辺氏は、「物理サーバーを利用するのは、カリカリにチューニングしてパフォーマンスを最大限に引き出せるところ。リソースを使い切るところが、エンジニアとしての腕の見せ所」と語る。その上で、大容量ネットワークを迅速に提供してほしいという要望のほか、「ハードウェアをいじるのはなんだかんだ楽しいので、触れられるサービスを今後も用意してもらいたい」とさくらに期待を示した。
メルカリ、はてなの声を聞いたさくらの加藤氏は、「貴重なご意見ありがとうございます。物理ならではのパフォーマンスを得られる専用サーバー、GPUを直接利用できる高火力コンピューティングなども用意しているので、今後もお声を受けてサービスを進化していきたいです」と抱負を述べた。クラウドと異なった立ち位置で、どのような物理サーバーサービスに成長していくのか? 今後もさくらの物理サーバは進化を続ける。