cloudpack LIVEで「もはや24・365の監視だけじゃない」を見た
開発からデザイン、運用までクラウド利用を支えるcloudpack
2016年10月17日 07時00分更新
クリティカルなアラートが上がったらわれわれの負け
続いて登壇したcloudpack 構築/運用ディビジョンリーダーの石田知也氏は、MSPの中のSREについて語った。SREは「Service Reliability Engineer」の略でサービスを安定運用するためのエンジニアを意味する。cloudpackのSREチームは、システムの構築、運用保守に加え、継続的なサービスレベル向上を実現するためのDevOpsを担当しているという。
こうしたSREチームでは、「顧客満足度を最優先しつつ、サービスを絶対に落とさない」というミッションを掲げる。これを実現するため、チームはサービス全体に責任を持つ気負いで対応。「インフラの視界だけで見ていては、お客様のシステムの安定運用はできない。これがわれわれの理解」と石田氏は語る。
また、失敗をリカバリする手間は10倍かかるという教訓から、必要な手間は事前にかける。さらに自動化を徹底し、運用負荷を軽減し、作業のミスを防止する。たとえば、Jenkinsを用いて、インフラの状態をリアルタイムにSlackで通知したり、BOTで自動で環境準備を行なうといった取り組みを進めている。さらに負荷を予測して、アラート前に対応。「クリティカルなアラートが上がったら、われわれの負けだという気負いでやっている」と石田氏は語る。
こうした自動化や機械による予測を推進する一方で、エンジニアは本来人が行なうべき予測にフォーカスする。たとえば同社が担当している「Jリーグ.jp」では、対戦するチームの組み合わせや天気などを元にアクセスを予測している。動画配信などに対するバーストトラフィックへの対応はSREチームの得意分野で、前述したJリーグのほか、NHK紅白歌合戦、バーチャル高校野球などさまざまな事例があるという。
壇上にはcloudpackのユーザーで、TV局のインターネットサービス化を支援するプラットフォームを展開するHAROiD取締役 副社長の田中謙一郎氏が登壇。田中氏は、「クラウドネイティブのサービスを作っていくのに、マインドを共有できる。サービスのロードマップをいっしょに作れるのがバリュー。サービスの価値をいっしょに上げてけるのがSREチームのMPSの価値だと思う」とSREチームを高く評価しつつ、「いいか悪いかわからないけど、価値に対してサービスが安いくらい(笑)」と語った。
最後、石田氏はDevOpsやプロアクティブ監視を要件とした「次世代MSP」のコンピテンシーを取得したことをアピール。過去の事象やログ、運用手順を集約し、予防や自動化、新しい相関まで発見する次世代MSPを現在開発中で、来年までにサービス化までこぎつけたいと語る。
その後、イベントではデザインチームや構築チームの講演が行なわれ、毎日放送や近畿大学、One Tap BUYなどのユーザーもゲストとして登壇。「24時間365日のクラウド運用支援」というイメージのみならず、開発からデザインまで幅広く手がけるcloudpackの今の姿を、150名にのぼる参加者に披露した。