国産クラウドのチャレンジ!「IDCFクラウド」徹底解剖 第3回
500円クラウドは運用も手を抜かない
運用は任せろ!IDCFクラウドを支える若手エンジニアに聞いた
2015年09月29日 07時00分更新
クラウドといえば、仮想化や自動化が進んでいるイメージがあるが、実際の現場はエンジニアの不断の努力で支えられている。IDCフロンティアのクラウドを支える20代のインフラエンジニア2人に、障害対応や現場の工夫など快適なクラウド利用を実現する運用の実態について聞いた。(インタビュアー TECH.ASCII.jp 大谷イビサ、敬称略)
全国9ヶ所のデータセンターを都内で一元管理
アスキー大谷(以下、大谷):まずはお二人のプロフィールと現在の担当を教えてください。
IDCフロンティア 田村晋氏(以下、田村):2011年度に新入社員として入って、パブリッククラウドの設計・構築・運用を手がける部署に配属され、おもにサーバーやストレージの構築や運用を担当しています。大学は商学部でしたが、高専で情報工学をやっていて、サーバーとかいじるのが趣味だったので、今の仕事は向いていると思います。
IDCフロンティア 佐久間充氏(以下、佐久間):僕は2012年度の新入社員で、田村さんの1つ後輩です。入社当時は田村さんにトレーニング受けたりして、今はネットワークグループに所属しています。以来、クラウド内部や外部キャリアとつなぐネットワークやDDoS対策のサービスを担当しています。情報系の大学ではプログラミングをやっていたので、ネットワークはまだまだ勉強中です。大規模なネットワークなので、やりがいもありますが、一歩間違えば大変なことになるという緊張感はつねに感じながら仕事に取り組んでいます。
大谷:所属されているカスタマーサービス本部ではどんなことやっているんですか?
佐久間:運用全体ですね。本部の中にはお客様の問い合わせに対応するサポート部門や、僕たちのようなインフラ運用のプラットフォームサービス部、ネットワークイノベーション部があります。
大谷:IDCフロンティアは国内9ヶ所にデータセンターを持っていますが、現状はすべてリモートで管理しているんですか?
田村:そうですね。すべて新宿のオペレーションルームで管理しています。もちろん、各拠点にもオペレーションスタッフがいますので、現地の作業はそちらにお願いしています。
佐久間:ネットワークカメラでラック内の機器をリアルタイムで見ながら電話でスタッフに指示したりしています。
障害対応はとにかく「超特急」のスピード感で
大谷:日々、どんな感じの業務なんでしょうか?
田村:クラウド基盤の設計・構築・メンテナンスなんですが、その中でも特に重要な業務が障害対応です。24時間365日の体制で監視をしていて、障害が発生したら、深夜や早朝であっても即座に対応します。そのような障害を未然に防ぐために、通常はシステムが抱える課題を今後どうしていくか検討したり、サーバーの設定変更に対する適用などをやっています。パブリッククラウドは今、お客様が急速に増えているので、利用可能なリソースを需要に合わせて短期間で増設していくことも重要な業務のひとつです。
佐久間:僕はネットワーク運用と構築のほかに、DDoS対策サービスを担当しています。日常的にはそちらの対応のほうが多いかもしれません。IDCフロンティアでは自社のネットワークインフラを守るという点でのDDoS対策と、お客様にサービスとして提供しているDDoS対策の2種類があります。サイバー攻撃による不正なトラフィックの監視や検知、そして防御にいたるまで、目まぐるしく変わる攻撃パターンに日々対応しています。
大谷:実際の障害対応はどんな感じなんでしょうか?
佐久間:基本的にはオペレーションルームに常駐しているエンジニアが一次対応を行ない、彼らで対応できない場合はエスカレーションされて僕たちが対応します。
田村: 最近だとパブリッククラウドのストレージ容量がお客様の突発的な需要により急激にリソースが減ってしまうという事態になりました。そのときは緊急用の予備領域を開放し、ストレージ容量を増設して対処しましたが、とにかくスピード重視で対応しています。
佐久間:障害対応はとにかく超特急でやるのですが、障害の規模に関わらず20分以内のお客様への通知を目標としています。障害が起こると、ほかの作業は止めて最優先で対応するんです。
田村:まったく未知の事象だと、上のレイヤーと下のレイヤーから挟み撃ちにして、障害原因を切り分けていくこともありますね。ここは僕たちの腕の見せ所でもあります。また、単純なハードウェア故障であれば冗長化されているので切り替わるし機器の交換で済みますが、ファームウェアが怪しい場合は開発元の調査も必要となってくるので厄介ですね。
佐久間:ネットワークも基本はハードウェアで冗長構成がとられているので、障害時は切り替わってくれます。困るのは、エラーメッセージも出ないのに、いきなり通信に影響が出るサイレント障害ですね。気付くきっかけがないので、ここだけは対応が難しいです。
(次ページ、人を増やすよりもまずは現場の工夫で対処)
この連載の記事
-
第6回
ビジネス
地元密着型R&Dを手がけるIDCFの大屋氏が福岡で考えたこと -
第5回
データセンター
6号棟も着工!西国の雄を目指すIDCF北九州データセンター -
第4回
クラウド
安い、速い、シンプル!もつ鍋囲んでIDCFクラウドの魅力を語った -
第2回
クラウド
IDCFクラウドの「感動できるUI/UX」はこうして生まれた -
第1回
クラウド
これが僕らの生きる道!IDCFクラウドの真価を語り尽くした -
クラウド
国産クラウドのチャレンジ!「IDCFクラウド」徹底解剖 - この連載の一覧へ