このページの本文へ

前へ 1 2 次へ

オンプレミスVMware環境から、意識を変え、工夫を凝らしてGKE化・マネージドDB化

スクエニのゲーム基盤、試行錯誤重ねた“数百台のアプリ”のGoogle Cloud移設

2025年03月12日 08時00分更新

文● 福澤陽介/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

Cloud SQL編:マネージドDB化における構成見直しでコスト最適化

 データベースに関しては、フルマネージドなデータベース「Cloud SQL」への移設を進めている。その経緯やマネージドDB化で苦労した点を語ったのは伊賀一貴氏だ。

 当初、移設先を検討していた際には、Spannerはアプリケーションの書き換えが発生すること、Cloud SQLは計画メンテナンスの停止期間が懸念となり、「GCE(Google Compute Engine) MySQL」の採用を決定していたという。しかし、2023年に「Cloud SQL Enterprise Plus」のエディションが登場したことでCloud SQLに方向転換。2025年内には全データベースが移設完了する予定だ。

スクウェア・エニックス カスタマーエクスペリエンスデザインセンター オンラインビジネス推進ディビジョン(プラットフォーム開発グループ) SRE 伊賀一貴氏

 決め手となったのは、Cloud SQL Enterprise Plusかつ“HA構成”時に、計画メンテナンスのダウンタイムが「ほぼゼロ(Near zero downtime)」になることだ。伊賀氏は、「実測だと0.5秒程度で接続回復する。サービスに影響なくメンテナンスができる強力な機能」と説明する。Near zero downtimeの対象となるのは、障害時や定期メンテナンス時、そして、スケールアップ・スケールダウンにおいても構成変更が可能になる。

Near zero downtimeの対象

 こうして開始されたCloud SQLへの移設。完全MySQL互換なためアプリケーションの変更は不要で、性能も申し分ない。「性能要件が厳しい」(伊賀氏)という同社の負荷試験にも一発クリアして、CPU使用率にも優位性があったという。「Database Migration Service」を利用することで一対一の移行も容易であった。

 もちろん、順調なことばかりではなかった。「良いものは高いというのが世の常」(伊賀氏)で、高性能ゆえにコストは高くついた。HA構成は、アクティブ・スタンバイなため、2つのインスタンス分のコストも生じる。すべてEnterprise Plusで試算すると、従来の1.5から2倍となり、構成を再検討せざるを得なかったという。

コストの面で構成を変更

 まずは、データベースの用途に応じて、エディションやHA構成を見直した。PrimaryはそのままEnterprise PlusかつHA構成に、数分の停止が許容できるリードレプリカ(Read Replica)はEnterpriseかつHAなしと、エディションが混在する構成に変更。スペックに関しても、Enterprise PlusはCPU性能が高いため、core数を従来の半分に、半分になったメモリは「Data cache」というEnterprise Plusの機能でカバーした。ストレージを、自動拡張に任せて容量ぎりぎりで運用することも、効果的だったという。

スペックの全体的な見直し

 このData cacheとは、コストパフォーマンスが高いLocal SSDがベースとなる、buffer poolの2次キャッシュである。最低375GB以上と大容量であり、かつ永続SDDと比べても最大3倍高速という特徴を持つ。「OSメモリが最速なため、サービスの設計や要件に応じて検討する必要があるが、メモリの部分をData cacheにメモリに任せることでコスト最適化につながる」と伊賀氏。

Data cacheとは

 また、Cloud SQLへの移設にあわせて、DB集約もした。これは、Enterprise Plusが、「障害から自動復旧して、Near zero downtimeのオペレーションが多いからこそ」(伊賀氏)踏み切れたという。具体的には、小規模・中規模のデータベースを、MySQL native replicationでGCE relay slaveにまとめ、Database Migration ServiceでひとつのCloud SQLインスタンスに移行するという方法をとっている。現在進行中であり、サーバー台数の削減とCUD(確約利用割引)適用によって大幅なコスト最適化が見込まれるという。

DBの集約でさらなるコスト最適化

 最後に伊賀氏は、今後期待するアップデートとして、「障害時のbuffer pool warmup」「Near zero downtimeのメジャーバージョンアップグレードへの対応」「Retry実装不要なManaged Proxy / Connection pool」を挙げている。

前へ 1 2 次へ

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

アクセスランキング

  1. 1位

    トピックス

    “持たない家電”ランキング、もはや定番のアレがやっぱり1位なような

  2. 2位

    トピックス

    思い切った慶應義塾 全教職員にNotion導入で168年分の知的資産をAIに食わせるプロジェクトが始動

  3. 3位

    ビジネス・開発

    こんどは“市区町村の財政状況”が丸わかり デジタル庁「ジャパン・ダッシュボード」に地方財政データ追加

  4. 4位

    トピックス

    リモートワークは福利厚生なの? ITエンジニアが本当に欲しい福利厚生第1位となる

  5. 5位

    ITトピック

    管理職ほど機密情報をAIに入力している実態、なぜ?/27卒学生の就職人気、IT業界トップ企業は/最新インシデントの傾向10パターンまとめ、ほか

  6. 6位

    トピックス

    ほぼスーパーで良くない? コンビニで「思ったより高い」と感じる人76%、実は中高年ほど割高感に悩んでるって知ってた?

  7. 7位

    トピックス

    若い人ほど「しっかり睡眠」、中高年は眠れないのか眠らないのか

  8. 8位

    トピックス

    インバウンドの頑張りランキングベスト3は「大分県」「岐阜県」「佐賀県」 努力が光る結果に

  9. 9位

    トピックス

    【無双状態】2025年、最も雑誌の表紙を飾ったのは「えなこ」! 1万誌を調査して見えた圧倒的カバークイーン

  10. 10位

    ビジネス

    管理職こそ大事にしないとまずくないか? 約4割が「続けたい、と答えない」現実

集計期間:
2026年04月21日~2026年04月27日
  • 角川アスキー総合研究所