このページの本文へ

国内にデータを保持したままBigQueryで大規模データ処理が可能に

みずほ銀行、東京GCPリージョンで提供開始したBigQueryを使ってみた

2018年04月19日 08時00分更新

文● 羽野三千世/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

 Googleは2018年4月18日、Google Cloud Platform(GCP)の東京リージョンで、データウェアハウス(DWH)サービス「BigQuery」の提供を開始した。データを国内に保持したまま、大規模データを高速に処理できるようになる。

東京GCPリージョンで「BigQuery」の提供を開始

 GCPのリージョン数は、現在提供中のものが15リージョン、建設中のものが4リージョンある。国内では2016年11月に東京リージョンの提供を開始した。また、2019年中に大阪リージョンが開設される予定になっている。

GCPリージョン

 今回、東京リージョンでDWHサービスのBigQueryが利用可能になった。東京リージョンを指定してBigQueryを利用する場合、BigQueryのストレージ、エンジン、分析処理に使用するコンピュータリソースはすべて東京リージョンのものになる。

 Google Cloud カスタマーエンジニアの寳野雄太氏は、BigQueryをコアにしたデータ分析システムの例として、オブジェクトストレージ「Google Cloud Storage」に保管した非構造化データを、データクレンジングサービス「Cloud Dataprep」で加工し、BigQueryに投入、分析結果をBIツール「Google Data Studio」で可視化するシナリオを提示し、「東京リージョンのGoogle Cloud Storageから東京リージョンのBigQueryへ投入すれば、データを国内にとどめたまま大規模データを高速に処理できる。BigQueryは10億行のアクセスログを2~3秒で解析する」と説明した。

BigQueryをコアにしたデータ分析システムの例

分析コストを1/3~1/4できる試算

 先行して、野村総合研究所、NTTコミュニケーションズ、LIXIL、リクルートテクノロジーズ、ソフトバンク、みずほ銀行、アスクルなどがアルファテストで東京リージョンのBigQueryを利用した。

東京リージョンのBigQueryを先行利用した企業

 みずほ銀行は、2018年3月に、個人顧客向けのマーケティング部門でBigQuery活用のPOCを実施した。みずほ銀行では、個人・法人向けのサービス開発やマーケティング、リスク管理、コンプライアンスのための不正検知、サイバーセキュリティ対策など全社的にデータ活用を行っており、オンプレミス環境に1000人規模の社員が利用するDWHを持っている。一方で、拡張性や外部データとの連携、クラウドAI活用の観点から、将来的にデータ分析基盤をパブリッククラウドへ移行することを検討しており、現在、各社のパブリッククラウドの検証を進めている。

 今回のアルファテストへの参加は、「個人マーケティング領域のデータ分析基盤としてBigQueryを試験的に使ってみようということでGoogleに相談したら、ちょうどそのタイミングで、BigQueryが東京リージョンにくるのでアルファユーザーを募集していると言われ、参加した」(みずほ銀行 個人マーケティング推進部 参事役 シニアマネージャーの黒須義一氏)との経緯であり、特に法令などで国内に保持する必要があるデータを扱う予定はなかった。ただし、「パブリッククラウド利用について社内で理解を得るためには、国内リージョンでデータを扱えるほうが望ましかった」と黒須氏は説明した。

みずほ銀行 個人マーケティング推進部 参事役 シニアマネージャーの黒須義一氏

 みずほ銀行のPOCでは、社内システムからGoogle Cloud Storageにデータを手動コピーし、(1)Google Cloud StorageからBigQueryへデータ投入して処理する際の性能と(2)GCP上のETLサーバーで加工したデータをデータベースからBigQueryへSQLバッチでデータ投入して処理する際の性能について検証した。(3)Cloud Dataprepの機能と使い勝手も検証項目に含めた。

みずほ銀行のPOC

 みずほ銀行 IT・システム統括第一部 戦略情報基盤システム推進チーム 調査役の家村育民氏は、検証結果から、情報システム部門側としてBigQueryの一番のメリットと感じたのは「データ処理の並列度を上げてもパフォーマンスが低下しない点だった」と話す。「今後、データ量とDWH利用者が増加するにつれて処理の並列度は増えていく。ここでBigQueryはよい選択肢になる」(家村氏)。

BigQueryはデータ処理の並列度を上げてもパフォーマンスが低下しない

 ユーザー部門側の立場で、今回の検証結果について黒須氏は、「BigQueryはプログラミング不要、Dataprepを使えばユーザー部門がセルフでデータ準備ができることが実証できた。ユーザー部門はデータ分析に集中できる」と述べた。BigQueryを使うことでデータ分析にかかるコストは、現行の3分の1から4分の1に削減できると試算する。「オンプレミスのデータ分析基盤では、計算リソースの上限に合わせた働き方になる。一方、BigQueryでは計算リソースの上限から解放され業務を並列化できるので、働き方改革にもつながる」(黒須氏)。

 今後、みずほ銀行がBigQueryを実導入するかどうかは未定だが、「(データ分析基盤が)オンプレミスのままになることないだろう」(黒須氏)。

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

アクセスランキング

  1. 1位

    TECH

    訓練だとわかっていても「緊張で脇汗をかいた」 LINEヤフー、初のランサムウェア訓練からの学び

  2. 2位

    ITトピック

    若手が言わない“本音の退職理由”上位は/「データ停止は景気後退よりも企業の脅威」6割/クライアントに告げずAI活用するフリーランス、ほか

  3. 3位

    ビジネス・開発

    最悪のシナリオは「フィジカルAI」による基幹産業の衰退 日本の勝ち筋は、“同期技術”と“ドメイン知識”

  4. 4位

    Team Leaders

    ファイル名が命名規則に合っているかの自動チェック、Power Automateのフローで実現しよう

  5. 5位

    TECH

    “GPUなし”ノートPCで動くLLMで、ローカルAIエージェントを自作する

  6. 6位

    TECH

    糖尿病超早期を採血なしで検出、予防へ! 代謝や臓器のつながりに着目した予防法開発

  7. 7位

    ビジネス

    廃校がAIの心臓部に!? 地方の遊休施設を「AIデータセンター」に生まれ変わらせるハイレゾの挑戦がアツいぞ

  8. 8位

    データセンター

    液冷技術の最先端が集うイノベーションラボ「DRIL」、印西のデータセンターに現わる

  9. 9位

    TECH

    業界横断で“サイバー攻撃から供給網を死守” NTT・アサヒ・トライアルらが「流通ISAC」始動

  10. 10位

    Team Leaders

    バックオフィス業務もAIに“丸投げ” マネーフォワードが「Cowork」機能を2026年7月に投入へ

集計期間:
2026年04月08日~2026年04月14日
  • 角川アスキー総合研究所