高速かつ低コストなデータ利活用基盤をAWS上で構築可能な日立の超高速データベースエンジンHADBのベストプラクティス構成を提供
株式会社 日立製作所
製造工程をモデル化したベンチマークにおいて、クラウドの一般的なDBサービスに比べ7倍以上の処理速度を達成
株式会社日立製作所(以下、日立)は、高速かつ低コストなデータ利活用基盤をアマゾン ウェブ サービス(以下、AWS)上で構築可能な超高速データベースエンジン「Hitachi Advanced Data Binder*1」 (以下、HADB)のベストプラクティス構成(検証済みのシステム構成)を本日から提供開始します。
日立は、このベストプラクティス構成において、製造業などで用いられる4M*2の構成要素から製造工程をモデル化したベンチマークである4mbench*3による評価を実施し、クラウド上の一般的なデータ分析用DBサービスと比較して、7倍以上の処理速度を達成できることを確認しました。本ベストプラクティス構成を活用することで、データ利活用基盤のシステム検討期間を短縮できるうえ、クラウドの一般的なDBサービスよりも、利用料金を低減できます。これにより、製造・流通のトレーサビリティなど、多種多様で大量なデータを多角的に分析するための高速なデータ利活用基盤を低コストで利用可能です。
社会の不確実性が高まる中、多くの企業では、日々発生する現場のデータを活用したビジネスの意思決定の迅速化やデータ分析の詳細化などの取り組みが活発化しています。そのため近年では、複数拠点のデータを統合できるデータ利活用基盤をクラウドを利用して構築するケースも増えており、そのデータ利活用基盤には、大量のデータを高速に処理できるための性能と、大量のデータを蓄積するためのクラウドストレージの利用コストを抑えることが求められています。
これまで日立は、大量データの複雑な分析の高速化に適した「非順序型実行原理」*4を実装したHADBを製造・流通、金融、社会、公共分野などに導入するとともに、お客さまのニーズをもとに、発生データのリアルタイムでの取り込みやAWSなどのクラウド対応など、順次強化してきました。今回提供を開始するベストプラクティス構成では、Amazon Elastic Block Store(Amazon EBS)*5より安価なAmazon Simple Storage Service(Amazon S3)*6にDBデータを格納して高速に処理するHADBの機能を活用しており、ストレージのコストも抑えることが可能です。
AWS上でのHADBのベストプラクティス構成の詳細については、末尾のフォームからお問合せ下さい。
なお、Microsoft Azureに対応したHADBのベストプラクティス構成も今後提供する計画です。
日立は、今回のHADBベストプラクティス構成に加え、お客さまのニーズに応じたデータ利活用コンサルティングや、DXの構想からアプリケーション開発、基盤提供、運用までを、成功事例の活用で迅速かつ確実に支援するHitachi Intelligent Platformも提供し、お客さまビジネスの価値向上に貢献します。
*1内閣府の最先端研究開発支援プログラム「超巨大データベース時代に向けた最高速データベースエンジンの開発と当該エンジンを 核とする戦略的社会サービスの実証・評価」(中心研究者:喜連川東大特別教授/情報・システム研究機構機構長)の成果を利用
*2 Man(人)、Machine(機械)、Method(方法)、Material(材料)の4つの要素からなるフレームワーク。製品の品質管理などに活用する
*3合田和生 東京大学生産技術研究所 准教授の提唱する製造業で用いられるワークロードを模したベンチマーク
*4 喜連川 情報・システム研究機構 機構長/東大特別教授、合田 東大准教授が考案した原理
*5 AWSが提供するクラウドストレージサービスの1つ。特に処理速度を高速化したいデータの保存に適する
*6 AWSが提供するクラウドストレージサービスの1つ。安価で耐久性が高く、大量のデータ保存に適する
■ベストプラクティス構成の概要
HADBのベストプラクティス構成は、HADBをAWS上で利用するための環境として、性能面とコスト面のバランスを踏まえた実機検証済みの構成群です。具体的には、Amazon Elastic Compute Cloud(Amazon EC2)のインスタンス*7選定方法や、Amazon S3、Amazon EBSのボリューム構成・設定をDBデータの容量別にパターン化しており、このベストプラクティス構成を活用することで、システム検討の期間を短縮できます。
本構成では、安価なAmazon S3にDBデータを格納するとともに、処理性能を向上させるために高速なAmazon EBSをDBデータのキャッシュとして利用します。これにより、AWSのクラウドストレージのコストを抑えた上で、高速なデータ処理を可能とします。
■Amazon S3を用いたHADBベストプラクティス構成のコスト低減の例
例えば、DB容量20TB*8 をAmazon S3に格納し、キャッシュとしてAmazon EBSを2TB*8利用するHADBベストプラクティス構成*9において、DB容量を全てAmazon EBSに格納する構成と比べ、クラウドストレージの利用コストが下がり、AWS利用料を約2割低減*10します。これにより、AWS利用料にHADBライセンス料を合算した場合でも、同規模の一般的なデータ分析用DBサービスと比較して、約2割のコスト低減*10が見込めます。
*7 AWSが提供する仮想サーバのサービスにおける、CPUやメモリ、ストレージなど性能の異なるハードウェアの組み合わせ
*8 1TB=1,0004バイトとして計算した値
*9 サーバーはAmazon EC2インスタンスにr6i.12xlargeを利用
*10 730時間/月の利用、1ドル150円の場合(2023年10月時点の利用料で比較)
4mbenchについて
4mbenchは、4Mを用いて製造業の製造工程をデータモデル化したものに対する分析の性能ベンチマークです。4Mとは、Man(人)、Machine(機械)、Method(方法)、Material(材料)の4つの要素からなるフレームワークです。製造業や流通業などでは、4Mの各要素とそれらの関連性を分析し、製品の品質管理や生産性改善に役立てる4M分析が実施されています。
4Mをデジタル空間上で表現し、その分析処理を測定するベンチマークが無かったことに対して、東京大学生産技術研究所の合田准教授を筆頭に、2022年のオーストラリアのシドニーで開催された技術カンファレンス(Performance Evaluation and Benchmarking)で4mbenchが発表されました。4mbenchでは4Mの構成要素を用いて食品加工・包装事業をデータモデルとして表現しています。このデータモデルに対して生産ラインの分析を想定した6種類のクエリを実行し、その実行時間を測定・評価します。
HADBについて
HADBは、大容量データの高速かつタイムリーな分析を可能とする標準SQLに対応した国産のリレーショナルデータベースです。本製品は、データ処理可能なところから並列に複数タスクを実行することで、サーバ・ストレージの能力を最大限に使い切る「非順序型実行原理」に基づき、超高速検索処理を可能としています。これらの特長で、日々生み出される多様で大量のデータを超高速に検索することでデータ分析の迅速化を支援し、お客さまの新たなビジネス価値の創出に寄与します。また、この特長は、パブリッククラウド上での高速なデータ検索にも活用でき、より柔軟で迅速なデータ分析の実現に寄与します。
・日立のデータ利活用サービスへの適用例
・製造DX(製造現場のデジタルツイン化ソシューション IoTコンパス)
製造現場の各工程で発生するIoTデータを、日立独自の生産モデルに紐付けて集約し、全体最適化視点での分析やシミュレーションを、迅速かつ継続的に行えるようにする生産現場のデジタルツイン化ソリューションの分析エンジンに採用されています。
・摘要業務の例
・産業・流通分野:製造実績トレースによる品質管理PoSデータを用いた顧客嗜好分析
・金融分野 :取引データ分析による不正取引の監視、検知
・社会分野 :交通、設備データの状態解析
・公共分野 :医療レセプト情報を活用した地域の医療施策への活用
関連ウェブサイト
・超高速データベースエンジン Hitachi Advanced Data Binder
https://www.hitachi.co.jp/products/it/bigdata/platform/data-binder/index.html?pr1110
・特集記事:革新的技術とデータで社会課題を解く。日立と東大の挑戦
https://deh.hitachi.co.jp/_ct/17614809?pr1110
・DXの成長サイクルを加速するHitachi Intelligent Platform
https://www.hitachi.co.jp/products/it/IoTM2M/list/hipf/index.html#hipf2?pr1110
商標注記
記載の会社名、製品名は、それぞれの会社の商標もしくは登録商標です。
お問い合わせ先
株式会社日立製作所 クラウドサービスプラットフォームビジネスユニット デジタルプラットフォーム事業部
お問い合わせフォーム:https://www.hitachi.co.jp/it-pf/inq/NR/
以上