IBMデータ&AIビジネスの中核をなすデータプラットフォーム製品、DXの“第二章”に重要な位置づけ
「IBM Cloud Pak for Data」最新版、“DataOps/MLOps”実現も支援
2020年06月16日 07時00分更新
日本IBMは2020年6月15日、統合データプラットフォーム製品の最新版「IBM Cloud Pak for Data V3.0」(6月19日リリース予定)についての記者説明会を開催した。データ/AI活用を推進する企業で求められる“DataOps”や“MLOps”の実現、さらにビジネスユーザーが直接活用できる業務アプリケーションの追加など、Cloud Pak for Dataがもたらすメリットを説明した。
より包括的、かつ強固なデータ基盤となったCloud Pak for Data最新版
IBM Cloud Pak for Data(CP4D、旧称:IBM Cloud Private for Data)は2年前から提供されている統合データプラットフォーム製品だ。今回、8回目のアップデートでV3.0となった。
説明会に出席した日本IBM クラウド&コグニティブ・ソフトウェア事業本部 Data and AI事業部 理事の正木大輔氏は、Cloud Pak for Dataの特徴について「本格的なAI活用を実現する4段階の“AIのはしご(AI Ladder)”を単一プラットフォームで提供」、Red Hat OpenShiftベースで構築されており「ハイブリッド/マルチクラウド環境への対応」、データサイエンティストだけでなくビジネスユーザーでもすぐにメリットを享受できる「データ活用/AIアプリケーションの提供」の3点だとまとめる。
さらにData and AI事業部 テクニカルセールス部長 田中孝氏は、Cloud Pak for Dataではこうした特徴によって、今後のデータ活用において重要と考えられる3つの要件をカバーすると説明する。具体的には、企業内に分散するデータを単一ビューで把握し容易にアクセス可能にする「データモダナイゼーション」、データ品質を担保すると同時にデータ分析/AIモデル開発の試行錯誤(反復)を可能にする「DataOpsの実現」、さらに高度なAI開発スキルを持たないユーザーのAI活用を支援する「AIライフサイクルの自動化」という3つだ。
最新版であるV3.0の進化点について、田中氏は、備える機能の拡大と強化、一貫性の向上によって「より包括的なデータプラットフォームになった」こと、OpenShift 4.3採用による非機能要件(バックアップやロギングなど)の強化や「IBM Power Systems」の新規対応など「より強固な基盤になった」ことの2点を挙げた。
機能強化/新機能の具体例として、田中氏はまず、データカタログのコンポーネントである「Watson Knowledge Catalog」を取り上げた。個々のデータの意味や来歴、品質、また利用可能ユーザーの制限といった機能を提供し、データに対してガバナンスを効かせるためのツールだが、「そのオペレーションをひとつひとつ手作業でやっていては、企業全体でのデータ活用の実現は難しい」(田中氏)。そこで、今回のバージョンアップにおいては、データの意味/品質を確認する処理を一部AIで自動化するなど、ユーザーの工数を低減するための機能強化が図られた。
また「Watson Studio & Watson Machine Learning」が備えるAI開発自動化機能「AutoAI」においては、パフォーマンス向上のほか、「AutoAIが作ったモデルのソースコードを開発者がダウンロードし、チューニングをかけてさらに精度を向上させることができる新機能」(田中氏)が追加された。
もうひとつ、構築済みで提供するAIアプリケーションとして、多様なデータ連携とAIによってリアルタイムに計画策定を支援する「IBM Planning Analytics」が新たに追加された。これまで単体製品として提供されてきたものだが、今回はCloud Pak for Dataプラットフォームへの統合が図られ、一貫したユーザーエクスペリエンスが提供されるようになっている。