Dataiku Data & AI Day 2023レポート
工場・研究の現場担当者がデータ・AI活用で躍動 ― カネカとENEOSマテリアルのDataiku事例
2023年11月02日 08時00分更新
ENEOSマテリアル:テーマの難易度や研究員のレベルに応じてDataikuを使い分け
「ENEOSマテリアルの研究開発におけるデータ活用の取り組み」と題したセッションで登壇したのは、ENEOSマテリアルの研究開発本部 高分子材料開発部に所属する中村真一氏だ。
ENEOSマテリアルは、1957年に設立された国策会社、日本合成ゴムを前身とするJSRから分社化し、現在はENEOSの完全子会社である素材メーカー。同社は研究開発におけるDX実現のため、開発活動のデジタル化を第一段階、データ活用による高度化を第二段階とするプロジェクトに取り組んでいる。
「年々厳しくなる顧客からの要求に、素早く、高度に対応したい、ビジネスのやり方や意思決定のプロセスをより良いものにしたいという目的でDXを推進している、その前段階として情報のデジタル化、データ活用が必要になった」と中村氏は説明する。
第一段階のデータを貯める、開発活動のデジタル化では、研究開発専用のデータベースの構築、拡張、運用に注力。しかし、第二段階である、予測モデルの作成や仮想実験といったデータ活用に移ったところで、分社化に伴いプロジェクトチームが離れてしまう。「ここまで来たのだから、自立してデータ活用を進めるしかないというモチベーションで取り組みを継続した」と中村氏は振り返る。
あらためて第二段階に取り組むうえで、中村氏らは二つの課題に直面する。一つは、プロジェクトチームが離れたことによる、データ活用人材の不在だ。研究員は、ドメイン知識を持っているが、データ分析の知識も兼ね備えていることはまれだった。
もう一つは、データ活用の仕組みがスケールしないことだ。すでに第一段階のデータベースの構築で多くのリソースを費やしており、さらに別のデータベースを構築するには莫大なコストがかかる。これが、データ活用のテーマを広げていくうえでハードルとなった。
この状況を解決するために、データ活用の人材をサポートできる、フルスクラッチでシステムを作らずにプロジェクトを進められるプラットフォームとしてDataikuを導入した。
ENEOSマテリアルでは、テーマの高度さや活用する研究員のステージに応じて、Dataikuの活用方法を使い分けている。
高度ではないテーマでは、多くの研究員が利用できる「可視化・グラフツール」として活用している。データの可視化における従来の課題は、同じようなグラフを作る、違うサンプルで別のグラフを作るといった繰り返し作業の手間や煩雑さだった。加えて、表計算ソフトで作業を行うと、どういう意図で加工したかについての追跡性が低く、再利用できないという悩みもあった。
Dataikuを導入した結果、簡単なフローを作成してデータをインポートし、表示用に加工、そこからグラフやダッシュボードを作るのが容易になった。データ加工のフローも追跡でき、データ更新にも対応する。こうして可視化のハードルが下がることで、多様な切り口で分析できるようになったという。
より高度なテーマの場合には、DataikuをETLツールとして活用している。ETLツールの利用はチーム単位となるため、各担当の実験データの入力や集約、ひも付けに労力がかかり、作業も標準化されていないという課題があった。
Dataikuを活用することで、各々が測定したデータを所定の場所に収め、測定データごとに加工・抽出、統合して紐づける作業を半自動化できた。さらに、構築したフローをアプリUI化することで、Dataikuユーザーではないを実験者や測定者にも利用してもらえるようになった。
ここまでの活用方法は、自動化や標準化といったデータ活用の“前段階”にすぎない。それでもDataikuのUIに慣れたり、データ収集の意識付けをしたりすることに一役買っているという。
最も高度な活用となる予測モデルの構築においては、単純な表計算による重回帰分析では能力不足という課題があった。AI/機械学習で予測するにも、統計やデータ前処理、Pythonのプログラミングなどの専門知識がないことがネックとなる。そこを、Dataikuで補った。
例えば、順方向の予測モデル(反応物から生成物を予測)においては、過去の実験データを用いて各種性能の予測モデルを作成。その後、レシピを総当たりで予測してスコア化するという、いわば“仮想実験をぐるぐる回す”段階を踏む。データ活用の専門知識をDataikuが補うことで、これらの作業がフローの中で形式知化され、研究者の学びの高速化につながる。さらに誰もが見える形になることで、他のメンバーに支援してもらったり、指針や設定を評価してもらったりすることもできるようになった。
逆方向の予測モデル(生成物から反応物を予測)では、必要となる性能を指定すると、候補となる配合レシピが提案されるフローを構築。Dataikuにより研究者自らが自立したAIモデルを作成することで、モデルの中で何が影響しているかといった、モデル作成を通じた現象理解を促す。またUI化することで、研究者以外のユーザーがモデルの恩恵をすぐ受けられ、実業務への適用やフィードバックが高速化される。
今後の取り組みについて中村氏は、「より高度に、より広くDataikuを活用していくのに合わせて、データ活用人材を増やし、研究員の底上げを進めたい。さらに、作成した予測モデルを業務にデプロイする段階で、PoCから実用へシームレスに拡張することで、研究開発のビジネス価値を上げていきたい」と語った。
