このページの本文へ

論文や研究データなどを取り込み柔軟な活用を可能に、創薬を効率化「MarkLogicファーマリサーチハブ」

製薬業界の“データサイロ”問題、マークロジックの考える解決策

2019年07月16日 07時00分更新

文● 大塚昭彦/TECH.ASCII.jp 写真● 曽根田元

  • この記事をはてなブックマークに追加
  • 本文印刷

 「製薬会社が新たな医薬品を研究開発する『創薬』には莫大なコストと時間がかかる。特に最近はその傾向が顕著で、1件あたり26億ドル(約2800億円)の研究開発費と15年の歳月がかかるとも言われる。こうした巨大投資はリスクも大きく、たとえばアルツハイマー病の治療薬開発などから途中で手を引く製薬会社も出ている。その状況を改善するのは、製薬業界にとっても社会にとっても喫緊の課題だ」(マークロジック ビル・フォックス氏)

 あらゆるタイプのデータを取り込み、管理/検索/加工/共有可能にするエンタープライズ向けデータ統合プラットフォームを提供する米マークロジック(MarkLogic)では、今年5月、製薬業界向けの研究開発データ管理ソリューション「MarkLogicファーマリサーチハブ」の提供を開始した。製薬会社内において、創薬にかかわる多様で大量のデータソースを統合し、単一の画面から柔軟な検索や情報どうしの関連付け、可視化といった機能を提供することで、研究者が必要な情報にすばやくアクセスできる環境を提供するクラウド型のフルマネージドサービスだ。

 今回は、マークロジックでヘルスケア&ライフサイエンス担当CSOを務めるビル・フォックス氏と、日本法人代表の三浦デニース氏に、製薬業界におけるデータ管理の課題と、マークロジックが提案するソリューションについて聞いた。

「MarkLogicファーマリサーチハブ」では、さまざまなデータソースを統合し、製薬業界の研究者がすばやく必要な情報にアクセスできる手段を提供する

米マークロジック 業種戦略グループVPおよびヘルスケア&ライフサイエンス担当CSO)のビル・フォックス(Bill Fox)氏、日本法人代表の三浦デニース氏(マークロジック日本オフィスにて)

製薬会社における研究者の課題、IT管理者の課題、その解決策

 創薬に巨大なコストと時間がかかるという問題は、製薬業界全体の抱える悩みとなっている。たとえば国際製薬団体連合会(IFPMA)による2017年のレポートでも、現在では1つの医薬やワクチンを開発するために10~15年の年月がかかっており、業界全体の研究開発コストは1年間に約1500億ドル(約16兆2000億円)に上ることが報告されている。

 この大きな問題についてはさまざまなアプローチが試みられているが、マークロジックではデータ管理の側面からソリューションを提供している。フォックス氏は、同社のファーマリサーチハブでは「大きく2種類の課題を解決しようとしている」と説明する。

フォックス氏はヘルスケアやライフサイエンスの業界でも長い経験を持つ

 まず1つめは創薬研究者にとっての課題だ。研究者は研究開発を進めるにあたって、さまざまな種類のデータ(遺伝子、経路、既存の医薬品など)を収集する必要がある。しかしながら、これまでの研究結果はさまざまなデータソース(公開の論文、非公開の臨床データなど)に分散しており、いわば製薬会社内で“データサイロ”の状態になっているという。

 「研究者が必要としているデータが『ない』のか、それとも分断されたデータサイロに隠れて『見つからない』だけなのか、それすらわからない。もしもデータが『ない』ものと考えて実験などを進めた後にそのデータが見つかれば、数千人の研究者が時間を無駄にしたことになる。製薬会社にとっては数億ドル規模の損失だ」(フォックス氏)

 さらには共同で研究を進める社内外の研究者間で、どのようにしてセキュアな情報共有とコラボレーションを行うのかも課題になっているという。

 もう1つ、マークロジックが解決を狙うのがIT部門にとっての課題だ。上述した“データサイロ”は、これまで社内で特定領域向けのシステムやデータストアが個別に構築されてきた結果である。そうした複雑なデータ環境を改善するのは容易ではない。

 「その解決策として『データレイク』が提案されたこともあったが、単なるファイルシステムでは期待どおりの結果は出ず、研究者の要件は満たせなかった。この課題は大きく、要件が満たせないせいでCIOが次々にクビになった製薬会社の例も知っている」(フォックス氏)

 マークロジックのファーマリサーチハブは、あらゆる種類の研究データを一カ所に集約し、研究者が容易に必要なデータにアクセスできる手段を提供するソリューションだ。そのベースとなっているのが、同社の「データハブプラットフォーム」である。

 データハブプラットフォームの特徴は、構造化データ/非構造化データを問わずあらゆるデータをいったん“AS ISで(ありのまま)”取り込んでしまい、そののちに必要に応じて統合や加工を行うというアプローチだ。データを集約することで、多様なデータソースを横断的に検索し、目的とする情報を素早く探すことができるようになる。また取り込んだデータどうしの関連付けを行うセマンティックの能力も持つので、検索した情報から関連性の高い情報へと視野を拡大していくこともできる。

 既存のデータベースやデータソースを作り直すアプローチではないため、そうしたカスタム開発(作り直し)と比較すると、構築にかかる時間はおよそ10分の1で済むとフォックス氏は述べる。また情報セキュリティの側面でも、エンタープライズ要件を満たすという。たとえばNoSQL市場で唯一というコモンクライテリア認証を受けているほか、ガバナンスやデータリネージ(データの来歴記録)の機能も備えている。

データハブプラットフォームの概要。ファーマリサーチハブはこの基盤をベースに開発されている

グローバル大手製薬会社におけるマークロジックの活用法を参考に開発

 「製薬業界のグローバルトップ10社のうち、5社がマークロジックの顧客企業だ。実はファーマリサーチハブは、こうした顧客がデータハブプラットフォームをどのように使っているのかを見て、その共通する部分を整理しパッケージ化したソリューションだ」(フォックス氏)

 フォックス氏はそう述べたうえで、顧客である大手製薬会社でこれまでマークロジックのデータハブプラットフォームがどのように活用されてきたのかを紹介した。

製薬業界における「MarkLogicデータハブプラットフォーム」の導入事例(アッヴィ、アムジェン、ロシュ、ジョンソン・エンド・ジョンソン)。こうした事例を参考にファーマリサーチハブが開発された

 ファーマリサーチハブが提供する具体的な機能としては大きく6つある。三浦氏がデモを披露しつつ、主要なものを説明した。

ファーマリサーチハブが備える主な機能

 前述したデータハブプラットフォームの持つ能力を活用して、研究者はそのデータタイプを問わず、社内外のデータソースを横断的かつ高速に検索することができる。たとえば「論文の執筆者」や「論文の被引用数」「遺伝子名」「関連する医薬成分」などの多様なタグに基づいて、検索結果からさらに絞り込みをするのもワンクリックで行える。

デモ画面より検索結果一覧。論文の執筆者名や遺伝子名などはタグ(Topics)として自動的に抽出されている。また遺伝子名で検索すると、研究用のパブリックデータからその別名も含め表示された

 機械学習に基づくセマンティック能力は検索時に反映され、個々の研究チームが求める情報に近い(関連度の高い)ものから表示される。さらに情報どうしのつながりを可視化するグラフ表示も備えており、研究者はここから新たな情報を探索していくこともできる。

 「たとえばある遺伝子を中心として、その遺伝子に関連する論文、研究者、医薬品、タンパク質、疾病などの情報がひも付けられた形で表示される。もちろんここから各情報をドリルダウンして、より詳細な情報を深掘りしていくこともできる」(三浦氏)

グラフ表示画面。多様なデータソースから関連度の高い情報どうしをひも付けてインタラクティブに表示できる

 「ワークスペースの作成/共有」は、研究開発チーム内の情報共有を簡単にするための機能だ。ある研究者がまとめたデータをこのワークスペースに保存し、他の研究者と共有できる。

 もうひとつ、最近ではAIを活用した創薬の効率化にも期待が集まっているが、そうしたAI活用を支援する機能も備えている。具体的には、AI/機械学習処理を適用する前にデータを整理/統合/クレンジングし、データを“きれいな状態”にする下準備を行える。ここでは、複数のソースから取得したデータを自動的に“名寄せ”処理して統合する「スマートマスタリング」機能も備えていると説明した。

日本法人代表の三浦デニース氏

他業界の顧客企業も注目「われわれもこんなソリューションがほしい」

 フォックス氏は、製薬会社が従来の手法でこうした仕組みを構築しようとすれば、おそらくその開発には3、4年がかかり、それでも一部の機能しか実現できないだろうと語る。「マークロジックならば数カ月ですべてを構築できる」(フォックス氏)。パブリッククラウド基盤を使って提供するため、ハードウェア調達を待つ必要がなく迅速にサービスインできるメリットもある。

 実はこのインタビューの直前まで、両氏は日本のある製薬会社を訪問してファーマリサーチハブを紹介していたという。「お客様にデモをお見せしたところ、彼らはとても“ショック”を受けていたようだ」と三浦氏は笑う。

 「情報検索のスピードが非常に速く、しかも関連度の高い検索結果が得られること。そして開発スピードも速いこと。それが“ショック”を受けた理由だろう。たしかに過去の環境では検索に時間がかかり、しかも求めるものとは違った結果が出ていたのだから、それはショックを受けるほどの進化だと言える」(フォックス氏)

 クラウド型で提供するメリットを生かし、初期導入コストも低減させていきたいとフォックス氏は述べた。マークロジックでは今後、サブスクリプションモデルでの販売も検討していく方針だと明かし、そのモデルならば「導入当初は利用人数もデータも少ないのでコストが抑えられるはずだ」と語った。

 今回のファーマリサーチハブは製薬業界向けだが、ほぼ同じ仕組みで他業界にもソリューションが提供できるのではないか。最後にそう質問してみたところ、フォックス氏は「実はすでに他業界からも反応が出てきている」と答えた。

 「当社のイベントで製薬業界向けソリューションとして展示説明していたところ、金融や製造といった他業界の顧客も次々に集まってきて、『われわれの業界にもこんなソリューションがほしい』との声が上がった。われわれの顧客企業はやはり発想がシャープだ。製薬業界でもそうだったが、マークロジックが次にやるべきことは顧客に聞くのが一番のようだね(笑)」(フォックス氏)

訂正とお詫び:掲載当初、本文中にある導入企業(製薬会社)の日本語社名表記が誤っておりました。お詫びのうえ訂正いたします。(2019年7月16日)

■関連サイト

カテゴリートップへ