神戸市で6月19日に開催された「遺伝子解析の研究と医療・創薬への応用」セミナー(主催:在日米国商工会議所 関西)において、インテルは生命科学(ライフサイエンス)や個別化医療分野におけるIT、ビッグデータにまつわる課題と、その解決に向けた同社の取り組みが紹介された。
ライフサイエンスにおけるビッグデータの大きな課題
セミナー会場となった神戸コンベンションセンター(国際会議場)は、神戸港内に浮かぶ人工島「ポートアイランド」にある。スーパーコンピューターの「京」が設置されている(理化学研究所の計算科学研究機構がある)ことでも知られる。
「神戸医療産業都市」構想を推進する神戸市では、このポートアイランドに先端医療機関/病院、生命科学関連の研究機関、医療関連企業の拠点を積極的に誘致し、「基礎研究」と「臨床」「産業化」の機能を組み合わせることで、バイオ/ライフサイエンスのイノベーションやインキュベーションを促進しようと取り組んで来た。阪神・淡路大震災の復興事業として平成10年にスタートした神戸医療産業都市だが、神戸市によると現在では「日本最大のバイオクラスター」に成長しており、波及効果を含む市内経済効果は1041億円(平成23年度、予測)に達する。
さて、今回のセミナーで「生命科学と個別化医療」と題されたセッションでは、米インテルのヘルスケア・ライフサイエンス部門 グローバル部長のケタン・パランジェペ(ketan Paranjape)氏が登壇した。
パランジェペ氏はまず、生命科学とITにまつわる「現在のトレンド」と「課題」を説明した。生命科学の革新のためにはITが重要な役割を果たすが、端的に言えば「生命科学の進化スピードは急速であり、ITの進化がそれに追いついていない」(同氏)状況だという。
たとえば“次世代シーケンサー”と呼ばれる最新鋭のゲノム解析装置では、1秒間にテラバイト(TB)クラスの膨大なデータが出力されることもある。「個々の科学者は、ペタバイトスケールのデータをほんの一瞬のうちに生成しうる」(パランジェペ氏)。こうした大量のデータを蓄積、管理、整理し、安全に活用したり、研究者間で共有したりすることのできる環境を整える必要がある。これはコンピューティング、ストレージ(データマネジメント)、ネットワークのいずれにとっても大きな課題だ。
こうした生命科学分野における大量データの処理には、主にHPC(ハイパフォーマンスコンピューティング)システム、Linux、そして専門的なオープンソースソフトウェア(OSS)ツールが用いられている。しかし大半のワークロードは、1件ずつ処理するシリアルなバッチ処理となっており、数日単位で時間がかかることもある。マルチコアプロセッサが普及している現在、ここも処理の並列化を進めることで改善が見込まれる。
さらに、生命科学の進化スピードが非常に速いことから、ITシステムの側では「将来に備えてスケーラビリティを持ち、迅速かつ柔軟にユーザーニーズに対応できなければならない」と、パランジェペ氏は指摘する。
「わたしは年に20カ国ほど訪れて、生命科学に携わる人々に会っているが、こうした課題は皆が共通して抱えている」(パランジェペ氏)
(→次ページ、ソフトウェア、ハードウェアの改善に協力するインテル)