“市民科学者”参加の大規模画像データ分類をディープラーニングモデルで迅速化
デル・テクノロジーズ、グレートバリアリーフ保全活動をAIで支援
2022年08月25日 07時00分更新
デル・テクノロジーズは2022年8月24日、新たに設計したディープラーニングモデルを活用して、オーストラリアにある世界最大のサンゴ礁「グレートバリアリーフ」の保全活動を支援すると発表した。グレートバリアリーフで撮影、収集される大規模な画像データを、短時間で正確に分類することが可能になるという。
大量のサンゴ礁画像を分類/分析するディープラーニングモデル
今回の発表は、グレートバリアリーフの保全活動を進める環境保護団体、Citizens of the Great Barrier Reef(シチズンズ・オブ・グレートバリアリーフ)が進めるプロジェクト「Great Reef Census(GRC)」の第3弾調査(GRCⅢ)をデル・テクノロジーズが支援するというもの。GRCⅢは2022年10月の開始予定。
Citizens of the Great Barrier Reefの創設者であり、Earth Hour CEOのアンディー・リドリー氏は「グレートバリアリーフのサンゴ礁は、環境保護において象徴的な存在だ」と語る。全長2300km、日本列島とほぼ同じ大きさを持つグレートバリアリーフには3000以上のサンゴ礁が存在するが、定期的にデータが取得できているのは5~10%にとどまり、40%以上が未調査。そのため同組織では、できるだけ多くのサンゴ礁の画像データを収集して、有益な情報に変換することに取り組んでいる。
グレートバリアリーフには毎年200万人もの観光客が訪れる。GRCでは、こうした観光客を“アマチュアの市民科学者(Citizen Scientist)”として起用し、彼らが撮影したサンゴ礁の画像を収集、大規模調査データとして蓄積している。この画像を分析、分類することで、豪クイーンズランド大学の研究者がサンゴ礁の保全に有効なアプローチを開発したり、問題を特定したりする作業を支援する狙いだ。
2020年後半に行われたGRCⅠ(第1弾調査)では、観光船やダイビングボート、スーパーヨット、漁船、タグボートなどで構成される地域調査船団が、グレートバリアリーフで7100枚以上の画像を撮影。海洋構造や生物、サンゴの状態に基づいて、6000人を超えるオンラインボランティアが手作業でラベリングを行い、分類した。2021年にスタートして現在進行中のGRCⅡでは、315のサンゴ礁から収集した4万2000枚の画像を分類、分析する計画。
デル・テクノロジーズはGRCⅠ、GRCⅡにおいても、海上の船舶に搭載したエッジソリューションから4Gモバイルネットワーク経由でリアルタイムに画像データを収集する支援を行っていたが、GRCⅢではさらに踏み込んだかたちでサポートを行う。収集した画像の分類や分析の処理に適用できるディープラーニングモデルを提供して、これまでボランティアの人手だけに頼っていた作業をスピードアップし、GRCプロジェクトの能力を高めることを支援する。
具体的には、海上にいる複数の船舶に搭載したデルのエッジソリューションから、4Gモバイルネットワークを通じて画像データをシステムに取り込む。この画像分析に新たなディープラーニングモデルを採用することで、これまで写真1枚あたり7~8分を要していた分析時間を1分弱に短縮する。GRCⅠでは1万3000枚の画像分析に1516時間(約2カ月間)かかっていたが、新しいモデルはこれを200時間弱(約1週間)で処理可能だという。
ディープラーニングによるセマンティックセグメンテーションモデル(画像認識モデル)のトレーニングには、デルのHPC GPUアクセラレーションシステムを活用。また大量のデータはスケールアウトNASの「PowerScale」に格納する。このコンピュートプラットフォームには、AIトレーニングクラスターや複数のAI推論エンジンをサポートする「PowerEdge」サーバーを採用。データ分析などには、高耐久性ノートパソコン「Dell Latitude Rugged」も利用する。
Dell Technologies APJプリセールス担当VPのダニー・エルマージ氏は、「デル・テクノロジーズでは、研究者のライフサイクル、データのライフサイクル、画像の取り込み方法、プロセス全体を通した課題や効率化について、多くの時間をかけてヒアリングを行った」と説明する。
「グレートバリアリーフに関する専門知識を持つ人材を社内に集めて、画像の取り込みを容易にし、市民や研究者が利用しやすいエンドトゥエンドソリューションを検討した。その結果、データをエッジで処理することが重要だという結論に達し、船舶上にシステムを構築した。シンプルで使いやすいインタフェースを採用したことで、多くの人が撮影した画像を収集することができ、同時にサンゴ礁のGPS座標も保持する。4Gモバイルネットワークによって、画像を一括アップロードし、処理できる点も優れている」(エルマージ氏)
また、Dell Technologies APJ 主席システムエンジニア兼データサイエンティストのアルーナ・コルール氏は、「画像分類の正確さは、市民科学者(ボランティア)と研究者とでは大きく異なる。画像分類にディープラーニングを活用することで、すべての画像を10秒以内に分類できるようになり、ラベリングの正確さも向上する」と説明した。
「人間と機械が協力して画像のなかからサンゴ礁を特定し、サンゴ礁の輪郭と健康状態を規定して、専門家と同等の精度で簡単に確認できるようになった。ここではニューラルネットワークの『SegNet』を用いており、画素単位のセマンティックセグメンテーションを実現する。今後も新しいデータを取得するたびに学習を続け、改善していく」(コルール氏)
GRCⅢがスタートする10月はサンゴの産卵期にあたり、満月の夜から数夜をかけて、サンゴのポリープのコロニーやすべての多様な種が、小さな卵と精子を水中に放出する。今回の取り組みによって、産卵期などの重要な時期に最も保全活動を必要とする地域を迅速に特定し、支援できるようになることを期待しているという。
豪クイーンズランド大学 教授のピーター・ムンビ氏は、「われわれの専門家チームは海流に関するデータを持っており、10月の満月のころにサンゴが大量繁殖するのに合わせて受精卵や幼生の流れを予測し、新しいサンゴを生み出す重要な場所を推定できる。だが、さらにサンゴ礁の情報があればもっと踏み込んだ対応もできる。そこに市民科学者の情報が活用できる」と述べた。GRCの情報を活用することで、回復に近づいているサンゴ礁を特定したり、ダメージを受けたサンゴ礁に健康なサンゴを移植したり、サンゴを食べるオニヒトデを駆除したりできる可能性があるという。
“市民科学者”参加の環境保全活動モデルを世界に展開していく
グレートバリアリーフにおける今回の取り組みは、他の地域のサンゴ礁に対しても適用できるように高い拡張性をもって設計されているという。Citizens of the Great Barrier Reefのリドリー氏は、デル・テクノロジーズとの協力を通じて、世界中のサンゴ礁にこの保全活動モデルを展開していきたいと語った。
「とくに東南アジアには、このようなプログラムに参加する熱心な人々や組織がたくさんあり、大きな可能性を秘めている。さらに、陸の生態系にも対応できるだろう。世界中の市民科学者、市民コミュニティを動員する力は大きい。水中からデータを収集するだけでなく、地球上のあらゆる場所から信頼性の高いデータを収集することで、世界全体が直面している環境や社会の諸課題に対処するためのテクノロジーを展開していくことができる。今回の取り組みは、その大きな一歩になる」(リドリー氏)
その動きはすでに始まっている。グレートバリアリーフでの実績をもとに、今後はオーストラリア西海岸にあるニンガルーリーフへの適用を予定。さらにインドネシアやモルディブ、セーシェルのほか、コーラルトライアングルなどのサンゴ礁も適用先の候補に挙がっていると説明した。