産業技術総合研究所の研究チームは、数式から自動生成した大規模画像データセットを用いることで、事前の学習で実画像を一切使わずに、人工知能(AI)の画像認識モデルを構築する手法を開発した。画像認識性能のベンチマークに活用される「イメージネット(ImageNet)」の画像データセットで検証したところ、実画像や人の判断を経た教師ラベルを用いる現在の手法よりも精度が優れていることが分かった。
産業技術総合研究所の研究チームは、数式から自動生成した大規模画像データセットを用いることで、事前の学習で実画像を一切使わずに、人工知能(AI)の画像認識モデルを構築する手法を開発した。画像認識性能のベンチマークに活用される「イメージネット(ImageNet)」の画像データセットで検証したところ、実画像や人の判断を経た教師ラベルを用いる現在の手法よりも精度が優れていることが分かった。 研究チームは最初に、汎用的な数式の一つであるフラクタル幾何によって自動生成した画像データセットを画像認識AIの学習に用いると、実画像と人間が与えた教師ラベルを用いた従来の学習と近い認識精度が出ることを明らかにした。さらに、フラクタル幾何の画像データで学習した画像認識AIの学習の仕方を調べたところ、主に輪郭成分に着目して物体を識別することがわかった。 そこで、画像の主要成分が輪郭となるよう、放射状に輪郭を生成する関数を数式に設定した画像データセット(輪郭形状による画像データセット)も構築。これらの画像データセットで学習させた結果、物体を識別するための基礎的かつ良好な視覚特徴を得ることができた。この手法では、数式から画像が生成される際に自動で教師ラベルが生成されるため、従来のような実画像に人が教師ラベルを付与する手間は不要となる。 検証では、従来の人が教師ラベルを付与した標準的な実画像データセットと、今回開発したフラクタル幾何による画像データセット、輪郭形状による画像データセットのそれぞれで学習済みモデルを生成して画像認識AIを構築。それぞれにImageNetの一般的な物体の画像をタスクとして与えた結果、フラクタル幾何および輪郭形状による画像データセットで構築した画像認識AIの精度は、実画像によるものより高い水準(フラクタル幾何:82.7%、輪郭形状:82.4%、実画像81.8%)を記録した。 今回の手法は、AIが学習で使用する大量の実画像やそのプライバシーの確保、ラベル付けコストなど商業利用の際の課題を解消するとともに、実画像や人の判断を経た教師ラベルを用いる現在の手法と同程度以上の画像認識精度を実現している。今後、自動運転や医療、物流などさまざまな環境のAI構築で応用が期待できそうだ。 研究チームは、技術の詳細を、2022年6月19日から24日まで米国・ニューオーリンズで開催される「コンピュータービジョンとパターン認識国際会議(International Conference on Computer Vision and Pattern Recognition 2022:CVPR 2022)で発表する。(中條)