生成AIが一大ブームとなる中、AIサービスを手がけるAI insideが提唱するのが「Autonomous AI」になる。生成AIやLLMのみならず、認識AI、予測AIなどさまざまなAIをマルチモーダルに取り込んだAI特化型クラウドサービス「AnyData」や、8月にリリースした「Heylix」などについて、AI insideの渡久地 択CEOに聞いた。
作ることに価値があると思っていた
Autonomous AIを謳うAnyDataはAI開発を自動化するためのクラウドサービスになる。Autonomousの意味は文字通り、AI開発に必要なデータを自律的に補ったり、特徴量を抽出してくれる。データが収集され、学習で精度が高まれば、サービスの品質が上がり、さらによいデータが集まるというサイクルが実現される。渡久地氏は、「誰も作るために作りたいのではなく、使うために作りたいはず」と語る。
たとえば、7月に発表された鹿島建設の事例では、ドローンの映像をインプットとし、建機や資材の位置を自動的に把握し、建設現場のデジタルツインを構築しているという。今までは現場が広すぎて建機や資材の把握のために作業員が巡回し多くの時間が掛かっていた。しかし、今ではAnyDataにより作成された画像認識AIがデジタルツインの構築に寄与しているという。
AnyDataは基本APIで扱う。ちょっと前までAI insideはノーコードツールで誰もが作れる世界を目指していたが、AnyDataはデータを入れてしまえば、アウトプットが出てきてしまう。「もはやノーコードすら要らなくなります。なぜならAutonomous AIだから。作ることも大事かもしれませんが、作ることが目的ではなく、AIは使うことが目的」と渡久地氏は語る。
その点、Autonomous AIを実現するAnyDataでは、抽象的なリクエストでも十分機能するレベルを実現している。「予測AIの場合は抽象度が高いので、『在庫を最適化したい』くらいのリクエストをすれば、勝手に動いてくれます。欠損したデータをわざわざ補う必要はないんです」と渡久地氏は語る。
AnyDataのお客さまは自らAIで成果を出し始めている
AnyDataはもともとあった学習基盤であるLearning Centerにデータ基盤と運用基盤を追加したものだ。もちろん、AWSであれば、データ基盤にAmazon S3、学習基盤にAmazon SagaMaker、そして運用にAmazon EKSを活用するなど既存のクラウドサービスでも実現はできる。しかし、それぞれの基盤は利用するチームが異なり、分断しているのが現状だ。
AnyDataはデータ基盤や学習基盤、運用基盤の3つで構成されているが、ワンパッケージ化されている。インフラはkubernetisベースのコンテナとGPUクラスターで構築されているため、耐障害性も拡張性も性能も高い。そして、従来のサービスとの差別化は、AnyDataの場合、データ、学習、運用の3つが揃っているため、「AI開発のサイクルを回せる基盤」になっているという。
渡久地氏は、「ノーコードでAI開発できるというツールはいくつもありますが、これって基本的には学習環境、実証実験の環境です。本番のためにシステムを作ったり、データを集めるのにはとても時間がかかります。AnyDataのいいところは、人が課題を設定したら、勝手に学習を始めてくれること。そのまま本番運用に進み、そこで生まれたデータがまた学習に入ってきます」と語る。
現在、AnyDataによってユーザーが作ったAIの数は930に上る。しかも、生成されたAIの累計ではなく、現在使われているAIの数だ。工場の検品作業、ゴミの種別判断などの画像検知モデルのほか、知財確保の判断の可否、キャンペーン施策の立案、不動産の販売価格の提示など、テーブルデータを用いたフォーキャスト(予測)モデルもある。
このようにAnyDataの場合、ユーザー自ら開発サイクルを回せてしまう。AI inside側でも用途のすべては把握しておらず、事例はあくまで伴走したものだけだ。「お客さまが使えているから、いい意味で私たちは知らないんです。古くから使ってくれているお客さまは、特定の分野では僕たちでも想像できなかったような使い方がなされています」と渡久地氏は語る。
生成AIは効率化のために使うものではない
Autonomous AIは、今話題の生成AIやLLM、音声や画像の認識系AI、予測AIなどを含むマルチモーダルな概念だ。「ユーザーとテクノロジーの間にあるのがLLM(大規模言語モデル)なのですが、使い方を模索しようとしていたら、ChatGPTが受け入れられてしまった。せっかく受け入れたなら、われわれも取り込んでいこうという考えです」(渡久地氏)。
生成AIやLLMは、この数ヶ月で多くのSaaSに取り込まれ、毎日のように新機能としてリリースされている。「会議の議事録と要約をとれるようになった」「iPaaSのフローにGPTを追加した」「安全なGPTを提供できるようになった」など。将来的に実装予定だった機能が、LLMやChatGPTの台頭でいち早くリリースできたというベンダーも多い。
しかし、長らくAIに関わっている渡久地氏は、「生成AIは効率化に使うものではない」と断言する。「たとえば、会議の議事録をとって、要約してくれる機能を提供するサービスはすごく増えたと思います。でも、本質的には会議の価値をどう高められるかに使うべき」(渡久地氏)という。
本来、LLMで実現すべきなのは会議自体のスマート化だ。「文字起こしの結果、ブレストしているとAIが認識してくれたら、対案を出してくれたり、必要な調査を探し出してくれた方がよい」と渡久地氏は語る。現在の生成AIの使い方に否定的なように見えるが、生成AIの可能性を過小評価しているのでは?というオピニオンでもある。
一方、「バズワードを拾うだけで、やらないのはダメ」と渡久地氏が感じたのも事実だという。そこで生まれたのが、8月に発表したAIエージェント「Heylix」だ。Heylixはユーザーの指示に基づいて、マルチモーダルなAIモデルを自動生成してくれる。
たとえば、ユーザーが「この手書きの保険契約書をデータ化し、時系列で解約リスクを教えてください」といった指示を与えると、Heylixは複数のAIテクノロジーを掛け合わせて、タスクを実行する「Buddy」というAIを生成してくれる。Buddyは自らの業務を助けてくれるまさに相棒として動作し、ユーザー間でも共有できる。一部顧客に公開され、すでに300を超えるBuddyのアイデアが発案されているという。
課題設定までAIがやる ここまで来てこそ本当のAutonomous AI
最近ではAnyData上に自らLLMの構築にも取り組んでいるが、こうしたLLMの構築においてはパブリッククラウドのような多くの学習リソースが必要になるはず。これに対して渡久地氏は、「計算機リソースだって、汎用性があった方がいいに決まっている。『できなさそうだからといってやらない』のは負け犬根性だと思っている」と、GPUクラスターもきちんと用意していく考えを明らかにした。
学習リソースを節約するために用途に特化したLLMの開発も進めていく。渡久地氏は、「LLMに来るタスクは多種多様。『今日の天気は?』は調べないといけないし、『ハンバーグの材料は?』は組み込まれている回答です。いずれにせよ、どちらもめちゃくちゃ簡単なタスクなので、わざわざGPT4が答える必要はない」と指摘する。
今年の6月に、マイクロソフトは13億程度のパラメーターでGPT3.5を凌ぐベンチマーク値をマークしたAIモデル「phi-1」を発表した。今後はコスト面でも、速度の観点でも、用途に特化したLLMは必要になるという。「たとえば、MicrosoftがOfficeに搭載しようとしているCopilotだって、WordとPowerPointならLLMは違うはず。これを馬鹿でかい単一のLLMで実現しようというのはナンセンス」と渡久地氏は語る。
次の数年では、人間が現在やっている課題の設定までAIができるようになるという。テクノロジー面ではすでに可能であり、あとはビジネス面やユーザーやパートナーの理解が追いつくだけだ。「課題が設定できると、それに必要な学習リソースやデータセット、LLMが自動的に割り当てられるような世界。ここまで来てこそ本当のAutonomous AIだと思います」と渡久地氏は語る。