生成AIは期待値が高すぎ AIのためのデータ基盤が必要
大谷:最後、生成AIへの取り組みや大石さんのスタンスについても教えてください。
大石:もちろん生成AI自体は重要な技術であり、日本のITの基礎になっていくと思います。ただ、今は期待値が上がりすぎている。だから、期待値を是正する行動はこれから必要なんだろうなとは思っています。なんでもかんでも解決する銀の弾丸ではない。
たとえば、僕らのところにはAWSに関するテクニカルな問い合わせはすごく来るので、これを回答するチャットボットを作ってみました。AWSのドキュメントや過去の問い合わせ履歴を、RAGをしっかり構築したのですが、それでも全然でした。
大谷:全然というのはどれくらいのレベルだったんですか?
大石:お客さまに出せるという回答は2~3割だと思います。でも、今の期待値って9割くらいじゃないですか。AWSの技術的な説明だったら、9割くらいいけるでしょうというレベルだと思うんです。だから「全然」なんです。
もちろん、この2~3割も箸にも棒にも引っかからないわけではなく、きちんとソースが明らかで、下調べして出してくれてはいます。「新人ががんばってデータ用意してきましたー、先輩見てくださいー」くらいなんです。
大谷:同業者の方に聞くと、確かに同じような意見でてきますね。
大石:ただ、僕らのビジネスという観点では明確に追い風になっています。
先日のAWS SummitでAmazon CTOのヴァーナー・ボーガス先生が「Good AI needs Good data」という話をしていましたが、あれは本当にその通りです。使えるデータを整備しないとAIはきちんと機能しないんです(関連記事:食糧不足や医療危機などの社会課題に、今あるAIで立ち向かうテクノロジストたち)。
僕らも最初は社内のSlackやりとりやBoxの数テラのデータをAIで学習させたらいい感じの回答が戻ってくると思ったのですが、うまく読み込めません。Excelファイルも人が読んだら理解できる入れ子になっている売上データとか、生成AIはうまく読めない。CSVに落とし込んで、分解してRAGにツッコむみたいな方法をとらざるを得ない。
結局、一周回ってビッグデータ大事だったんだなと(笑)。じゃあ、大量の企業データを安全に保存して、ベクトル化して、AIに読み込ませようと思うと、やっぱりAWSになるんです。なので、もう一度ちゃんとデータ整備やり直しますみたいなシナリオで、お声がけいただくことがけっこう増えてきました。
生成AIのサービスは日本が十分勝てる領域
大谷:やはりインフラやデータ基盤みたいなところで相談が来るわけですね。
大石:われわれ生成AIのプロフェッショナルという立場ではないので、どちらかというとRAGのバックエンドのデータベースを構築する役回り。PoCレベルだったら弊社でもできますが、検索手法の選定やファインチューニングみたいなのは専門の業者さんが担っています。ここらへんは餅は餅屋ですね。
大谷:日本はAIに対して期待値が高い一方で、まだまだユーザー自身は少ないと言われます。AIはきちんとビジネスに根付くのでしょうか?
大石:北米はまだまだ人口も増えているし、ヨーロッパは移民が多いので、労働力を担うAIに対する抵抗感がまだ強い。でも、日本って、人口減少や少子高齢化も進んでいるので、労働力不足はますます深刻化します。社長だけじゃなく、現場ですら、『AIありがとう』になるはずです。だから、AIのニーズや期待値が他の国より全然高くなってしまう。期待値がもう少しバランスがとれてくると、日本でもよりいい使い方ができるんじゃないかと思いますね。
正直、LLMの開発は、GPUとお金をどれだけツッコめるかのパワープレイ。個人的にはここにあまりコストをかけてもしようがないと思っています。でも、生成AIを使って、どのようなサービスを作れるかという分野は日本でも十分に勝てる領域。飛行機を作るのではなく、やっぱり運航サービスに磨きをかけた方が世界で戦えると思います。