コジタイ(CogitAI、ソニーが資本参加)という名のスタートアップ企業が、企業による強化学習の利用を可能にするプラットフォームを開発した。強化学習は、人間の囲碁チャンピオンを打ち負かす能力を、人工知能(AI)プログラムである「アルファ碁(AlphaGo)」に与えた手法である。
グーグルのAI関連子会社であるディープマインドが開発したアルファ碁は、囲碁の打ち方を練習によって自己学習した。囲碁に勝つためのもっとも有利な戦略を、プログラマーが手動でコーディングすることは、事実上不可能だ。その代わりに強化学習を利用すれば、人間の世界トップクラスのプレイヤーに勝つ方法を、プログラムが自ら考え出せるようになる。
強化学習は、まだ実験的なテクノロジーであるとは言え、産業界に足場を固めつつある。ディープマインドは強化学習を、データセンターや風力タービンのパフォーマンスを最適化するために活用するつもりだと語っている。アマゾンは最近、強化学習プラットフォームの提供を開始したが、どちらかと言えば研究者や学者向けだ。コジタイの最初の企業顧客には、医薬品製造向けロボットに従事する企業が含まれている。コジタイのプラットフォームにより、医薬品のオーダーを処理する最適な方法を、ロボットが自ら考え出せるようになる。
コジタイは、テキサス大学のピーター・ストーン教授を含む、数人の優秀なAI専門家によって設立された。顧問を務めるのは、強化学習の生みの親の一人であるリチャード・サットン博士だ。
ストーン教授によると、コジタイのプラットフォームは、ある状況で学んだことを、新たな状況で応用する能力を備えた初のプラットフォームでもあり、学習し続けるAIプログラムに向けた第一歩となるという。「コジタイのプラットフォームには、最先端の強化学習アルゴリズムがすべて備わっています。継続的な学習に向けて、いくらか前進したと言えるでしょう」と、ストーン教授は語る。