AI開発大手のOpenAIは3月1日、同社の会話型AI「ChatGPT」と、音声をテキストへ変換するオープンソースAI「Whisper」のAPIを開発者向けに公開した。ChatGPT APIは1000トークンあたり0.002ドル(約0.27円)、Whisper APIは音声1 分あたり0.006ドル(約0.82円)で利用できる。
ChaGPTは既存モデルより10倍安く
ChatGPT APIは「ChatGPT」をAPI化したもの。このAPIを利用すれば、開発者は自社のアプリやサービスにChatGPTをより平易に組み込むことができる。
3月1日時点のバージョンは「gpt-3.5-turbo 0301」で、少なくとも6月1日まではサポートされる予定。また、4月にはより新しいバージョンの「gpt-3.5-turbo」安定版がリリースされる見込みだ。
なお、開発者側は自分で利用するバージョンを選ぶことができる。
価格は1000トークン(英語の場合で約4000文字または750語)あたり0.002ドル(約0.27円)で、同社が以前から提供していた「GPT-3.5」モデルより約10倍安い。
オプションとして特定のモデルバージョンとシステムパフォーマンスをより詳細に制御したいユーザー向けに専用インスタンスも用意されるが、こちらの価格は非公開(要問い合わせ)だ。
同社によるとChatGPT APIは、SNSサービスSnapchatのチャット型AI「My AI」など複数のサービスで既に活用されているという。
Whisper APIではより大規模なモデルを利用可能に
音声をテキストへ変換するWhisperのAPIでは、より大規模なモデルのV2を利用可能となる。
価格は音声1 分あたり0.006ドル(約0.82円)。「transcriptions」(ソース言語で書き起こす)と「translations」(英語に書き起こす)の2つのエンドポイントが用意される。
入力する音声のコーデックは、m4a、mp3、mp4、mpeg、mpga、wave、webmの7種類だ。
OpenAIによると、Whisper APIは高レベルの最適化により、他のサービスよりも高速なパフォーマンスを発揮できるという。