マイクロソフトは8月28日、独自開発した2種類のAIモデルを公開した。音声生成に特化した「MAI‑Voice‑1」と、テキスト応答を担う基盤モデル「MAI‑1‑preview」の2つ。
MAI‑Voice‑1は「Copilot Daily」や「Podcasts」機能にすでに組み込まれ、Copilot Labsでもユーザーが音声スタイルや内容を調整できる実験環境として公開されている。わずか1秒未満で1分間分の音声を生成できる高効率性が特徴。表現力豊かな音声が生成可能で、ストーリーテリングやガイド付きの瞑想など、多様な用途が提案されている。
MAI‑1‑previewは、約1万5000台のNVIDIA H100 GPUを用いて学習された、いわゆる基盤モデルの第1号という位置づけ。コミュニティ向けのモデル評価プラットフォーム「LMArena」で公開テストをしており、数週間以内にCopilotの一部機能としても展開される予定だ。
MAIシリーズは、従来のOpenAIモデルへの依存から脱却して、Copilotなどで、より高効率・低コストのAIを提供する戦略の一環とみられる。







