このページの本文へ

インフラ構築が不要で、アプリケーションへの組み込みやプロトタイプ開発も手軽に

基盤モデル無償プランも “国産”の生成AI向け推論API基盤「さくらのAI Engine」提供開始

2025年09月25日 16時30分更新

文● 福澤陽介/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

 さくらインターネットは、生成AI向け推論API基盤「さくらのAI Engine」を、2025年9月24日より一般提供開始した。「さくらのクラウド」のコントロールパネルから利用でき、LLMをはじめとする基盤モデルを、API経由でアプリケーションへ手軽に組み込むことができる。

 さくらのAI Engineでは、生成AI向けクラウドサービス「高火力」を基盤とし、APIを通じて国内外の複数の基盤モデルやRAGの機能を提供する。計算基盤やネットワーク構成なしで、クラウド上の実行環境を利用できるため、インフラ構築が不要。各種AI機能はREST APIとして提供され、アプリケーションへの組み込みやプロトタイプ開発が容易なのが特徴だ。

 推論処理にはNVIDIA製のGPUリソースを採用し、複雑な生成AI処理にも安定したパフォーマンスを発揮するという。また、さくらインターネットの国内データセンターで構成されたインフラ上で基盤モデルを選択できるため、機密情報や個人情報を国内で取り扱うことが可能だ。

 提供形態としては、「基盤モデル無償プラン」と「従量課金プラン」の2種類が用意される。両プラン共通の無償利用枠を超過した場合、基盤モデル無償プランではAPIリクエストに対してレート制御がかかり、従量課金プランでは超過料金が発生する。なお、基盤モデル無償プランは申し込み数に上限があり、上限に達した場合は新規の申し込み受付を停止する。

 両プラン共通の無償枠は、1か月あたり「Chat completions」が3000リクエスト、「Audio transcription」が50リクエスト、「Embeddings」が1万リクエストまで。「ドキュメント(RAG)」には無償枠はなく、最小単位(100チャンク)ごとに料金が発生する。

AI機能の一覧と従量課金プランの超過料金価格

 なお、さくらインターネットは、この発表のタイミングで、フルマネージドの生成AI向け実行基盤「さくらの生成AIプラットフォーム」を、生成AI向けビジネス基盤「さくらのAI」へと名称変更した。さくらのAI Engineは、さくらのAIの第1弾サービスとなり、今後も各種サービスを段階的に拡充していくという。

「さくらのAI」全体イメージ

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

アクセスランキング

  1. 1位

    トピックス

    “持たない家電”ランキング、もはや定番のアレがやっぱり1位なような

  2. 2位

    トピックス

    思い切った慶應義塾 全教職員にNotion導入で168年分の知的資産をAIに食わせるプロジェクトが始動

  3. 3位

    トピックス

    リモートワークは福利厚生なの? ITエンジニアが本当に欲しい福利厚生第1位となる

  4. 4位

    ビジネス

    管理職こそ大事にしないとまずくないか? 約4割が「続けたい、と答えない」現実

  5. 5位

    トピックス

    ほぼスーパーで良くない? コンビニで「思ったより高い」と感じる人76%、実は中高年ほど割高感に悩んでるって知ってた?

  6. 6位

    トピックス

    インバウンドの頑張りランキングベスト3は「大分県」「岐阜県」「佐賀県」 努力が光る結果に

  7. 7位

    ITトピック

    管理職ほど機密情報をAIに入力している実態、なぜ?/27卒学生の就職人気、IT業界トップ企業は/最新インシデントの傾向10パターンまとめ、ほか

  8. 8位

    ビジネス

    これは日本の時限爆弾 事業会社の9割がレガシーシステム放置でヤバすぎる件

  9. 9位

    TECH

    身代金要求攻撃の被害額は「1社平均6.4億円」 それでも6割超が「支払いを否定しきれない」苦境

  10. 10位

    ビジネス

    ランチ抜きが22%!? 物価高で「水筒・コンビニ控え」が定着する中、なぜか「推し活・美容費」だけは死守するオフィスワーカーたち

集計期間:
2026年04月17日~2026年04月23日
  • 角川アスキー総合研究所