NVIDIA とGoogle Cloud、新しいL4 GPUとVertex AIで構築された新たなジェネレーティブ AI プラットフォームを提供
NVIDIA
ジェネレーティブAI 向け のNVIDIA 推論プラットフォームが Google Cloud Vertex AI と統合、Google Cloud がNVIDIA L4 GPU インスタンスを利用可能にする初の CSPに
カリフォルニア州サンタクララ — GTC — 2023 年 3 月 21 日 — NVIDIAは本日、Google Cloudが新しいL4 GPUとVertex AIを統合し、急速に拡大するジェネレーティブAIアプリケーションを構築する企業の作業を加速させることを発表しました。
Google Cloud は、本日よりプライベート プレビューで利用できるようになったことを発表した G2 仮想マシン(https://cloud.google.com/blog/products/compute/introducing-g2-vms-with-nvidia-l4-gpus?hl=en )のによって、顧客に NVIDIA L4 TensorコアGPU (https://www.nvidia.com/en-us/data-center/l4/ )を提供する最初のクラウド サービス プロバイダとなります。 さらに、大規模な生成AIモデルの構築、チューニング、デプロイをサポートするVertex AIで、L4 GPUが最適化されたサポートで利用可能になります。
開発者は最新の先端技術にアクセスできるようになり、新しいアプリケーションを迅速かつコスト効率よく立ち上げて実行できるようになります。L4 GPUは、ほぼすべてのワークロードに対応するユニバーサル GPU であり、CPU の 120 倍の AI 性能をビデオ パフォーマンスで発揮できる強化された AI ビデオ機能と、99% 優れたエネルギー効率を兼ね備えています。
NVIDIA の創業者/CEOであるジェンスン フアン (Jensen Huang) は次のように述べています。「ジェネレーティブ AI への関心の高まりを受けて、企業はビジネス モデルをサポートするためにクラウドベースのコンピューティングに目を向けています。NVIDIAは Google Cloud と協力して、このような企業が必要とする機能を簡単に利用できるようにし、新しく作成されるすばらしいツールやアプリケーションをサポートできるようにします」
Google Cloud のシステムおよびサービス インフラストラクチャ担当バイス プレジデントである Amin Vahdat 氏は次のように述べています。「ジェネレーティブ AI はコンピューティングの新時代の象徴であり、この時代には Google Cloud で提供されるスピード、スケーラビリティ、信頼性が求められます。当社の顧客が Gen AI の可能性を探求し始める中、ワークロードに最適化された Compute Engine ポートフォリオの一部として、NVIDIA の最新の L4 GPU イノベーションを顧客に提供できることを誇りに思います」
新しいジェネレーティブ AI アプリケーションの実現を支援
Google Cloud は、ジェネレーティブ AI アプリケーションを構築するさまざまな組織にインフラストラクチャを提供していますが、その多くは専門家が仕事をより良く、より速く行うのに役立つように設計されています。アプリケーションの運用を成功させるには、迅速な推論が重要です。
ジェネレーティブ AI は、人々がつながり、楽しむのに役立つ多くの新しいアプリも推進しています。Dream と呼ばれる AI を活用したテキストからデジタル アートへの変換アプリを提供する WOMBO は、Google Cloud 上の NVIDIA の L4 推論プラットフォームに早期アクセスしました。
「WOMBO は最新の AI テクノロジを利用して、人々がユーザーのプロンプトから没入型のデジタル アートワークを作成し、アイデアだけであらゆるスタイルの高品質でリアルなアートを作成できるようにします」と語るのは、WOMBO の CEO である Ben-Zion Benkhin 氏です。「NVIDIA の L4 推論プラットフォームにより、独自のアートワークを作成して共有しようとするユーザーに、より優れた効率的な画像生成エクスペリエンスを提供できるようになるでしょう」
Descript は AI を活用した編集機能を提供しています。クリエーターは数クリックでフィラー ワードを削除したり、キャプションを追加したり、ソーシャル メディア クリップを作成したりすることができます。あるいは Descript のジェネレーティブ AI 音声クローンを使用して、キーボード入力するだけで音声の間違いを修正したり、ナレーションを一から作成したりすることもできます。
「Descript は NVIDIA TensorRT を使用してモデルを最適化し、AI 推論を加速しています」と語るのは、Descript の CEO である Andrew Mason 氏です。「これにより、ユーザーはビデオの背景を置き換え、音声を強化して、スタジオなしでスタジオ品質のコンテンツを作成できます」
提供予定と詳細情報
NVIDIA L4 GPU は、Google Cloud のプライベート プレビューで利用することができます。こちらからアクセスを申請してください(https://docs.google.com/forms/d/e/1FAIpQLSenWgT2-18jLu7Glv-3A95n_NmAyqDKEyGecOUWOmI_rWG_Uw/viewform )。
GTCの基調講演で、NVIDIAのジェネレーティブAI向けの推論プラットフォームがGoogle Cloudに統合されたことをフアンが紹介しています。リプレイ(https://www.youtube.com/watch?v=DiGB5uAYKAg&t=3131s )をぜひご覧ください。
NVIDIA について
1993 年の設立以来、NVIDIA (NASDAQ: NVDA) はアクセラレーテッド コンピューティングのパイオニアです。同社が 1999 年に発明した GPU は、PC ゲーム市場の成長を促進し、コンピューター グラフィックスを再定義して、現代の AI の時代に火をつけながら、メタバースの創造を後押ししています。NVIDIA は現在、業界を再形成しているデータセンター規模の製品を提供するフルスタック コンピューティング企業です。詳細については、https://nvidianews.nvidia.com/ を参照してください。