NVIDIA デジタル ヒューマン テクノロジーが AI キャラクターに命を吹き込む
プレスリリース要約
カリフォルニア州サンノゼ – GTC – 2024 年 3 月 18 日 – NVIDIA は本日、幅広い業界の主要な AI アプリケーション開発者が NVIDIA デジタル ヒューマン テクノロジを使用して、商用アプリケーションのための本物のようなアバターやダイナミックなゲーム キャラクターを作成していることを発表しました。その成果は、今週カリフォルニア州サンノゼで開催される世界的な AI カンファレンスである GTC(https://www.nvidia.com/ja-jp/gtc/) で展示され、HippocraticAI(https://www.hippocraticai.com/)、Inworld AI(https://inworld.ai/)、UneeQ(https://www.digitalhumans.com/) などのテクノロジ デモンストレーションで見ることができます。
音声とアニメーション用の NVIDIA Avatar Cloud Engine (ACE)(https://developer.nvidia.com/ace)、言語用の NVIDIA NeMo™(https://www.nvidia.com/ja-jp/ai-data-science/products/nemo/)、レイトレース レンダリング用の NVIDIA RTX™(https://www.nvidia.com/ja-jp/geforce/rtx/)は、開発者が AI を活用した自然言語対話が可能なデジタル ヒューマンを作成できるようにする構成要素であり、会話をより現実的で豊かなものにします。
NVIDIA の開発者およびパフォーマンス テクノロジ担当バイス プレジデントであるジョン スピッツァー (John Spitzer) は次のように述べています。「NVIDIA は、デジタル ヒューマンの創造のための AI を活用した世界クラスのテクノロジを開発者に提供します。これらのテクノロジにより、デジタル インタラクションをリアルに感じるために必要な複雑なアニメーションや会話音声が強化されるでしょう」
世界クラスのデジタル ヒューマン テクノロジ
デジタル ヒューマン テクノロジ スイートには、以下のAI を活用した言語、音声、アニメーション、グラフィックスが含まれています。
・ NVIDIA ACE — NVIDIA Audio2Face™(https://www.nvidia.com/ja-jp/omniverse/apps/audio2face/) によるフェイシャル アニメーションと、NVIDIA Riva(https://www.nvidia.com/ja-jp/ai-data-science/products/riva/) 自動音声認識 (ASR) およびテキスト読み上げ (TTS) による音声にて、開発者がデジタル ヒューマンに命を吹き込むのを支援するテクノロジです。ACE マイクロサービスは、ローカル GPU の機能に応じてクラウドと PC 全体でモデルを実行できる柔軟性を備えており、ユーザーが最高の体験を確実に受けられるようにします。
・ NVIDIA NeMo — 開発者が正確なデータ キュレーション、最先端のカスタマイズ、Retrieval-Augmented Generation(https://blogs.nvidia.co.jp/2023/11/17/what-is-retrieval-augmented-generation/)、アクセラレーテッド パフォーマンスを備えたエンタープライズ対応の生成 AI モデルを提供できるエンドツーエンドのプラットフォームです。
・ NVIDIA RTX — RTX Global Illumination(https://developer.nvidia.com/rtx/ray-tracing/rtxgi) (RTXGI) や DLSS 3.5(https://www.nvidia.com/en-us/geforce/news/nvidia-dlss-3-5-ray-reconstruction/) などのレンダリング テクノロジのコレクションであり、ゲームやアプリケーションでのリアルタイム パス トレースが可能になります。
デジタル ヒューマンとバーチャル アシスタントの構成要素
デジタル ヒューマン テクノロジの新機能を紹介するために、NVIDIA は、Hippocratic AI、Inworld AI、UneeQ などの主要な開発者と業界を超えて一連の新しいデモンストレーションに取り組みました。
Hippocratic AI(https://www.hippocraticai.com/) は、安全性を重視し、LLM を利用したタスク特化のヘルスケア エージェントを作成しました。エージェントは患者に電話をかけ、ケア調整タスクをフォローアップし、術前指示を伝え、退院後の管理などを行います。GTC では、NVIDIA は HippocraticAI と協業して、NVIDIA ACE マイクロサービス、NVIDIA Audio2Face、NVIDIA Animation Graph(https://docs.omniverse.nvidia.com/extensions/latest/ext_animation-graph.html)、および NVIDIA Omniverse™ Streamer Client(https://docs.omniverse.nvidia.com/streaming-client/latest/user-manual.html) を使用するソリューションを拡張し、生成 AI ヘルスケア エージェント アバターの可能性を示しました。
Hippocratic AI の共同創設者兼 CEO のMunjal Shah 氏は次のように述べています。「当社のデジタル アシスタントは、世界中の患者に有益でタイムリーかつ正確な情報を提供します。NVIDIA ACE テクノロジは、最先端のビジュアルとリアルなアニメーションでそれらに命を吹き込み、患者とのよりよいつながりを実現します」
UneeQ(https://www.digitalhumans.com/) は、顧客サービスやインタラクティブ アプリケーション用の AI 搭載アバターの作成に特化した自律型デジタル ヒューマン プラットフォームです。同社のデジタル ヒューマンはオンラインでブランドを代表し、顧客にリアルタイムでコミュニケーションをとり、顧客が安心して購入できるようにします。UneeQ は、NVIDIA Audio2Face マイクロサービスをプラットフォームに統合し、それを Synanim ML(https://www.digitalhumans.com/features/synanim) と組み合わせることで、顧客体験とエンゲージメントを向上させるための非常にリアルなアバターを作成しました。
「UneeQ は、NVIDIA アニメーション AI と当社独自の Synanim ML 合成アニメーション テクノロジを組み合わせて、感情的に反応するリアルタイムのデジタル ヒューマン インタラクションを提供し、対話型 AI を活用したダイナミックなエクスペリエンスを提供します」と UneeQ の創業者兼 CEO のDanny Tomsett 氏は述べています。
動的なノン プレイアブル キャラクターをゲームに導入する
NVIDIA ACE は、ゲーム キャラクターに命を吹き込むために設計されたテクノロジ スイートです。「Covert Protocol」は、Inworld AI(https://inworld.ai/) が NVIDIA と提携して作成した新しいテクノロジ デモンストレーションであり、ゲーム内でのキャラクター インタラクションの限界を押し広げます。Inworld の AI エンジンには、正確な音声テキスト変換のための NVIDIA Riva と、本物のようなフェイシャル パフォーマンスを提供するための NVIDIA Audio2Face が統合されています。
Inworld の AI エンジンは、ノン プレイアブル キャラクター (NPC) のパフォーマンスにマルチモーダルなアプローチを採用し、認知、知覚、行動システムを統合して、美しく造りこまれた環境のなかで見事な RTX レンダリング キャラクターによる没入感のある物語を実現します。
Inworld AI の CEO、Kylan Gibbs 氏は次のように述べています。「NVIDIA ACE マイクロサービスと Inworld エンジンを組み合わせることで、開発者は動的な物語を推進できるデジタル キャラクターを作成でき、プレイヤーがどのように解読、推理、プレイできるかについて新たな可能性が開かれます」
世界中のゲーム パブリッシャーは、NVIDIA ACE がゲーミング体験をどのように向上できるかを評価しています。
ヘルスケア、ゲーム、金融サービス、メディア エンターテインメント、小売業の開発者が ACE を採用
トップクラスのゲームおよびデジタル ヒューマンの開発者たちは、ACE および生成 AI テクノロジを使用して、ゲームやアプリケーションにおけるプレイヤーと NPC 間のインタラクションを変革する方法を開拓しています。
ACE を採用している開発者とプラットフォームには、Convai、Cyber Agent、Data Monsters、Deloitte、HippocraticAI、IGOODI、Inworld AI、Media.Monks、miHoYo、NetEase Games、Perfect World、Openstream、OurPalm、Quantiphi、楽天証券、Slalom、SoftServe、Tencent、Top Health Tech、Ubisoft、UneeQ、Unions Avatars などがあります。
NVIDIA ACE の詳細については、https://developer.nvidia.com/ace をご覧ください。プラットフォーム開発者は、デジタル ヒューマン テクノロジのフルスイートまたは個々のマイクロサービスを自社の製品に組み込むことができます。
開発者は、開発中の AI モデルを入手するための早期アクセス プログラムに申請することで、NVIDIA ACE(https://developer.nvidia.com/ace) との歩みを開始できます。利用可能なモデルを探索するために、開発者は現在、ai.nvidia.com(https://www.nvidia.com/ja-jp/ai/#referrer=ai-subdomain) で Riva および Audio2Face 用の生成 AI の展開を加速するように設計された、使いやすいマイクロサービスのセットである NVIDIA NIM を評価し、アクセスできます。
NVIDIAについて
1993年の創業以来、NVIDIA(https://www.nvidia.com/ja-jp/) (NASDAQ: NVDA) はアクセラレーテッド コンピューティングのパイオニアです。同社が 1999 年に発明した GPU は、PC ゲーム市場の成長を促進し、コンピューター グラフィックスを再定義して、現代の AI の時代に火をつけながら、各種産業のデジタル化を後押ししています。NVIDIA は現在、業界を再形成しているデータセンター規模の製品を提供するフルスタック コンピューティング企業です。詳細は、こちらのリンクから:https://nvidianews.nvidia.com/
引用元:PR TIMES