Nvidia Maxine transformará la industria de las videoconferencias

Las videoconferencias les han permitido a muchos ser productivos desde cualquier lugar. Ahora, Nvidia está impulsando la productividad de los desarrolladores de aplicaciones de videoconferencia, centros de llamadas y streaming dentro de la industria valuada en 10 mil millones de dólares al permitirles integrar fácilmente la IA en sus flujos de trabajo.
La nueva versión de la plataforma para desarrolladores Maxine AI transforma la creación de aplicaciones de videoconferencia en tiempo real de última generación con características que permiten una mayor flexibilidad, participación y eficiencia del usuario.

Disponible a través de la plataforma de software Nvidia AI Enterprise, Maxine permite a los desarrolladores aprovechar las últimas funciones impulsadas por inteligencia artificial, como calidad mejorada de video y audio y efectos de realidad aumentada, para convertir las videollamadas diarias de los usuarios en experiencias colaborativas atractivas.

Ampliación de las videoconferencias con nuevas funciones de Maxine

La plataforma para desarrolladores Maxine AI permite a los desarrolladores acceder e integrar fácilmente funciones mejoradas por inteligencia artificial en tiempo real que aumentan la calidad de la participación de los usuarios de videoconferencias.

Funciones como la reducción de ruido, la eliminación de ruido y la mejora de video y la voz de estudio mejoran la calidad de las transmisiones de audio y video. Con capacidades avanzadas como corrección de la mirada, retrato en vivo y funciones futuras como la iluminación de video y el microservicio en la nube Maxine 3D, los desarrolladores pueden mejorar la participación en las videoconferencias y la conexión personal.

La plataforma amplía la utilidad de los modelos de inteligencia artificial de última generación para efectos de audio, video y realidad aumentada con múltiples formas para que los desarrolladores ofrezcan funciones de Maxine con ofertas de kits de desarrollo de software, microservicios e incluso interfaz de programación de aplicaciones (API) puntos finales entregados desde la infraestructura de nube de Nvidia.

Las actualizaciones de funciones de producción de Maxine disponibles ahora incluyen las siguientes:

  1. Contacto visual: El modelo de contacto visual mejorado proporciona redirección de la mirada con movimientos oculares naturales para que los participantes se involucren más en la reunión.
  2. Fuente de voz: Este nuevo modelo hace coincidir la voz del hablante con una voz objetivo manteniendo la información lingüística y la prosodia (ritmo y tono) sin cambios.
  3. Reducción de ruido de fondo (BNR) 2.0: Este modelo actualiza la reducción de ruido para la escucha humana y para la codificación de idiomas con un esfuerzo específico para disminuir las tasas de error de palabras en la codificación.

Las nuevas funciones disponibles para acceso anticipado esta primavera incluyen las siguientes:

  1. Retrato en vivo con voz: Este modelo permite al usuario dirigir su retrato con voz directa o cualquier fuente de audio, lo que les permite lucir siempre lo mejor posible durante una conferencia telefónica.
  2. Voz de estudio: Este modelo permite que los micrófonos comunes de auriculares, portátiles y de escritorio ofrezcan el sonido de un micrófono de estudio de alta gama, lo que permite a los usuarios sonar siempre lo mejor posible durante una conferencia telefónica.

El programa de acceso temprano a Maxine comparte versiones de preproducción y prelanzamiento de las próximas funciones para que los desarrolladores opinen sobre su utilidad y el perfeccionamiento de los modelos de Maxine. En esta versión, solicitamos a los desarrolladores comentarios sobre las funciones que se encuentran en las primeras etapas del proceso de desarrollo, entre las que se incluyen las siguientes:

  1. Maxine 3D: Este microservicio en la nube, que se mostró anteriormente como una demostración de investigación en SIGGRAPH 2023, ofrece un nuevo nivel de participación para videoconferencias con tecnología NeRF en tiempo real que eleva el video 2D a 3D.
  2. Reiluminación de video: Este nuevo modelo utiliza una imagen de alto rango dinámico para iluminar al usuario, lo que permite una combinación perfecta de la iluminación del usuario con varias imágenes de fondo.
  3. Puntos finales de API: Los puntos finales de API ofrecen a los desarrolladores la flexibilidad de acceder a las funciones de Maxine a través de la infraestructura de nube de NVIDIA, lo que facilita aún más la integración de Maxine.

«En un mundo cada vez más conectado, el desarrollo de videollamadas cada vez más elaboradas desempeña un papel crucial para facilitar la colaboración y mantener la productividad en entornos virtuales. La plataforma para desarrolladores Maxine AI está a la vanguardia de este desarrollo, permitiendo a los usuarios conectarse de una forma más eficaz e inmersiva que nunca», añade Marcio Aguiar, director de la división Enterprise de NVIDIA para América Latina.

Jugo y Arsenal Football Club marcan grandes goles

Los eventos deportivos son la experiencia humana definitiva, que une a equipos y aficionados más allá de fronteras y barreras lingüísticas. Jugo, que utiliza la función AI Green Screen de Maxine, ofrece una plataforma digital para eventos virtuales que permite a las empresas crear experiencias inmersivas con Unreal Engine que reúnen a fanáticos de todo el mundo sin el uso de un estudio de producción completo.

El Arsenal FC, una poderosa franquicia de la Premier League de Inglaterra, está colaborando con Jugo para revolucionar la forma en que el club de fútbol se relaciona con su base de 600 millones de fanáticos en todo el mundo. La colaboración ofrece nuevas experiencias de entretenimiento deportivo virtual para impulsar la participación de los seguidores de todo el mundo. Jugo aporta el poder de la interacción humana real a los eventos del Arsenal, creando conexiones virtuales realistas entre los seguidores y los héroes deportivos del club.

“La plataforma Jugo Experience está transformando el mercado de las marcas en su búsqueda de conciencia y compromiso global”, declaró Richard Stirk, director ejecutivo de Jugo Experience. “Arsenal F. C. es el ejemplo perfecto de extensión de marca global. La flexibilidad para crear una experiencia de marca inmersiva es clave para la oferta de Jugo y la plataforma para desarrolladores Maxine AI es un elemento básico de esta flexibilidad”.

Estableciendo un nuevo estándar de videoconferencias mejoradas con IA

Entre los primeros clientes en aprovechar el conjunto más nuevo de funciones dentro del programa de acceso anticipado para crear un estudio audiovisual profesional a partir de cámaras y micrófonos básicos se encuentran Gemelo, Pexip, Spectacle y VideoRequest.

Fuente: Comunicado

Deja un comentario