Xinhua, la agencia de prensa estatal de China, ha presentado nuevos «presentadores de AI», compuestos digitales creados a partir de imágenes de anfitriones humanos que leen las noticias usando voces sintetizadas.
No está claro exactamente qué tecnología se ha utilizado para crear a los presentadores, pero están en línea con la investigación más reciente sobre aprendizaje automático. Parece que Xinhua ha utilizado imágenes de anclajes humanos como capa base y luego animó partes de la boca y la cara para convertir al orador en un títere virtual. Al combinar esto con una voz sintetizada, Xinhua puede programar los anclajes digitales para leer las noticias, mucho más rápido que usando el CGI tradicional.
Según informes de Xinhua y el South China Morning Post, se crearon dos presentadores (una para transmisiones en inglés y otra para chino) en colaboración con la empresa local de motores de búsqueda Sogou. Xinhua dice que los presentadores tienen «perspectivas interminables» y pueden utilizarse para generar informes de noticias a bajo costo para la televisión, la web y la producción móvil de la agencia.
Cada presentador puede «trabajar las 24 horas del día en su sitio web oficial y en varias plataformas de redes sociales, reduciendo los costos de producción de noticias y mejorando la eficiencia», dice Xinhua.
En los videos del presentador de habla inglesa, es obvio que el rango de expresiones faciales es limitado y que la voz es claramente artificial. Pero la investigación del aprendizaje automático en esta área está haciendo mejoras rápidas, y no es difícil imaginar un futuro en el que los presentadores sean indistinguibles de los reales.
Deja un comentario