Synthesia, una empresa de inteligencia artificial, revela sus avatares de vídeo digitales: así funcionan

Synthesia, una empresa de inteligencia artificial, revela sus avatares de vídeo digitales: así funcionan

¿Alguna vez has soñado con un gemelo digital? ¿O temes tener que volver a grabar una serie de vídeos? Como en un escenario de ciencia ficción, un desarrollador de generación de medios sintéticos con sede en Londres Síntesis ha lanzado un servicio que brinda a los clientes la posibilidad de crear representaciones en video digitales de ellos mismos que pueden usar en las redes sociales y en campañas de marketing.

Synthesia anunció por primera vez el lanzamiento de sus avatares personales durante una transmisión en vivo el miércoles. Según Synthesia, estos avatares se pueden generar con sólo dos minutos de vídeo desde una cámara web o un teléfono móvil, aunque he descubierto que crearlos lleva mucho más tiempo.

La compañía dice que sus avatares personales de IA podrían usarse para generar videos de capacitación para empleados, explicaciones de productos, materiales de ventas y marketing, o para interactuar con los clientes. El beneficio para las empresas es que estos diferentes vídeos se pueden crear utilizando el mismo avatar de IA sin tener que volver a grabar al actor o empleado en una sesión en persona completamente nueva.

Sin embargo, existen limitaciones que abordaré.

Prevenir el abuso

Synesthesia reconoce que la capacidad de crear réplicas de alta fidelidad de personas reales podría utilizarse con fines maliciosos o engañosos. sintesia dijo Descifrar evita que su tecnología se utilice para crear deepfakes generados por IA siguiendo tres principios: consentimiento, control y colaboración.

«Nunca crearemos un avatar de IA sin el consentimiento explícito de alguien», dijo Alexandru Voica, jefe de políticas y asuntos corporativos de Synthesia. “Nuestra plataforma proporciona un entorno seguro para los usuarios, garantizando que sus datos estén seguros, sus avatares estén controlados y el abuso se minimice mediante la moderación del contenido en el momento de la creación. »

Para hacer eco del punto de Voica, antes de que comience la generación del avatar, se le pide al usuario que dé su consentimiento para la recopilación, uso, almacenamiento y divulgación de sus grabaciones de video y audio por parte de Synthesia Limited y sus proveedores «para autenticar el envío del avatar personal».

Voica dijo que Synthesia también está trabajando con pares de la industria, formuladores de políticas y otros para desarrollar mejores prácticas para el uso responsable de la IA.

«Los deepfakes no consensuados son la mayor fuente de contenido dañino en línea», dijo Voica. “Dado que los avatares de Synthesia no se pueden crear sin el consentimiento explícito del ser humano que representan, no estamos en el negocio de los deepfakes no consensuales, lo que limita en gran medida el potencial de abuso de nuestra plataforma y de los avatares personales en particular. »

Cuando se le preguntó si había avatares personales o avatares en general que Synthesia no permitiría, Voica dijo que la compañía utiliza filtros tecnológicos avanzados y moderación de contenido humano para garantizar que Synthesia no se utilice para facilitar la creación de contenido inapropiado o dañino.

«Cuando alguien intenta hacer un video, ese contenido pasará por nuestro proceso de moderación de contenido antes de generarse», dijo Voica. Descifrar“Si se descubre que un vídeo infringe nuestras reglas, nunca se creará. Los reincidentes o infracciones graves también pueden dar lugar a la desactivación de la cuenta. »

Crea tu avatar

Para comenzar, los usuarios deben crear una cuenta de Synthesia. Los avatares personales están disponibles en los niveles «Inicio», «Creador» y «Empresa». Una suscripción anual para las cuentas Starter y Creator oscila entre $18 y $59 por mes, respectivamente. Las empresas interesadas en obtener una licencia comercial deben comunicarse con Synthesia para determinar precio.

El proceso funcionó mejor en mi MacBook Pro que en mi PC con Windows 11, ambos usando el navegador Brave. Cuando estés listo, Synthesia te preguntará si deseas grabar directamente desde la plataforma o subir un vídeo. Elegí ahorrar.

Según Synthesia, un avatar personal se crea utilizando una forma avanzada de tecnología de bucle llamada alineación automática, que puede determinar cuándo un avatar está hablando y hace que los movimientos del cuerpo respondan mejor. Los idiomas disponibles para los avatares personales son inglés, alemán, francés, español, árabe, croata, filipino, griego, hindi, italiano, rumano, ruso, turco y ucraniano.

Antes de grabar, Synthesia recomienda utilizar un ambiente tranquilo y bien iluminado, hacer descansos entre párrafos, no cubrirse la cara, utilizar un lenguaje corporal natural, ser positivo y sonreír.

En mi experiencia con la herramienta, también se recomienda asegurarse de que la cámara no esté demasiado cerca para que parezca más pequeño en el encuadre. Si decide descargar un vídeo en lugar de utilizar la grabadora, utilice un micrófono para obtener una mejor calidad de audio.

Synthesia le proporcionará un guión para leer, que le llevará aproximadamente tres minutos recitar. Dependiendo del generador de avatar, se requieren de uno a cinco minutos de audio y video para completar el proceso.

El proceso fue relativamente simple para algo que podría tener un impacto importante en la marca de una empresa o creador de contenido.

Si bien el proceso de descargar, guardar y reproducir el guión tomó menos de cinco minutos, Synthesia dijo que la generación real del avatar personal puede demorar hasta 24 horas. Mi primer vídeo tardó unas 10 horas en crearse. Después de eso, los siguientes vídeos que presentaban los nuevos guiones que proporcioné duraron unos cinco minutos.

Este es mi avatar personal de Synthesia. ¿Qué opinas?

El tamaño del vídeo terminado se puede cambiar para adaptarlo a las necesidades de la plataforma en la que se cargará, ya sea YouTube, Instagram o TikTok. Descubrí que generar nuevos vídeos utilizando un nuevo guión con un avatar personal me llevó unos cinco minutos.

Sin embargo, no puedes cambiar tu fondo, vestimenta o apariencia sin generar un nuevo avatar personal, lo cual, como se indicó anteriormente, puede demorar hasta un día.

Aunque los avatares personales eran muy impresionantes, era extraño ver una versión animada de mí mismo, un ejemplo del «valle inquietante». El valle inquietante ocurre cuando una representación fotorrealista de un ser humano se acerca demasiado a la realidad, lo que hace que su apariencia sea aún más desconcertante.

A pesar de esto, estos avatares de vídeo son impresionantes y podrían pasar por reales si el espectador no los examina cuidadosamente.

Editado por Ryan Ozawa.

Generalmente inteligente Hoja informativa

Un viaje semanal de IA contado por Gen, un modelo de IA generativa.