La emblemática Mona Lisa, inmortalizada por Leonardo da Vinci, ahora puede hacer algo más que simplemente sonreír, gracias a los avances en inteligencia artificial de Microsoft.
Investigadores de Microsoft presentaron recientemente un innovador modelo de inteligencia artificial, VASA-1, capaz de tomar una imagen estática de un rostro y un fragmento de audio para crear un video convincente de la persona hablando.
Este proceso incluye desde rostros fotorrealistas hasta ilustraciones, dotándolos de sincronización labial y movimientos faciales naturales, consigna CNN.
Una Mona Lisa que Recita Rap
En una demostración impresionante, los investigadores animaron a la Mona Lisa para que recitara un rap cómico de la actriz Anne Hathaway, destacando el potencial creativo y divertido de esta tecnología.
El modelo VASA-1 promete aplicaciones en educación y accesibilidad para personas con dificultades de comunicación, así como la creación de compañeros virtuales. Sin embargo, también suscita preocupaciones sobre el posible abuso y la proliferación de desinformación.
Microsoft, siguiendo los pasos de OpenAI con su herramienta Sora, planea una implementación cuidadosa del modelo VASA-1. La empresa prioriza la responsabilidad y la conformidad con la normativa para evitar usos indebidos de esta tecnología.
Detalles Técnicos
El entrenamiento del modelo incluyó una amplia gama de videos faciales, permitiendo a VASA-1 reconocer movimientos naturales como el parpadeo, la expresión facial y la mirada. Aunque los videos generados muestran realismo, aún presentan señales de su origen artificial.
Microsoft destaca que su modelo supera a herramientas similares y sienta las bases para interactuar en tiempo real con avatares realistas, impulsando la conversación entre humanos y sistemas de inteligencia artificial.
Este avance tecnológico, aunque emocionante, plantea importantes cuestiones éticas y regulatorias que deben abordarse antes de su implementación generalizada.