La reacción de los cibernautas a los primeros avances de Sora fue más bien dividida. Una parte recibió estos videos con mucha sorpresa y entusiasmo, sin embargo, otro sector se mostró más bien preocupado por el posible riesgo de perder sus trabajos.
La revolución de la inteligencia artificial avanza a pasos agigantados, un nuevo día significa una evolución para esta tecnología que intenta simular la inteligencia humana. En este sentido, OpenAI compartió algunos avances de su nueva herramienta: Sora.
Estos avances se presentaron este jueves 15 de febrero y la reacción de los cibernautas fue más bien dividida. Una parte quedó maravillada con estos videos creados por la IA, mientras que otro sector se mostró sorprendido y preocupado porque su trabajo podría estar peligrando.
Sin embargo, antes de avanzar, es necesario señalar que esta nueva tecnología no se encuentra accesible para todos, solamente para investigadores de la empresa. Pero no te preocupes, a continuación te explicaremos en que consiste lo nuevo de OpenAI.
¿Qué es Sora y cómo funciona?
De acuerdo a OpenAI, Sora es una IA que genera videos a partir de texto, en la que simplemente le tienes que escribir a través de un prompt (comando textual) cualquier descripción corta y esta te la convertirá en un video de alta definición y con muchos detalles.
Puede parecer nada nuevo o innovador, ya que hoy en día existen muchas inteligencias artificiales que crean imágenes a partir de texto, no obstante, por lo que presenta Sora estaría un paso adelante en todos los sentidos.
“Sora es capaz de generar escenas complejas con múltiples personajes, tipos específicos de movimiento y detalles precisos del sujeto y fondo. El modelo entiende no solo lo que el usuario ha pedido en el prompt, sino también cómo esas cosas existen en el mundo físico”, específica OpenAI.
La empresa de IA señala que este sistema tiene una profunda comprensión del lenguaje, lo que le permite interpretar con precisión los comandos de texto. Incluso, puede crear múltiples tomas dentro de un solo vídeo generado, manteniendo con precisión a los personajes y el estilo visual.
Todo esto es posible porque el modelo ha sido entrenado con una enorme biblioteca de vídeos, de esta forma la IA es capaz de reconocer movimientos, descripciones y cualquier cosa que le pidas. De todas formas, las capacidades de Sora dependerán de que tan detallados sean los prompts que se le detallen.
Un minuto de calidad
Hasta el momento, y como se encuentra en una fase temprana de prueba, la herramienta permite generar videos de 1 minuto de duración. A pesar de ello, es tiempo suficiente para demostrar de lo que es capaz de crear, he aquí algunos ejemplos:
Introducing Sora, our text-to-video model.
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024
Prompt: “La hermosa ciudad de Tokio, cubierta de nieve, está llena de actividad. La cámara se desplaza por las concurridas calles de la ciudad, siguiendo a varias personas que disfrutan del hermoso clima nevado y compran en los puestos cercanos. Preciosos pétalos de sakura vuelan con el viento junto a los copos de nieve”.
Prompt: “A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.” pic.twitter.com/0JzpwPUGPB
— OpenAI (@OpenAI) February 15, 2024
Prompt: “Un avance de película que presenta las aventuras del astronauta de 30 años que lleva un casco de motocicleta de lana roja, bajo un cielo azul, en un desierto salino, con un estilo cinematográfico, filmado en película de 35 mm, y colores vibrantes”.
Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.… pic.twitter.com/cjIdgYFaWq
— OpenAI (@OpenAI) February 15, 2024
Prompt: “Una mujer elegante camina por una calle de Tokio llena de neones cálidos y luminosos y señalización animada de la ciudad. Lleva una chaqueta de cuero negra, un vestido largo rojo y botas negras, además de un bolso negro. Sus gafas de sol y el labial rojo le dan un aire sofisticado. Avanza con confianza y naturalidad. La calle está húmeda y reflectante, creando un efecto espejo con las luces de colores. Muchos peatones transitan por allí”.