OpenAI, la reconocida empresa de inteligencia artificial, ha presentado su nuevo modelo de generación de video, denominado Sora. Este modelo promete revolucionar la forma en que creamos contenido visual, ya que es capaz de generar escenas realistas e imaginativas a partir de simples instrucciones de texto.
¿Qué es Sora?
Sora es un modelo de IA que permite a los usuarios crear videos de calidad profesional de hasta un minuto de duración, basados completamente en indicaciones escritas (el llamado “prompt”). Según OpenAI, Sora puede crear “escenas complejas con múltiples personajes, tipos específicos de movimiento y detalles precisos del tema y el fondo”. Además, el modelo tiene la capacidad de comprender cómo “existen los objetos en el mundo físico” y puede “interpretar con precisión los accesorios y generar personajes convincentes que expresan emociones vibrantes”.
Capacidades de Sora
Además de generar vídeos a partir de texto, Sora también puede generar un vídeo basado en una imagen fija, completar fotogramas faltantes en un vídeo existente o ampliarlo. Aunque el modelo puede tener dificultades para simular con precisión la física de una escena compleja, los resultados son en general bastante impresionantes. Las demostraciones generadas por Sora incluyen una escena aérea de California durante la fiebre del oro y un video que parece haber sido filmado desde el interior de un tren de Tokio.
Competencia en el espacio de IA
Hace un par de años, los generadores de texto a imágenes como Midjourney lideraban la capacidad de los modelos para convertir palabras en imágenes. Sin embargo, recientemente, el vídeo ha comenzado a mejorar a un ritmo notable. Compañías como Runway y Pika han mostrado sus propios modelos impresionantes de texto a video, y Lumiere de Google se presenta como uno de los principales competidores de OpenAI en este espacio. Al igual que Sora, Lumiere ofrece a los usuarios herramientas de conversión de texto a vídeo y también les permite crear videos a partir de una imagen fija.
Disponibilidad y uso de Sora
Actualmente, Sora solo está disponible para los “equipos rojos” (beta testers) que están evaluando el modelo en busca de posibles daños y riesgos. OpenAI también ofrece acceso a algunos artistas visuales, diseñadores y cineastas para recibir comentarios. A principios de este mes, OpenAI anunció que agregará marcas de agua a su herramienta de conversión de texto a imagen DALL-E 3, aunque señaló que estas se pueden “eliminar fácilmente”. Al igual que sus otros productos de IA, OpenAI tendrá que lidiar con las consecuencias de que los videos falsos fotorrealistas de IA se confundan con los reales.
Atte. Patricio Figueroa M – Profesor de Matemáticas
Fuente: www.theverge.com – Imagen de portada creada con Copilot de Bing.