OpenAI ha lanzado finalmente Sora a los suscriptores de ChatGPT Plus y Pro

El 9 de diciembre de 2024, OpenAI anunció hoy el lanzamiento al público de su esperado generador de vídeo de IA de texto a vídeo, Sora, marcando un hito significativo en sus avances en IA generativa. Este lanzamiento se produce tras más de un año de desarrollo silencioso y pruebas por parte de un selecto grupo de usuarios pioneros. Desde su anuncio inicial el año pasado, los detalles fotorrealistas de Sora y su avanzada comprensión de la física han impresionado a los entusiastas de la IA, al tiempo que han suscitado controversia sobre sus prácticas de desarrollo.

Los informes sugieren que el entrenamiento de Sora implicó el procesamiento de más de un millón de horas de vídeos transcritos de YouTube. OpenAI no ha revelado los conjuntos de datos concretos utilizados, lo que ha desatado las críticas de los creadores, que argumentan que su trabajo se utilizó sin crédito ni compensación. Este asunto llegó a un punto crítico recientemente cuando un grupo de artistas, que participaron como primeros probadores, filtraron las credenciales de la API en señal de protesta, acusando a OpenAI de «lavado de arte».

En lo que puede considerarse una respuesta a estas críticas, Joey Flynn, diseñador de producto de Sora, recalcó durante la retransmisión en directo que «Sora es una herramienta» y una «extensión para el creador que hay detrás».

Durante la retransmisión en directo, el jefe de producto de OpenAI, Rohan Sahai, y Joey Flynn mostraron las capacidades de Sora, demostrando su versatilidad como herramienta creativa. Sora está alojado en un sitio web independiente, Sora.com, con una pestaña de exploración en la que los usuarios pueden ver vídeos generados por IA y creados por otros usuarios. Al hacer clic en un vídeo, los usuarios pueden ver las técnicas utilizadas para crearlo, incluidas indicaciones de texto, extensiones de vídeo o imagen, o la herramienta de guión gráfico.

La empresa de IA afirmó en una entrada de blog: «Estamos trabajando en precios adaptados a distintos tipos de usuarios, que tenemos previsto poner a disposición a principios del año que viene». OpenAI añadió: «Sora ya está aquí. Estamos sacando nuestro modelo de generación de vídeo de la vista previa de investigación».

Para los usuarios listos para crear su contenido, la pestaña de biblioteca ofrece opciones para comenzar con una indicación de texto o una carga de imagen. A partir de ahí, los usuarios pueden seleccionar ajustes como la relación de aspecto, la resolución (hasta 1080p), la duración (hasta 20 segundos) e incluso elegir preajustes predeterminados como «stop motion» o «mundo globo».

Sora también incluye una función avanzada llamada Storyboard, diseñada para una edición de vídeo más intrincada. Storyboard permite a los usuarios dar forma a los vídeos con direcciones específicas para cada fotograma, a semejanza de las herramientas tradicionales de edición de vídeo. Cada fotograma, o «tarjeta de guión gráfico», puede generarse a partir de un texto o una imagen. Herramientas como la función de recorte permiten a los usuarios reorganizar los fotogramas, la herramienta de remezcla permite modificar secuencias específicas y la herramienta de bucle permite repetir escenas. Además, la función de mezcla crea transiciones suaves entre distintos segmentos.

OpenAI, financiada por Microsoft, explicó: «A principios de este año presentamos Sora, nuestro modelo capaz de crear vídeos realistas a partir de texto, y compartimos nuestros avances iniciales en la investigación sobre simulación del mundo». Sora sirve de base para una IA que comprenda y simule la realidad, un paso importante hacia el desarrollo de modelos que puedan interactuar con el mundo físico.

OpenAI continuó: «Hemos desarrollado una nueva versión de Sora, “Sora Turbo”, que es significativamente más rápida que el modelo que presentamos en febrero. La lanzamos hoy como producto independiente en Sora.com para los usuarios de ChatGPT Plus y Pro».

OpenAI ha priorizado las medidas de seguridad para garantizar el uso responsable de Sora. Todos los vídeos generados incluyen marcas de agua invisibles C2PA y marcas de agua visibles por defecto. OpenAI también ha implementado salvaguardas para bloquear contenidos nocivos, como materiales de abuso sexual infantil y Deepfakes sexuales, y restringe las subidas que implican a personas para mitigar el uso indebido.

El modelo de suscripción de Sora ofrece distintos niveles de acceso. Los usuarios de ChatGPT Plus pueden generar 50 vídeos al mes con una resolución de 480p u optar por menos vídeos a 720p. Los usuarios de ChatGPT Pro reciben 10 veces más uso con resoluciones más altas y funciones ampliadas.

A pesar de sus prometedoras prestaciones, el desarrollo de Sora no ha estado exento de polémica. Los críticos han expresado su preocupación por la posible explotación de obras creativas y el uso indebido de la tecnología. OpenAI, sin embargo, mantiene su compromiso de hacer frente a estos retos al tiempo que fomenta la creatividad. Rohan Sahai reconoció este delicado equilibrio durante la retransmisión en directo: «OpenAI tiene una gran diana en la espalda. Queremos evitar las actividades ilegales, pero también queremos fomentar la expresión creativa. Sabemos que se trata de un reto continuo, y puede que no lo consigamos a la perfección el primer día. Empezamos siendo un poco conservadores, así que si nuestra moderación no lo hace del todo bien, danos tu opinión».

El lanzamiento de Sora ha sido recibido con entusiasmo y escrutinio. A medida que OpenAI amplía los límites de la creatividad impulsada por la IA, sigue lidiando con consideraciones éticas y con el impacto de sus herramientas en la comunidad creativa. «Esperamos que esta primera versión de Sora permita a la gente de todo el mundo explorar nuevas formas de creatividad, contar sus historias y ampliar los límites de lo que es posible con la narración de vídeo», expresó OpenAI en su anuncio oficial.