Sora vs Kling

El nuevo modelo de vídeo de IA llamado Kling parece ofrecer muchas de las mismas características que hicieron que Sora de OpenAI se destacara cuando fue anunciado a principios de este año. Kling ha sido desarrollado por la compañía china de la plataforma de vídeo Kuaishou y sus características incluyen la generación de vídeos más largos, mejora en el movimiento, mejor seguimiento de indicaciones y secuencias de múltiples tomas. A diferencia de Sora, Kling parece estar disponible para los usuarios a través de una lista de espera.

Características principales de Kling:

  • Generación de vídeos de hasta dos minutos a partir de un solo comando en 1080p a 30 fotogramas por segundo.
  • Simulación precisa de la física del mundo real, algo con lo que la mayoría de los modelos de IA tiene dificultades.
  • Modelo de transformador de difusión similar a Sora.
  • Soporte para una gama de relaciones de aspecto y tipos de tomas.
  • Reconstrucción avanzada en 3D de rostros y cuerpos para mejorar la expresión facial completa y el movimiento de las extremidades en los vídeos.

Además de sus características generativas, Kling es capaz de reconstrucción avanzada en 3D de rostros y cuerpos para mejorar la expresión facial completa y el movimiento de las extremidades dentro del vídeo, según explicó la compañía en su sitio web.

Disponibilidad y competencia: Aunque OpenAI presentó Sora en febrero, todavía no está ampliamente disponible para el público. Sin embargo, un número creciente de creadores lo está utilizando, incluyendo cinco cineastas galardonados que estrenarán cortometrajes hechos con Sora en el Festival de Cine de Tribeca la próxima semana. Por otro lado, aún no sabemos si Kling, o incluso el otro gran modelo de vídeo de IA chino, Vidu, estarán disponibles fuera de China, lo cual podría ser una ventaja para OpenAI en Occidente.

Demostraciones y calidad del vídeo: Entre los clips compartidos de Kling, hemos visto un largo clip de un niño en bicicleta, un caballo en el desierto, alguien comiendo fideos y un vídeo fotorrealista de un niño disfrutando de una hamburguesa. La parte más impresionante de los vídeos es el fotorrealismo. En algunos clips, sufren de un desenfoque similar al que vemos en otros vídeos de IA, pero no en la misma escala. Hay un clip de un loro que sería difícil decir que no es real y todavía no estoy seguro de que no hayan falsificado el vídeo de la hamburguesa. En una demostración de leche vertida en un vaso de café, Kling parecía hacerlo correctamente, lo que muestra su capacidad para crear un movimiento preciso y modelar mejor el movimiento y la física del mundo real.

Impacto en Sora y el mercado de la IA: Espero que la empresa considere un lanzamiento más amplio, haciéndolo disponible fuera de China, ya que la competencia es buena para la creatividad y la innovación. Lanzarlo podría empujar a OpenAI a liberar Sora más rápido de lo planeado actualmente. OpenAI también enfrenta competencia de jugadores existentes como Runway y Pika Labs, que están mejorando sus ofertas. También hay nuevos participantes como Haiper, LTX Studio y Higgsfield, cada uno abordando el vídeo de IA de diferentes maneras, y Google con su nuevo modelo Veo.

La realidad es que el retraso de OpenAI no es por disponibilidad técnica sino por seguridad. La compañía dice que quiere asegurar que el modelo no pueda ser usado para desinformación o propósitos maliciosos antes de ofrecerlo al público en general. También necesitan hacerlo más rápido y más barato.