Vidu, text-to-video chino

ShengShu-AI y la Universidad de Tsinghua han presentado Vidu, un avanzado modelo de inteligencia artificial que convierte texto en vídeo, comparable al modelo Sora de OpenAI. Desarrollado con la arquitectura Universal Vision Transformer (U-ViT), Vidu puede crear videoclips de alta definición de hasta 16 segundos con tan solo un clic, combinando tecnologías de Diffusion y Transformer. Vidu destaca por su habilidad para generar escenas realistas con detalles precisos y expresiones faciales complejas, además de integrar elementos culturales chinos como imágenes del panda y el dragón. Este lanzamiento refuerza el progreso de China en el ámbito de la inteligencia artificial, poniéndola a la par con desarrollos internacionales significativos.

Vidu, un avanzado modelo de inteligencia artificial que convierte texto en vídeo