NTN 420 - Así funcionan las IAs de video
Update: 2025-09-12
Description
• Descubrí cómo funcionan las IAs que generan video: modelos de difusión, coherencia temporal y arquitecturas que pasan de imágenes a clips con movimiento y sonido.
• Hablamos de ejemplos como Veo, Sora y Dream Machine.
• Oportunidades para LATAM: datasets propios, talento y acceso a hardware.
Fuentes importantes
• “Video Diffusion Models: A Survey.” arXiv, mayo 2024. https://arxiv.org/abs/2405.03150 arXiv
• “Survey of Video Diffusion Models: Foundations, Implementations, and Applications.” arXiv, abril 2025. https://arxiv.org/abs/2504.16081 arXiv
• “Diffusion Models for Video Generation” — Lil’Log, abril 2024. https://lilianweng.github.io/posts/2024-04-12-diffusion-video/ Lil'Log
• “LaVie: High-Quality Video Generation with Cascaded Latent Diffusion Models.” arXiv, septiembre 2023. https://arxiv.org/abs/2309.15103 arXiv
• Sora — OpenAI. “Introducing Sora, our text-to-video model.” https://openai.com/index/sora/ OpenAI
• Veo — Google DeepMind. Veo 3 con audio sincronizado, etc. https://deepmind.google/models/veo/ Wikipedia
• Dream Machine — Luma Labs. pertenece al modelo de texto a video/imágenes animadas. https://lumalabs.ai/dream-machine Wikipedia
• Hablamos de ejemplos como Veo, Sora y Dream Machine.
• Oportunidades para LATAM: datasets propios, talento y acceso a hardware.
Fuentes importantes
• “Video Diffusion Models: A Survey.” arXiv, mayo 2024. https://arxiv.org/abs/2405.03150 arXiv
• “Survey of Video Diffusion Models: Foundations, Implementations, and Applications.” arXiv, abril 2025. https://arxiv.org/abs/2504.16081 arXiv
• “Diffusion Models for Video Generation” — Lil’Log, abril 2024. https://lilianweng.github.io/posts/2024-04-12-diffusion-video/ Lil'Log
• “LaVie: High-Quality Video Generation with Cascaded Latent Diffusion Models.” arXiv, septiembre 2023. https://arxiv.org/abs/2309.15103 arXiv
• Sora — OpenAI. “Introducing Sora, our text-to-video model.” https://openai.com/index/sora/ OpenAI
• Veo — Google DeepMind. Veo 3 con audio sincronizado, etc. https://deepmind.google/models/veo/ Wikipedia
• Dream Machine — Luma Labs. pertenece al modelo de texto a video/imágenes animadas. https://lumalabs.ai/dream-machine Wikipedia
Comments
In Channel