Vidéo

Les meilleures IA pour narrer vos textes et créer des vidéos sans montrer votre visage – 1/2

Limitations actuelles des outils d’IA pour la vidéo


Cas particuliers et projets de recherche

  • Synthesia, orienté vidéo avec avatars, propose jusqu’à 250 minutes de vidéo (pour des présentations, formation, etc.) Synthesia+1.

  • Vexub permet des vidéos générées à partir de texte pouvant atteindre environ 15 minutes Wikipédia.

  • Steve.ai offre des vidéos allant jusqu’à 20 minutes, selon le plan support.steve.ai.

Projets académiques en pointe :

  • LinGen (2024) permet pour la première fois une génération de vidéos haute résolution d’une minute sur un GPU avec une complexité linéaire arXiv+2Reddit+2.

  • Movie Gen (Meta/Facebook) permet de générer des vidéos jusqu’à 16 secondes (à 16 fps) avec un modèle de 30 milliards de paramètres arXiv.

  • MAGI‑1 (mai 2025) supporte une génération vidéo par chunks autorégressifs, avec un coût constant, ce qui laisse la porte ouverte à des durées potentiellement illimitées arXiv.

  • SkyReels‑V2 (avril 2025) repousse encore plus loin : il s’agit d’un modèle génératif de film à longueur potentiellement infinie, grâce à une structure vidéo avancée et des techniques de diffusion spécifique arXiv.


Comparatif des durées selon les outils

Outil / Modèle Durée maximale typique Usage / Remarque
Dream Machine (Luma Labs) ~5 s Clips très courts Wikipédia+3Wikipédia+3TechRadar+3Wikipédia+3TechRadar+3Business Insider+3
Adobe Firefly (text-to-video) ~5 s Générateur dans Firefly Web The Verge
Premiere Pro – Generative Extend Jusqu’à 10 s (avec prolongation) Pour corriger ou étendre légèrement Adobe
Google Veo 3 8 s par clip Séquences séparées possibles WikipédiaAide Google
OpenAI Sora 60 s Pour les utilisateurs de Sora WikipédiaWIREDAP News
Synthesia 250 min (≈ 4 h 10) Vidéos d’entreprise avec avatars Synthesia
Vexub ~15 min Vidéo text-to-video Wikipédia
Steve.ai Jusqu’à 20 min Dépend du plan support.steve.ai
LinGen (recherche) ≈ 1 min Haute résolution en temps raisonnable arXiv
Movie Gen (recherche) ~16 s Modèle de grande ampleur arXiv
MAGI-1 (recherche) Potentiellement illimité Génération chunkée efficace arXiv
SkyReels-V2 (recherche) Longueur infinie possible Modèle le plus prometteur arXiv

En résumé

  • Pour la plupart des outils accessibles aujourd’hui, la durée maximale est souvent très limitée : quelques secondes jusqu’à 1 minute (OpenAI Sora).

  • Certains services spécialisés ou grand public, comme Synthesia ou Vexub, permettent des vidéos plus longues, utiles pour les présentations ou tutoriels.

  • La recherche académique, quant à elle, ouvre de nouvelles perspectives : des modèles comme LinGen, MAGI-1 et SkyReels-V2 posent les bases pour des vidéos longues, voire illimitées.


Si tu veux créer des vidéos plus longues sans montrer ton visage, tu pourrais considérer :

  • Utiliser Synthesia si tu veux des avatars pour parler sans apparaître face caméra.

  • Explorer Vexub ou Steve.ai selon la durée souhaitée (jusqu’à 15–20 minutes).

  • Attendre ou suivre les avancées de Sora, MAGI-1 ou SkyReels-V2 pour des vidéos plus longues avec plus de qualité.