Quel modèle vidéo est le plus réaliste ?

Veo 3 mène sur le mouvement photoréaliste, la physique et l'audio intégré. Runway Gen-3 Alpha et Kling 1.6 Pro suivent de près sur la qualité visuelle mais livrent muets. Pour la sortie artistique et stylisée, Pika et Dream Machine battent souvent les phares à une fraction du coût.

Quelle durée peut atteindre un clip généré ?

La plupart des modèles commerciaux plafonnent à 5 secondes par appel. Certains (Kling 1.6, Pika 2) permettent une extension à 10 secondes pour un surcoût. Au-delà de 10 secondes, vous devriez générer une séquence de plans et les monter ensemble — la dérive de qualité domine la durée à un seul appel aujourd'hui.

La tarification vidéo est-elle à la seconde ou à l'appel ?

À la seconde de sortie. Un clip phare de 5 secondes coûte typiquement entre 0,20 € et 1,00 € selon le modèle et la résolution. Les tiers avec son et 1080p+ coûtent plus cher. Les modèles open-weights sur infrastructure mutualisée peuvent être 10× moins chers.

Puis-je générer une vidéo à partir d'une image de départ ?

Oui — l'image-à-vidéo est le workflow le plus fiable aujourd'hui. Fournissez une frame fixe plus un prompt de mouvement et vous obtenez une sortie bien plus stable qu'à partir de texte seul, surtout pour l'animation de personnages et les shots produit. La plupart des phares prennent en charge les deux modes.

L'audio est-il inclus ?

Veo 3 livre de l'audio synchronisé intégré (dialogues, effets sonores, musique). La plupart des autres modèles commerciaux produisent de la vidéo muette — vous générez l'audio séparément avec un modèle TTS ou musical et le superposez en post-production. Vérifiez la fiche modèle pour le support audio avant d'intégrer.

Quelles résolutions sont prises en charge ?

Les tiers standards livrent 720p. Les tiers Pro ajoutent 1080p à environ 2× le coût. La sortie 4K est rare et coûteuse en 2026 ; pour des finaux à plus haute résolution, faites un upscale en post avec un upscaler vidéo dédié.

À quelle vitesse va la génération vidéo ?

Le temps réel dépend du modèle : 30 secondes à 2 minutes pour un clip de 5 secondes sur infrastructure phare, 5 à 15 minutes sur GPU open-weights mutualisés. Prévoyez une UX asynchrone — affichez la progression et laissez les utilisateurs revenir.

Les droits d'usage commercial sont-ils accordés ?

Les tiers commerciaux (Veo, Runway, Kling Pro, Pika) accordent un usage commercial perpétuel et libre de droits. Certains modèles open-weights de recherche restreignent au non-commercial — la licence est listée sur chaque page modèle. Lisez-la avant de placer une sortie dans une campagne payée.

Video Generation

Generate and edit videos with AI-powered models

Modèles de génération vidéo pour marketing, motion et prototypage

Les modèles vidéo transforment un prompt — ou une image fixe, ou un court clip de référence — en image en mouvement. C'est la catégorie la plus jeune et la plus volatile du catalogue : chaque trimestre amène un nouveau phare qui repousse la barre. On y a recours quand on veut du contenu en mouvement plus vite qu'un monteur humain ne peut le produire.

All Text & Chat Image Video Audio Text-to-Speech Speech-to-Text Embeddings Code Multimodal Robotics / VLA

59 models available

Google Veo 2

VideoGoogle DeepMind

Popular

Google's state-of-the-art video generation model. Simulates real-world physics with various visual styles.

€5.00120.0s

high-qualitypopular

Google Veo 3

VideoGoogle DeepMind

Popular

Google's Veo 3. High-fidelity text-to-video with native audio generation, up to 8s clips.

€0.7592.0s

googleveotext-to-video

Google Veo 3 (Replicate)

VideoGoogle DeepMind

Popular

Google's Veo 3 served via Replicate. Text-to-video with native synchronized audio generation. High-fidelity motion and scene coherence in short clips.

€8.00

replicategoogleveo

Google Veo 3.1

VideoGoogle DeepMind

NewPopular

Latest Veo with image-to-video and context-aware audio

€6.0092.0s

popularaudioi2v

HunyuanVideo

VideoTencent

Popular

Tencent's HunyuanVideo, a 13B open-weights text-to-video diffusion transformer. Produces high-motion, photorealistic clips with smooth temporal consistency and was one of the first open models to rival closed systems on motion quality.

Video Generation

Modèles de génération vidéo pour marketing, motion et prototypage

Google Veo 2

Google Veo 3

Google Veo 3 (Replicate)

Google Veo 3.1

HunyuanVideo

Kling v2.1

Kling v2.1 Master

Kling v3

Kling v3 Omni

MiniMax Hailuo 02

OpenAI Sora 2

Runway Gen 4.5

Runway Gen-4 Turbo

Sora

AnimateDiff

AnimateDiff Lightning

ByteDance Seedance 1 Pro

Champ Human Animation

CogVideoX-5B

CogVideoX-5B (open)

DynamiCrafter

EchoMimic

FILM Frame Interpolation

Google Veo 3 Fast

Google Veo 3.1 Fast

Grok Imagine Video

Hailuo / MiniMax Video-01

Hailuo 2.3

HunyuanVideo

Kling 1.6 Pro

Kling v1.6 Pro

LivePortrait

LTX-Video (Lightricks)

Luma Dream Machine v1.6

Luma Ray Flash 2

Luma Ray-2 720p

MagicAnimate

Minimax Video

Mochi 1

Mochi 1

MuseTalk

Pika 2.0 (Official)

PixVerse v5.6

RIFE Frame Interpolation

Runway Gen-3 Alpha Turbo

SadTalker

Seedance Lite

Seedance Pro

StreamingT2V

SwinIR Video

ToonCrafter

V-Express

VideoCrafter

Wan 2.1 (Alibaba)

Wan 2.1 I2V 720p

Wan 2.1 T2V 720p (Accelerated)

Wan 2.2 Image-to-Video

Wan 2.2 Text-to-Video

Wav2Lip

Top video generation picks

Popular use cases

Related comparisons

Kling 1.6 Pro vs Pika 2

Veo 3 vs Kling 1.6 Pro

Dream Machine 1.6 vs Mochi 1

Frequently asked questions

Quel modèle vidéo est le plus réaliste ?

Quelle durée peut atteindre un clip généré ?

La tarification vidéo est-elle à la seconde ou à l'appel ?

Puis-je générer une vidéo à partir d'une image de départ ?

L'audio est-il inclus ?

Quelles résolutions sont prises en charge ?

À quelle vitesse va la génération vidéo ?

Les droits d'usage commercial sont-ils accordés ?

Start Building with AI