¿Qué modelo de vídeo es el más realista?

Veo 3 lidera en movimiento fotorrealista, física y audio integrado. Runway Gen-3 Alpha y Kling 1.6 Pro están justo detrás en calidad visual pero entregan silenciosos. Para salida artística y estilizada, Pika y Dream Machine a menudo superan a los punteros a una fracción del coste.

¿Cuánto puede durar un clip generado?

La mayoría de los modelos comerciales limitan la salida a 5 segundos por llamada. Algunos (Kling 1.6, Pika 2) permiten extender a 10 segundos por un coste extra. Más allá de 10 segundos deberías generar una secuencia de planos y editarlos juntos — la deriva de calidad domina sobre la duración de una sola llamada hoy.

¿La tarificación de vídeo es por segundo o por llamada?

Por segundo de salida. Un clip puntero de 5 segundos típicamente sale entre 0,20 € y 1,00 € dependiendo del modelo y la resolución. Los niveles con sonido y 1080p+ cuestan más. Los modelos de pesos abiertos en infraestructura compartida pueden ser 10× más baratos.

¿Puedo generar vídeo a partir de una imagen inicial?

Sí — la imagen-a-vídeo es el flujo más fiable hoy. Proporciona un fotograma fijo más un prompt de movimiento y obtienes una salida mucho más estable que solo desde texto, especialmente para animación de personajes y tomas de producto. La mayoría de punteros admiten ambos modos.

Veo 3 entrega audio sincronizado integrado (diálogo, efectos sonoros, música). La mayoría del resto de modelos comerciales producen vídeo silencioso — generas el audio aparte con un modelo TTS o de música y lo superpones en postproducción. Consulta la ficha del modelo para el soporte de audio antes de integrar.

¿Qué resoluciones se admiten?

Los niveles estándar entregan 720p. Los niveles Pro añaden 1080p a aproximadamente 2× el coste. La salida en 4K es rara y cara en 2026; para finales a mayor resolución, escala en postproducción con un upscaler de vídeo dedicado.

¿Cómo de rápida es la generación de vídeo?

El tiempo de reloj depende del modelo: 30 segundos a 2 minutos para un clip de 5 segundos en infraestructura puntero, 5-15 minutos en GPUs de pesos abiertos compartidas. Planifica una UX asíncrona — muestra el progreso y deja que los usuarios vuelvan.

¿Se otorgan derechos de uso comercial?

Los niveles comerciales (Veo, Runway, Kling Pro, Pika) conceden uso comercial perpetuo y libre de regalías. Algunos modelos de investigación de pesos abiertos restringen al uso no comercial — la licencia aparece en cada página del modelo. Léela antes de poner la salida en una campaña pagada.

Video Generation

Generate and edit videos with AI-powered models

Modelos de generación de vídeo para marketing, motion y prototipado

Los modelos de vídeo transforman un prompt — o un fotograma fijo, o un clip de referencia corto — en una imagen en movimiento. Es la categoría más joven y más volátil del catálogo: cada trimestre llega un nuevo puntero que resetea la barra de calidad. Recurres a uno cuando necesitas contenido en movimiento más rápido de lo que un editor humano puede producirlo.

All Text & Chat Image Video Audio Text-to-Speech Speech-to-Text Embeddings Code Multimodal Robotics / VLA

59 models available

Google Veo 2

VideoGoogle DeepMind

Popular

Google's state-of-the-art video generation model. Simulates real-world physics with various visual styles.

€5.00120.0s

high-qualitypopular

Google Veo 3

VideoGoogle DeepMind

Popular

Google's Veo 3. High-fidelity text-to-video with native audio generation, up to 8s clips.

€0.7592.0s

googleveotext-to-video

Google Veo 3 (Replicate)

VideoGoogle DeepMind

Popular

Google's Veo 3 served via Replicate. Text-to-video with native synchronized audio generation. High-fidelity motion and scene coherence in short clips.

€8.00

replicategoogleveo

Google Veo 3.1

VideoGoogle DeepMind

NewPopular

Latest Veo with image-to-video and context-aware audio

€6.0092.0s

popularaudioi2v

HunyuanVideo

VideoTencent

Popular

Tencent's HunyuanVideo, a 13B open-weights text-to-video diffusion transformer. Produces high-motion, photorealistic clips with smooth temporal consistency and was one of the first open models to rival closed systems on motion quality.

Video Generation

Modelos de generación de vídeo para marketing, motion y prototipado

Google Veo 2

Google Veo 3

Google Veo 3 (Replicate)

Google Veo 3.1

HunyuanVideo

Kling v2.1

Kling v2.1 Master

Kling v3

Kling v3 Omni

MiniMax Hailuo 02

OpenAI Sora 2

Runway Gen 4.5

Runway Gen-4 Turbo

Sora

AnimateDiff

AnimateDiff Lightning

ByteDance Seedance 1 Pro

Champ Human Animation

CogVideoX-5B

CogVideoX-5B (open)

DynamiCrafter

EchoMimic

FILM Frame Interpolation

Google Veo 3 Fast

Google Veo 3.1 Fast

Grok Imagine Video

Hailuo / MiniMax Video-01

Hailuo 2.3

HunyuanVideo

Kling 1.6 Pro

Kling v1.6 Pro

LivePortrait

LTX-Video (Lightricks)

Luma Dream Machine v1.6

Luma Ray Flash 2

Luma Ray-2 720p

MagicAnimate

Minimax Video

Mochi 1

Mochi 1

MuseTalk

Pika 2.0 (Official)

PixVerse v5.6

RIFE Frame Interpolation

Runway Gen-3 Alpha Turbo

SadTalker

Seedance Lite

Seedance Pro

StreamingT2V

SwinIR Video

ToonCrafter

V-Express

VideoCrafter

Wan 2.1 (Alibaba)

Wan 2.1 I2V 720p

Wan 2.1 T2V 720p (Accelerated)

Wan 2.2 Image-to-Video

Wan 2.2 Text-to-Video

Wav2Lip

Top video generation picks

Popular use cases

Related comparisons

Kling 1.6 Pro vs Pika 2

Veo 3 vs Kling 1.6 Pro

Dream Machine 1.6 vs Mochi 1

Frequently asked questions

¿Qué modelo de vídeo es el más realista?

¿Cuánto puede durar un clip generado?

¿La tarificación de vídeo es por segundo o por llamada?

¿Puedo generar vídeo a partir de una imagen inicial?

¿Se incluye audio?

¿Qué resoluciones se admiten?

¿Cómo de rápida es la generación de vídeo?

¿Se otorgan derechos de uso comercial?

Start Building with AI