Que modelo de vídeo é o mais realista?

O Veo 3 lidera em movimento foto-realista, física e áudio integrado. O Runway Gen-3 Alpha e o Kling 1.6 Pro ficam próximos em qualidade visual mas saem mudos. Para output artístico e estilizado, o Pika e o Dream Machine batem flagships com frequência por uma fração do custo.

Que duração pode ter um clip gerado?

A maior parte dos modelos comerciais limita o output a 5 segundos por chamada. Alguns (Kling 1.6, Pika 2) permitem alongar até 10 segundos com custo adicional. Para além dos 10 segundos, vale a pena gerar uma sequência de planos e editar em conjunto — a deriva de qualidade domina hoje sobre a duração em chamada única.

O pricing de vídeo é por segundo ou por chamada?

Por segundo de output. Um clip flagship de 5 segundos custa tipicamente entre €0,20 e €1,00 conforme o modelo e a resolução. Os tiers com áudio e as resoluções 1080p+ custam mais. Modelos open-weights em infraestrutura partilhada podem ser 10× mais baratos.

Posso gerar vídeo a partir de uma imagem inicial?

Sim — image-to-video é hoje o workflow mais fiável. Forneça um frame estático mais um prompt de movimento e obtém output muito mais estável do que apenas a partir de texto, sobretudo para animação de personagens e planos de produto. A maior parte dos flagships suporta ambos os modos.

O áudio está incluído?

O Veo 3 entrega áudio sincronizado integrado (diálogo, efeitos sonoros, música). A maior parte dos outros modelos comerciais entrega vídeo mudo — gere áudio à parte com um modelo TTS ou de música e sobreponha em pós-produção. Verifique o cartão do modelo quanto ao suporte de áudio antes de integrar.

Que resoluções são suportadas?

Os tiers padrão entregam 720p. Os tiers Pro acrescentam 1080p a cerca de 2× do custo. O output 4K é raro e caro em 2026; para finais em resolução mais alta, faça upscaling em pós com um upscaler de vídeo dedicado.

Quão rápida é a geração de vídeo?

O tempo de relógio depende do modelo: 30 segundos a 2 minutos para um clip de 5 segundos em infraestrutura flagship, 5-15 minutos em GPUs partilhadas open-weights. Planeie uma UX assíncrona — mostre progresso e permita que o utilizador volte mais tarde.

Há direitos de uso comercial concedidos?

Os tiers comerciais (Veo, Runway, Kling Pro, Pika) concedem uso comercial perpétuo e isento de royalties. Alguns modelos open-weights de investigação restringem-se ao uso não comercial — a licença está listada em cada página de modelo. Leia antes de colocar o output numa campanha paga.

Video Generation

Generate and edit videos with AI-powered models

Modelos de geração de vídeo para marketing, motion e prototipagem

Os modelos de vídeo transformam um prompt — ou um frame estático, ou um pequeno clip de referência — em imagem em movimento. É a categoria mais jovem e volátil do catálogo: a cada trimestre surge um novo flagship que recoloca o nível de qualidade. Recorra a um quando precisar de conteúdo em movimento mais depressa do que um editor humano consegue produzir.

All Text & Chat Image Video Audio Text-to-Speech Speech-to-Text Embeddings Code Multimodal Robotics / VLA

59 models available

Google Veo 2

VideoGoogle DeepMind

Popular

Google's state-of-the-art video generation model. Simulates real-world physics with various visual styles.

€5.00120.0s

high-qualitypopular

Google Veo 3

VideoGoogle DeepMind

Popular

Google's Veo 3. High-fidelity text-to-video with native audio generation, up to 8s clips.

€0.7592.0s

googleveotext-to-video

Google Veo 3 (Replicate)

VideoGoogle DeepMind

Popular

Google's Veo 3 served via Replicate. Text-to-video with native synchronized audio generation. High-fidelity motion and scene coherence in short clips.

€8.00

replicategoogleveo

Google Veo 3.1

VideoGoogle DeepMind

NewPopular

Latest Veo with image-to-video and context-aware audio

€6.0092.0s

popularaudioi2v

HunyuanVideo

VideoTencent

Popular

Tencent's HunyuanVideo, a 13B open-weights text-to-video diffusion transformer. Produces high-motion, photorealistic clips with smooth temporal consistency and was one of the first open models to rival closed systems on motion quality.

Video Generation

Modelos de geração de vídeo para marketing, motion e prototipagem

Google Veo 2

Google Veo 3

Google Veo 3 (Replicate)

Google Veo 3.1

HunyuanVideo

Kling v2.1

Kling v2.1 Master

Kling v3

Kling v3 Omni

MiniMax Hailuo 02

OpenAI Sora 2

Runway Gen 4.5

Runway Gen-4 Turbo

Sora

AnimateDiff

AnimateDiff Lightning

ByteDance Seedance 1 Pro

Champ Human Animation

CogVideoX-5B

CogVideoX-5B (open)

DynamiCrafter

EchoMimic

FILM Frame Interpolation

Google Veo 3 Fast

Google Veo 3.1 Fast

Grok Imagine Video

Hailuo / MiniMax Video-01

Hailuo 2.3

HunyuanVideo

Kling 1.6 Pro

Kling v1.6 Pro

LivePortrait

LTX-Video (Lightricks)

Luma Dream Machine v1.6

Luma Ray Flash 2

Luma Ray-2 720p

MagicAnimate

Minimax Video

Mochi 1

Mochi 1

MuseTalk

Pika 2.0 (Official)

PixVerse v5.6

RIFE Frame Interpolation

Runway Gen-3 Alpha Turbo

SadTalker

Seedance Lite

Seedance Pro

StreamingT2V

SwinIR Video

ToonCrafter

V-Express

VideoCrafter

Wan 2.1 (Alibaba)

Wan 2.1 I2V 720p

Wan 2.1 T2V 720p (Accelerated)

Wan 2.2 Image-to-Video

Wan 2.2 Text-to-Video

Wav2Lip

Top video generation picks

Popular use cases

Related comparisons

Kling 1.6 Pro vs Pika 2

Veo 3 vs Kling 1.6 Pro

Dream Machine 1.6 vs Mochi 1

Frequently asked questions

Que modelo de vídeo é o mais realista?

Que duração pode ter um clip gerado?

O pricing de vídeo é por segundo ou por chamada?

Posso gerar vídeo a partir de uma imagem inicial?

O áudio está incluído?

Que resoluções são suportadas?

Quão rápida é a geração de vídeo?

Há direitos de uso comercial concedidos?

Start Building with AI