Seedance 2.0 — O Gerador de Vídeo IA Cinematográfico da ByteDance

Seedance 2.0 transforma um único prompt em um clipe cinematográfico de 15 segundos com áudio nativo, lip-sync preciso em nível de fonema e controle de câmera de nível de diretor. O modelo de vídeo IA multimodal que liderou o Artificial Analysis sobre Veo 3, Sora 2 e Gen-4.5.

Envie uma Imagem de Referência para o Seedance 2.0

O modelo aceita até 9 imagens de referência por geração. Envie uma ficha de personagem, uma foto de locação ou uma referência de iluminação — ele captura identidade, estilo e encenação do que você enviar, e dirige a cena em torno disso.

Suporta PNG, JPG, WebP até 24MB

Escolha a Proporção

16:9 para cinema, 9:16 para shorts, 1:1 para social. Todas renderizam em até 4K.

Exemplo de vídeo gerado pelo Seedance 2.0 1

Áudio-Vídeo Nativo em Uma Só Passagem

É o primeiro modelo de vídeo mainstream que gera áudio e vídeo conjuntamente — não como camada pós-processada. Passos caem em poças com timing preciso por frame, tecidos farfalham com o vento, uma corda de violão vibra em sincronia com a nota.

Prompt

Person walking through puddles in heavy rain, footsteps synchronized with splashing sounds, raindrops hitting umbrella in rhythm with audio, 4K quality, realistic water physics, cinematic atmosphere, perfect audio-visual timing.

Sincronia de áudio nativa

Controle de Câmera de Nível de Diretor

Seedance 2.0 aceita vocabulário de cinematografia literalmente. Chame um dolly-in, um rack focus, um ângulo holandês, uma whip pan — ele executa. Narrativa multi-shot a partir de um único prompt, então uma renderização de 15 segundos pode parecer uma sequência editada.

Prompt

Professional portrait of a young man in a rainy urban street at night, neon signs reflecting on wet pavement, atmospheric fog, shallow depth of field, cinematic bokeh, moody color palette, 4K ultra-detailed, film noir aesthetic.

Controle cinematográfico

Lip-Sync em Nível de Fonema em 8+ Idiomas

Envie um retrato de personagem e uma fala — o modelo anima formas de boca no nível do fonema, não da palavra. O resultado convence em análise detalhada em inglês, mandarim, japonês, coreano, espanhol, francês, alemão e mais.

Prompt

Close-up shot of a woman speaking directly to camera, clear articulation of words, natural facial expressions during speech, perfect lip-sync with audio, 4K cinematic quality, professional interview lighting, authentic conversational tone.

Lip-sync por fonema

Física que Convence

Tecido enruga como tecido enruga. Líquidos refratam. Partículas obedecem à gravidade e ao vento independentemente. Treinado em gravações reais, seu modelo de mundo sobrevive ao escrutínio em câmera lenta que mata outros modelos de vídeo.

Prompt

Slow-motion shot of a red silk scarf being thrown into the air, floating gracefully with realistic fabric physics, gentle wind affecting movement, 4K quality, cinematic lighting with soft shadows, photorealistic material properties.

Física do mundo real

9 Imagens + 3 Vídeos + 3 Áudios por Geração

Seedance 2.0 aceita payloads de referência mais ricos que qualquer outro modelo público. Envie fichas de personagem, planos de locação, footage existente, partituras de referência — ele funde tudo em uma renderização coerente em vez de pastosear uma média.

Prompt

4K close-up of water being poured into a crystal glass, realistic liquid physics with surface tension, light refraction through water and glass, dynamic splashing, photorealistic transparency and reflections, cinematic lighting.

Fusão multi-referência

Liderou o Artificial Analysis em 2026

Atingiu Elo 1269 no leaderboard de geração de vídeo do Artificial Analysis em abril de 2026, à frente de Google Veo 3, OpenAI Sora 2 e Runway Gen-4.5. No SeedVideoBench-2.0 lidera tarefas texto-para-vídeo, imagem-para-vídeo e multimodais.

Prompt

Cherry blossom petals falling in slow motion, realistic wind patterns affecting each petal differently, natural gravity and air resistance, 4K cinematic quality, soft bokeh background, spring atmosphere, photorealistic textures.

Líder de benchmark

Por Que Criadores Escolhem o Seedance 2.0

Seedance 2.0 eliminou os tradeoffs. Saída cinematográfica, áudio nativo, controle de nível de diretor e física de classe mundial — tudo em um modelo, em uma única passagem, em um clipe de 15 segundos.

Planos de Créditos do Seedance 2.0

Cada renderização custa créditos com base em duração e resolução. Escolha o plano que combina com quanto você filma. Créditos acumulam em planos de assinatura; pacotes avulsos nunca expiram.

Starter
$9.9/ mês

Para criadores solo testando o modelo.

Inclui:

  • 2.950 créditos por mês
  • ~30 renderizações/mês
Creator
$19.9/ mês

Para criadores de vídeo profissionais.

Inclui:

  • 6.500 créditos por mês
  • ~65 renderizações/mês
Studio
$49.9/ mês

Para agências em alto volume.

Inclui:

  • 18.000 créditos por mês
  • ~180 renderizações/mês

FAQ do Seedance 2.0

Respostas rápidas sobre rodar o Seedance 2.0 via nosso gateway hospedado.

01

O que é o Seedance 2.0?

Seedance 2.0 é o modelo de vídeo multimodal principal da ByteDance, lançado em fevereiro de 2026. Gera até 15 segundos com áudio nativo, controle de câmera de nível de diretor e lip-sync por fonema em 8+ idiomas, tudo em uma única forward pass. O modelo liderou o leaderboard do Artificial Analysis acima de Veo 3, Sora 2 e Gen-4.5.

02

O Seedance 2.0 é gratuito para testar?

Você recebe créditos iniciais no cadastro — suficientes para renderizar seu primeiro clipe sem pagar. Depois, cada renderização custa créditos conforme duração e resolução. Nossos planos começam em $9.90/mês.

03

Posso usar o Seedance 2.0 dos EUA?

Sim. A ByteDance excluiu os Estados Unidos do rollout direto via Dreamina. Nosso gateway hospedado encaminha requisições por regiões suportadas, então criadores dos EUA podem usar a API completa do Seedance 2.0 sem VPN ou lista de espera.

04

Qual a duração dos vídeos do Seedance 2.0?

Cada renderização tem até 15 segundos. Nessa janela o modelo pode produzir múltiplos planos com cortes e transições naturais, então a saída parece uma sequência editada em vez de uma tomada contínua.

05

Quais entradas o Seedance 2.0 aceita?

Em uma única passagem, Seedance 2.0 aceita um prompt de texto mais até 9 imagens de referência, 3 clipes de vídeo e 3 clipes de áudio. Identidade de personagem, locação, estilo de câmera e até som ambiente podem ser semeados a partir das referências.

06

Seedance 2.0 realmente gera áudio?

Sim, e é um dos recursos que o definem. Vídeo e áudio são gerados conjuntamente em uma única forward pass — não é pós-processamento. Passos, diálogo, música e som ambiente caem no frame correto porque o modelo nunca os separa.

07

Seedance 2.0 é seguro para uso comercial?

Renderizações geradas pelo nosso gateway são suas para uso comercial sob nossos termos de serviço. Seedance 2.0 tem moderação de conteúdo embutida; prompts que violam política são rejeitados antes de processar.