Vídeo e áudio são gerados em uma forward pass unificada. Vento, passos, voz, música — cada som cai no frame correto porque o modelo nunca os separa.
Seedance 2.0 — O Gerador de Vídeo IA Cinematográfico da ByteDance
Seedance 2.0 transforma um único prompt em um clipe cinematográfico de 15 segundos com áudio nativo, lip-sync preciso em nível de fonema e controle de câmera de nível de diretor. O modelo de vídeo IA multimodal que liderou o Artificial Analysis sobre Veo 3, Sora 2 e Gen-4.5.
Envie uma Imagem de Referência para o Seedance 2.0
O modelo aceita até 9 imagens de referência por geração. Envie uma ficha de personagem, uma foto de locação ou uma referência de iluminação — ele captura identidade, estilo e encenação do que você enviar, e dirige a cena em torno disso.
Suporta PNG, JPG, WebP até 24MB
Escolha a Proporção
16:9 para cinema, 9:16 para shorts, 1:1 para social. Todas renderizam em até 4K.
Áudio-Vídeo Nativo em Uma Só Passagem
É o primeiro modelo de vídeo mainstream que gera áudio e vídeo conjuntamente — não como camada pós-processada. Passos caem em poças com timing preciso por frame, tecidos farfalham com o vento, uma corda de violão vibra em sincronia com a nota.
Prompt
Person walking through puddles in heavy rain, footsteps synchronized with splashing sounds, raindrops hitting umbrella in rhythm with audio, 4K quality, realistic water physics, cinematic atmosphere, perfect audio-visual timing.
Sincronia de áudio nativa
Controle de Câmera de Nível de Diretor
Seedance 2.0 aceita vocabulário de cinematografia literalmente. Chame um dolly-in, um rack focus, um ângulo holandês, uma whip pan — ele executa. Narrativa multi-shot a partir de um único prompt, então uma renderização de 15 segundos pode parecer uma sequência editada.
Prompt
Professional portrait of a young man in a rainy urban street at night, neon signs reflecting on wet pavement, atmospheric fog, shallow depth of field, cinematic bokeh, moody color palette, 4K ultra-detailed, film noir aesthetic.
Controle cinematográfico
Lip-Sync em Nível de Fonema em 8+ Idiomas
Envie um retrato de personagem e uma fala — o modelo anima formas de boca no nível do fonema, não da palavra. O resultado convence em análise detalhada em inglês, mandarim, japonês, coreano, espanhol, francês, alemão e mais.
Prompt
Close-up shot of a woman speaking directly to camera, clear articulation of words, natural facial expressions during speech, perfect lip-sync with audio, 4K cinematic quality, professional interview lighting, authentic conversational tone.
Lip-sync por fonema
Física que Convence
Tecido enruga como tecido enruga. Líquidos refratam. Partículas obedecem à gravidade e ao vento independentemente. Treinado em gravações reais, seu modelo de mundo sobrevive ao escrutínio em câmera lenta que mata outros modelos de vídeo.
Prompt
Slow-motion shot of a red silk scarf being thrown into the air, floating gracefully with realistic fabric physics, gentle wind affecting movement, 4K quality, cinematic lighting with soft shadows, photorealistic material properties.
Física do mundo real
9 Imagens + 3 Vídeos + 3 Áudios por Geração
Seedance 2.0 aceita payloads de referência mais ricos que qualquer outro modelo público. Envie fichas de personagem, planos de locação, footage existente, partituras de referência — ele funde tudo em uma renderização coerente em vez de pastosear uma média.
Prompt
4K close-up of water being poured into a crystal glass, realistic liquid physics with surface tension, light refraction through water and glass, dynamic splashing, photorealistic transparency and reflections, cinematic lighting.
Fusão multi-referência
Liderou o Artificial Analysis em 2026
Atingiu Elo 1269 no leaderboard de geração de vídeo do Artificial Analysis em abril de 2026, à frente de Google Veo 3, OpenAI Sora 2 e Runway Gen-4.5. No SeedVideoBench-2.0 lidera tarefas texto-para-vídeo, imagem-para-vídeo e multimodais.
Prompt
Cherry blossom petals falling in slow motion, realistic wind patterns affecting each petal differently, natural gravity and air resistance, 4K cinematic quality, soft bokeh background, spring atmosphere, photorealistic textures.
Líder de benchmark
Por Que Criadores Escolhem o Seedance 2.0
Seedance 2.0 eliminou os tradeoffs. Saída cinematográfica, áudio nativo, controle de nível de diretor e física de classe mundial — tudo em um modelo, em uma única passagem, em um clipe de 15 segundos.
Planos de Créditos do Seedance 2.0
Cada renderização custa créditos com base em duração e resolução. Escolha o plano que combina com quanto você filma. Créditos acumulam em planos de assinatura; pacotes avulsos nunca expiram.
Starter
$9.9/ mês
Para criadores solo testando o modelo.
Inclui:
- 2.950 créditos por mês
- ~30 renderizações/mês
Creator
$19.9/ mês
Para criadores de vídeo profissionais.
Inclui:
- 6.500 créditos por mês
- ~65 renderizações/mês
Studio
$49.9/ mês
Para agências em alto volume.
Inclui:
- 18.000 créditos por mês
- ~180 renderizações/mês
FAQ do Seedance 2.0
Respostas rápidas sobre rodar o Seedance 2.0 via nosso gateway hospedado.
01O que é o Seedance 2.0?
Seedance 2.0 é o modelo de vídeo multimodal principal da ByteDance, lançado em fevereiro de 2026. Gera até 15 segundos com áudio nativo, controle de câmera de nível de diretor e lip-sync por fonema em 8+ idiomas, tudo em uma única forward pass. O modelo liderou o leaderboard do Artificial Analysis acima de Veo 3, Sora 2 e Gen-4.5.
02O Seedance 2.0 é gratuito para testar?
Você recebe créditos iniciais no cadastro — suficientes para renderizar seu primeiro clipe sem pagar. Depois, cada renderização custa créditos conforme duração e resolução. Nossos planos começam em $9.90/mês.
03Posso usar o Seedance 2.0 dos EUA?
Sim. A ByteDance excluiu os Estados Unidos do rollout direto via Dreamina. Nosso gateway hospedado encaminha requisições por regiões suportadas, então criadores dos EUA podem usar a API completa do Seedance 2.0 sem VPN ou lista de espera.
04Qual a duração dos vídeos do Seedance 2.0?
Cada renderização tem até 15 segundos. Nessa janela o modelo pode produzir múltiplos planos com cortes e transições naturais, então a saída parece uma sequência editada em vez de uma tomada contínua.
05Quais entradas o Seedance 2.0 aceita?
Em uma única passagem, Seedance 2.0 aceita um prompt de texto mais até 9 imagens de referência, 3 clipes de vídeo e 3 clipes de áudio. Identidade de personagem, locação, estilo de câmera e até som ambiente podem ser semeados a partir das referências.
06Seedance 2.0 realmente gera áudio?
Sim, e é um dos recursos que o definem. Vídeo e áudio são gerados conjuntamente em uma única forward pass — não é pós-processamento. Passos, diálogo, música e som ambiente caem no frame correto porque o modelo nunca os separa.
07Seedance 2.0 é seguro para uso comercial?
Renderizações geradas pelo nosso gateway são suas para uso comercial sob nossos termos de serviço. Seedance 2.0 tem moderação de conteúdo embutida; prompts que violam política são rejeitados antes de processar.
