Pegue uma foto qualquer (sua, do seu mascote, ou até de um personagem cartoon) e um vídeo de referência com uma pessoa falando. Em segundos, o LivePortrait aplica os movimentos faciais do vídeo na sua foto — gerando um vídeo realista com sua imagem "ganhando vida". Tudo em 1 clique no GPUBrasil.
LivePortrait (Kuaishou Visual Generation 2024) é o estado da arte em face reenactment. Open-source, MIT-like license, processa 1 minuto de vídeo em ~2 minutos numa RTX 4090.
O que é o LivePortrait?
LivePortrait é um modelo de animação facial desenvolvido pela Kuaishou (TikTok chinês). Pega 2 inputs:
- Source: foto estática (real ou desenho)
- Driving: vídeo com uma pessoa falando/se movendo
O modelo extrai os "keypoints" do rosto da source e do driving, transfere os movimentos do driving para a source, e renderiza um vídeo final mantendo a identidade da source.
Características principais
- Funciona com fotos reais e desenhos: retratos, anime, animais
- Stitching: animação só do rosto, mantém corpo e fundo intactos
- Retargeting de olho/boca: controle granular dos movimentos
- Rápido: 12.8ms por frame em RTX 4090 (~78 FPS)
- API Gradio: upload pelos campos, download do vídeo
- Licença MIT: uso comercial permitido
Casos de uso brasileiros
- Avatares falantes: mascote da marca apresentando vídeos
- Cursos online: evite gravar 100 vídeos — anime uma foto profissional
- E-commerce: "ator virtual" apresentando produto sem custo de produção
- Conteúdo histórico: personagens históricos ganhando vida em educação
- Marketing: celebridades animadas (com licença/consentimento) para campanhas
- Memes e redes sociais: criação de conteúdo viral
LivePortrait pode ser usado para deepfake. Use apenas com pessoas que consentiram, ou com personagens fictícios/seus próprios. No Brasil, marco civil + LGPD se aplicam.
Hardware recomendado
- RTX 4090 (24GB): ideal — ~78 FPS
- RTX 3090 / A5000 (24GB): ~50 FPS
- RTX A4000 (16GB): funciona, ~25 FPS
- VRAM mínima: 8GB
RTX 4090 (R$ 2,50/h) processa ~30 minutos de vídeo final/h = R$ 0,08/minuto de vídeo. HeyGen/Synthesia cobram R$ 5+/min.
Deploy em 1 clique
Passo 1: Iniciar template
- Console → Templates → 🎬 Vídeo IA
- Selecione LivePortrait
- GPU: RTX 4090 (recomendado)
- Clique em Iniciar
O template clona o repositório oficial KwaiVGI/LivePortrait, baixa modelos (~1GB) e expõe Gradio na porta 8890.
Passo 2: Web UI
Acesse https://<sua-instancia>.gpubrasil.com.br:
- Source Portrait: upload da foto estática
- Driving Video: upload do vídeo com a pessoa falando
- Animation Options: ative stitching e retargeting
- Clique em Animate
- Download do vídeo final em ~2-3 min
Passo 3: Pipeline programático
# SSH na instância e use o CLI oficial
ssh -i ~/.ssh/gpubrasil.pem ubuntu@SEU_IP
cd /opt/LivePortrait
python inference.py \
-s assets/examples/source/foto_pessoa.jpg \
-d assets/examples/driving/video_referencia.mp4 \
--flag_relative_motion \
--flag_stitching \
--output_dir output/
Passo 4: Combinar com TTS para vídeos completos
Pipeline de "talking avatar" completo:
# 1. Gerar áudio do roteiro com F5-TTS
texto = "Olá! Hoje vamos aprender sobre IA brasileira."
audio = f5_tts(texto, ref_voz="locutor.wav")
# 2. Animar uma cara (estática) com lip-sync — usar Wav2Lip
# (LivePortrait foca em movimento de cabeça/expressão; lip-sync via Wav2Lip)
video_lipsync = wav2lip(foto_pessoa, audio)
# 3. Aplicar LivePortrait para naturalidade extra
video_final = liveportrait(
source=foto_pessoa,
driving=video_lipsync
)
Dicas de qualidade
- Source: foto frontal, bem iluminada, alta resolução, fundo simples
- Driving: vídeo com cabeça centralizada, sem mãos cobrindo rosto
- Stitching: sempre ative para preservar corpo/fundo
- Retargeting: ajuste eyes/lip ratio se source tem proporções diferentes do driving
- Pós-produção: upscale com Topaz/Real-ESRGAN para 4K
LivePortrait vs alternativas
- LivePortrait vs SadTalker: LivePortrait tem melhor qualidade e velocidade
- LivePortrait vs Wav2Lip: LivePortrait reanima cabeça/expressão; Wav2Lip só lip-sync
- LivePortrait vs HeyGen/Synthesia: open-source, 50x mais barato, sem watermark
- LivePortrait vs Runway Gen-2: LivePortrait foca em rosto; Runway gera cena inteira
Crie talking avatars por R$ 0,08 por minuto
Ganhe R$ 25 grátis no GPUBrasil e suba LivePortrait em 90 segundos.
Começar Grátis →Conclusão
LivePortrait é mágica acessível: democratiza criação de avatares falantes para qualquer brasileiro com uma foto e um vídeo. Combinado com F5-TTS + GPUBrasil, você monta um estúdio de vídeos com IA em ~5 minutos, pagando centavos por minuto produzido.
Combos: F5-TTS para a voz · InvokeAI para a foto