LivePortrait: Anime Faces e Vídeos com IA em 1 Clique

Pegue uma foto qualquer (sua, do seu mascote, ou até de um personagem cartoon) e um vídeo de referência com uma pessoa falando. Em segundos, o LivePortrait aplica os movimentos faciais do vídeo na sua foto — gerando um vídeo realista com sua imagem "ganhando vida". Tudo em 1 clique no GPUBrasil.

⚡ Resumo

LivePortrait (Kuaishou Visual Generation 2024) é o estado da arte em face reenactment. Open-source, MIT-like license, processa 1 minuto de vídeo em ~2 minutos numa RTX 4090.

O que é o LivePortrait?

LivePortrait é um modelo de animação facial desenvolvido pela Kuaishou (TikTok chinês). Pega 2 inputs:

Source: foto estática (real ou desenho)
Driving: vídeo com uma pessoa falando/se movendo

O modelo extrai os "keypoints" do rosto da source e do driving, transfere os movimentos do driving para a source, e renderiza um vídeo final mantendo a identidade da source.

Características principais

Funciona com fotos reais e desenhos: retratos, anime, animais
Stitching: animação só do rosto, mantém corpo e fundo intactos
Retargeting de olho/boca: controle granular dos movimentos
Rápido: 12.8ms por frame em RTX 4090 (~78 FPS)
API Gradio: upload pelos campos, download do vídeo
Licença MIT: uso comercial permitido

Casos de uso brasileiros

Avatares falantes: mascote da marca apresentando vídeos
Cursos online: evite gravar 100 vídeos — anime uma foto profissional
E-commerce: "ator virtual" apresentando produto sem custo de produção
Conteúdo histórico: personagens históricos ganhando vida em educação
Marketing: celebridades animadas (com licença/consentimento) para campanhas
Memes e redes sociais: criação de conteúdo viral

⚠️ Aviso ético

LivePortrait pode ser usado para deepfake. Use apenas com pessoas que consentiram, ou com personagens fictícios/seus próprios. No Brasil, marco civil + LGPD se aplicam.

Hardware recomendado

RTX 4090 (24GB): ideal — ~78 FPS
RTX 3090 / A5000 (24GB): ~50 FPS
RTX A4000 (16GB): funciona, ~25 FPS
VRAM mínima: 8GB

💰 Custo no GPUBrasil

RTX 4090 (R$ 2,50/h) processa ~30 minutos de vídeo final/h = R$ 0,08/minuto de vídeo. HeyGen/Synthesia cobram R$ 5+/min.

Deploy em 1 clique

Passo 1: Iniciar template

Console → Templates → 🎬 Vídeo IA
Selecione LivePortrait
GPU: RTX 4090 (recomendado)
Clique em Iniciar

O template clona o repositório oficial KwaiVGI/LivePortrait, baixa modelos (~1GB) e expõe Gradio na porta 8890.

Passo 2: Web UI

Acesse https://<sua-instancia>.gpubrasil.com.br:

Source Portrait: upload da foto estática
Driving Video: upload do vídeo com a pessoa falando
Animation Options: ative stitching e retargeting
Clique em Animate
Download do vídeo final em ~2-3 min

Passo 3: Pipeline programático

# SSH na instância e use o CLI oficial
ssh -i ~/.ssh/gpubrasil.pem ubuntu@SEU_IP
cd /opt/LivePortrait

python inference.py \
    -s assets/examples/source/foto_pessoa.jpg \
    -d assets/examples/driving/video_referencia.mp4 \
    --flag_relative_motion \
    --flag_stitching \
    --output_dir output/

Passo 4: Combinar com TTS para vídeos completos

Pipeline de "talking avatar" completo:

# 1. Gerar áudio do roteiro com F5-TTS
texto = "Olá! Hoje vamos aprender sobre IA brasileira."
audio = f5_tts(texto, ref_voz="locutor.wav")

# 2. Animar uma cara (estática) com lip-sync — usar Wav2Lip
# (LivePortrait foca em movimento de cabeça/expressão; lip-sync via Wav2Lip)
video_lipsync = wav2lip(foto_pessoa, audio)

# 3. Aplicar LivePortrait para naturalidade extra
video_final = liveportrait(
    source=foto_pessoa,
    driving=video_lipsync
)

Dicas de qualidade

Source: foto frontal, bem iluminada, alta resolução, fundo simples
Driving: vídeo com cabeça centralizada, sem mãos cobrindo rosto
Stitching: sempre ative para preservar corpo/fundo
Retargeting: ajuste eyes/lip ratio se source tem proporções diferentes do driving
Pós-produção: upscale com Topaz/Real-ESRGAN para 4K

LivePortrait vs alternativas

LivePortrait vs SadTalker: LivePortrait tem melhor qualidade e velocidade
LivePortrait vs Wav2Lip: LivePortrait reanima cabeça/expressão; Wav2Lip só lip-sync
LivePortrait vs HeyGen/Synthesia: open-source, 50x mais barato, sem watermark
LivePortrait vs Runway Gen-2: LivePortrait foca em rosto; Runway gera cena inteira

Crie talking avatars por R$ 0,08 por minuto

Ganhe R$ 25 grátis no GPUBrasil e suba LivePortrait em 90 segundos.

Começar Grátis →

Conclusão

LivePortrait é mágica acessível: democratiza criação de avatares falantes para qualquer brasileiro com uma foto e um vídeo. Combinado com F5-TTS + GPUBrasil, você monta um estúdio de vídeos com IA em ~5 minutos, pagando centavos por minuto produzido.

Combos: F5-TTS para a voz · InvokeAI para a foto