Imagine um time de agentes IA conversando entre si para resolver um problema: um planejador divide a tarefa, um pesquisador busca dados, um desenvolvedor escreve código, um revisor valida o resultado. Foi exatamente para isso que a Microsoft criou o AutoGen. O AutoGen Studio é a UI low-code dele — agora em 1 clique no GPUBrasil.
AutoGen Studio = ferramenta visual da Microsoft Research para construir sistemas multi-agentes. Defina personas, capabilities e a interação acontece via conversas estruturadas. Open-source, MIT.
O que é o AutoGen?
AutoGen é um framework da Microsoft Research para construir sistemas multi-agentes em IA. A ideia central: em vez de um único LLM gigante tentando resolver tudo, você compõe vários agentes especializados que conversam entre si, cada um com sua função.
O AutoGen Studio é a interface gráfica low-code que permite montar essas equipes sem escrever Python — embora sob o capô tudo seja AutoGen Python.
Características principais
- Agentes especializados: defina papel, ferramentas, modelo, prompt
- Padrões de conversação: two-agent, group chat, hierarchical, sequential
- Tools: Python execution, web search, file IO, custom MCP servers
- Code execution: sandbox Docker integrado para rodar código gerado
- UI visual: arrastar/conectar agentes em workflows
- Multi-LLM: diferente modelo por agente (GPT-4 pro planejador, Qwen pro coder)
- Skill galleries: reutilize ferramentas em vários workflows
- Histórico: debug visual de cada turno da conversa
- Licença MIT
Casos de uso brasileiros
- Análise de dados: agente Analista pede SQL → SQL Agent executa → Reviewer valida → Writer gera relatório
- Suporte técnico complexo: Triage Agent → Knowledge Agent → Solution Agent → QA Agent
- Pesquisa de mercado: Web Searcher + Reader + Summarizer + Critic
- Desenvolvimento de software: PM Agent + Developer Agent + Reviewer + Tester
- Compliance: Agente Jurídico + Agente Compliance + Agente Auditor cruzando documentos
- Tradução técnica: Translator → Domain Expert → Linguist → Final Editor
Hardware recomendado
- RTX A4000 (16GB): AutoGen Studio + LLM 3-7B local
- RTX 4090 (24GB): múltiplos agentes com modelos diferentes
- L40S / A6000: agentes com modelos 13B-30B em paralelo
- CPU-only: ok se LLMs forem em outra instância
RTX A4000 (R$ 1,80/h) hospedando AutoGen Studio + Qwen2.5-7B compartilhado entre agentes. Uso comercial 8h/dia: ~R$ 430/mês.
Deploy em 1 clique
Passo 1: Iniciar template
- Console → Templates → 🔀 Agentes & Workflows
- Selecione AutoGen Studio
- GPU: RTX A4000 (recomendado)
- Clique em Iniciar
O template instala autogenstudio (Python pip) e expõe a UI na porta 8081. Vem com workflows de exemplo prontos.
Passo 2: Configurar models
Acesse https://<sua-instancia>.gpubrasil.com.br:
- Em Models, adicione:
- Nome:
qwen-br - Provider: OpenAI Compatible
- Base URL:
https://outra-instancia.gpubrasil.com.br/v1(vLLM no GPUBrasil) - API Key: dummy
- Model:
Qwen/Qwen2.5-7B-Instruct
- Nome:
- Em Tools, ative: PythonExecutor, WebBrowser, FileSystem
Passo 3: Criar agentes
- Planner — system prompt: "Você divide tarefas complexas em passos pequenos."
- Researcher — tools: WebBrowser; prompt: "Pesquise informações atualizadas."
- Coder — tools: PythonExecutor; prompt: "Você escreve código Python."
- Reviewer — prompt: "Você revisa código e textos quanto a erros."
Passo 4: Montar workflow
Crie um Group Chat com os 4 agentes e um orchestrator:
# Equivalente em Python sob o capô:
from autogen import GroupChat, GroupChatManager, AssistantAgent, UserProxyAgent
planner = AssistantAgent("Planner", llm_config={"model": "qwen-br"})
researcher = AssistantAgent("Researcher", llm_config={"model": "qwen-br"},
tools=[web_browser])
coder = AssistantAgent("Coder", llm_config={"model": "qwen-br"},
tools=[python_executor])
reviewer = AssistantAgent("Reviewer", llm_config={"model": "qwen-br"})
user = UserProxyAgent("User", human_input_mode="NEVER")
groupchat = GroupChat(
agents=[user, planner, researcher, coder, reviewer],
messages=[],
max_round=20
)
manager = GroupChatManager(groupchat=groupchat, llm_config={"model": "qwen-br"})
user.initiate_chat(manager, message="Crie script Python que extrai notícias da B3 e gera resumo diário.")
Passo 5: Executar e debugar
Na UI, clique em Run Workflow e veja:
- Cada turno da conversa entre agentes
- Tools chamadas e resultados
- Código gerado e executado em sandbox
- Quem decidiu o quê e por quê
Padrões de conversação
- Two-agent: User ↔ Assistant (mais simples)
- Group Chat: N agentes + manager que escolhe quem fala
- Sequential: Agent A → B → C → fim
- Nested: Agent A delega para sub-equipe
- Hierarchical: Manager Agent coordena Worker Agents
Caso real: agente B3 (bolsa brasileira)
User: "Análise do dia: principais altas/baixas, motivos e sugestão"
[Planner] → divide em: 1) buscar dados B3, 2) buscar notícias, 3) correlacionar, 4) sumarizar
[Researcher] → API B3 (top 10 altas/baixas)
[Researcher] → Web search "Petrobras alta hoje motivo"
[Coder] → script Python que cruza ticker × notícia
[Reviewer] → "falta menção a câmbio USD/BRL"
[Researcher] → busca câmbio
[Coder] → atualiza análise
[Reviewer] → aprova
[Planner] → entrega resumo final ao usuário
AutoGen Studio vs alternativas
- AutoGen vs CrewAI: AutoGen é mais flexível em comunicação; CrewAI mais opinionated
- AutoGen vs LangGraph: AutoGen foca em conversas; LangGraph em grafos de estado
- AutoGen Studio vs Langflow: Studio especializado em multi-agente; Langflow é geral
- AutoGen vs n8n: AutoGen é IA-first; n8n é automação geral
Dicas de produção
- max_round: limite turnos para evitar loops infinitos
- Termination function: condição clara para parar conversa
- Code execution sandbox: use Docker para isolar Python gerado
- Cost tracking: coloque LiteLLM proxy entre agentes e LLMs
- Logging: habilite Langfuse para auditoria
- Modelos diferentes por papel: use Claude pro planner, Qwen pro coder
Construa equipes de agentes IA em 90 segundos
Ganhe R$ 25 grátis no GPUBrasil e suba AutoGen Studio em 1 clique.
Começar Grátis →Conclusão
AutoGen Studio é a melhor entrada visual no mundo dos multi-agentes IA. Para times brasileiros que querem ir além de "ChatGPT com prompt", é a ferramenta certa para construir sistemas complexos onde IAs colaboram. Combinado com vLLM no GPUBrasil, você roda equipes inteiras de agentes pagando centavos por hora.