Sua empresa quer um ChatGPT que responde sobre os seus contratos, manuais, normas internas — sem mandar dados pra OpenAI? O AnythingLLM da Mintplex Labs é a aplicação RAG mais polida open-source: interface estilo ChatGPT, multi-usuário, multi-workspace, embeddings locais, e integra com qualquer LLM. Em 1 clique no GPUBrasil.
AnythingLLM = ChatGPT corporativo com seus dados. Faz upload de PDFs, sites, planilhas. Cada workspace tem seu próprio contexto. 100% LGPD-friendly: dados ficam na sua infra brasileira.
O que é o AnythingLLM?
AnythingLLM é uma aplicação full-stack open-source de chat com documentos. Inclui:
- Frontend React (estilo ChatGPT)
- Backend Node.js
- Vector DB embutido (LanceDB) ou plugável (Pinecone, Qdrant, Chroma, Weaviate)
- Sistema de autenticação multi-usuário
- Workspaces isolados (cada projeto tem seu RAG)
- Conectores para LLMs (OpenAI, Anthropic, Ollama, vLLM, etc)
Características principais
- Multi-LLM: escolha por workspace (use Claude pra um, Qwen self-hosted pra outro)
- Multi-usuário: SSO, roles (admin/manager/default)
- Multi-workspace: "Jurídico", "Suporte", "Engenharia" — cada um com docs próprios
- 40+ formatos: PDF, DOCX, PPTX, MD, TXT, sites, GitHub repos, YouTube, Confluence
- Custom agents: agentes que executam tools (web search, scraping, code)
- Embed widget: chat plugado em qualquer site
- API REST + Slack/Discord bots
- Licença MIT
Casos de uso brasileiros
- Helpdesk interno: bot que responde sobre políticas RH, manuais TI
- Atendimento ao cliente: chatbot público com FAQs e produtos
- Jurídico: consulta a contratos e jurisprudência
- Saúde: protocolos clínicos, com dados em território nacional (LGPD)
- Educação: tutor IA que conhece o material do curso
- Compliance: bot sobre normas LGPD, BACEN, ANS, ANATEL
Hardware recomendado
AnythingLLM em si é leve, mas se for usar LLM e embeddings locais junto:
- RTX A4000 / 4090: hospeda AnythingLLM + embedding model + LLM 7B
- L40S / A100: AnythingLLM + LLM 70B + embeddings simultâneos
- Apenas RAG (LLM externo): RTX A4000 ou até CPU
RTX A4000 (R$ 1,80/h) hospedando AnythingLLM + embeddings + Qwen2.5-3B: ~R$ 1.300/mês 24x7. Para uso comercial intermitente (12h/dia úteis): ~R$ 400/mês.
Deploy em 1 clique
Passo 1: Iniciar template
- Console → Templates → 📚 RAG & Knowledge
- Selecione AnythingLLM
- GPU: RTX A4000 (recomendado)
- Clique em Iniciar
O template usa mintplexlabs/anythingllm:latest com volume persistente para storage e expõe a UI na porta 3001.
Passo 2: Configuração inicial
Acesse https://<sua-instancia>.gpubrasil.com.br:
- Crie usuário admin
- LLM Provider: escolha (OpenAI, Anthropic, Ollama, vLLM no GPUBrasil...)
- Embedding model: use o built-in (all-MiniLM) ou um vLLM/HuggingFace
- Vector DB: LanceDB (built-in, default) ou Qdrant externo
- Crie um workspace: ex.: "Jurídico"
Passo 3: Adicionar documentos
- Upload PDF, DOCX, PPTX direto da UI
- Drag-and-drop de pastas inteiras
- "Pull" de site (web scraper integrado)
- Conector GitHub (indexa repo inteiro)
- YouTube transcript
- Confluence / Notion (via API)
Documentos vão para document picker; "movê-los" pro workspace os tornam disponíveis para chat.
Passo 4: API REST
import requests
api = "https://sua-instancia.gpubrasil.com.br/api/v1"
headers = {"Authorization": "Bearer SUA_API_KEY"}
# 1. Stream de chat com workspace
r = requests.post(
f"{api}/workspace/juridico/chat",
headers=headers,
json={
"message": "Quais são as cláusulas de rescisão no contrato Acme?",
"mode": "chat"
}
)
print(r.json()["textResponse"])
print("Fontes:", r.json()["sources"])
# 2. Embed widget num site externo
# (gera-se um snippet na UI)
Passo 5: Conectar ao vLLM brasileiro
Em Settings → LLM Provider → Generic OpenAI:
Base URL: https://outra-instancia.gpubrasil.com.br/v1
API Key: dummy
Model: Qwen/Qwen2.5-7B-Instruct
Token Context Window: 32000
Pronto: AnythingLLM + LLM brasileiro, sem dados saindo do país.
Multi-tenant (clientes finais)
Você pode oferecer AnythingLLM como SaaS:
- Cada cliente vira um user com role manager
- Cada cliente tem seus próprios workspaces
- Permissões granulares por workspace/documento
- API keys separadas (rate limiting per cliente via LiteLLM)
- Faturamento via spend tracking
Custom agents
Workspaces podem virar agentes que executam tools:
# Configurado na UI Workspace > Agents
@agent "tira-duvidas"
Tools:
- web-search (Bing/SerpAPI)
- rag-search (busca nos docs do workspace)
- sql-query (consulta DB Postgres interno)
# Usuário pergunta:
"Qual cliente teve mais chamados em maio?"
# Agent: SQL → web-search → resposta com fonte
AnythingLLM vs alternativas
- AnythingLLM vs LibreChat: AnythingLLM é mais focado em RAG; LibreChat em chat puro
- AnythingLLM vs LangFlow: AnythingLLM é app pronta; LangFlow é builder de workflows
- AnythingLLM vs PrivateGPT: AnythingLLM tem UI moderna multi-usuário; PrivateGPT é mais barebone
- AnythingLLM vs ChatGPT Enterprise: open-source, infra própria, ~10x mais barato
Tenha seu ChatGPT corporativo brasileiro em 90 segundos
Ganhe R$ 25 grátis no GPUBrasil e suba AnythingLLM em 1 clique.
Começar Grátis →Conclusão
Para qualquer empresa brasileira que precise de IA com seus próprios dados (e não pode mandar para OpenAI por LGPD/contrato/segurança), AnythingLLM no GPUBrasil é a stack completa em 1 clique. Combinada com vLLM rodando Qwen ou LLaMA, é uma alternativa local 100% brasileira ao ChatGPT Enterprise.
Combos: Qdrant para vector DB · vLLM para o LLM