AnythingLLM: ChatGPT Privado com seus Documentos em 1 Clique

Sua empresa quer um ChatGPT que responde sobre os seus contratos, manuais, normas internas — sem mandar dados pra OpenAI? O AnythingLLM da Mintplex Labs é a aplicação RAG mais polida open-source: interface estilo ChatGPT, multi-usuário, multi-workspace, embeddings locais, e integra com qualquer LLM. Em 1 clique no GPUBrasil.

⚡ Resumo

AnythingLLM = ChatGPT corporativo com seus dados. Faz upload de PDFs, sites, planilhas. Cada workspace tem seu próprio contexto. 100% LGPD-friendly: dados ficam na sua infra brasileira.

O que é o AnythingLLM?

AnythingLLM é uma aplicação full-stack open-source de chat com documentos. Inclui:

Frontend React (estilo ChatGPT)
Backend Node.js
Vector DB embutido (LanceDB) ou plugável (Pinecone, Qdrant, Chroma, Weaviate)
Sistema de autenticação multi-usuário
Workspaces isolados (cada projeto tem seu RAG)
Conectores para LLMs (OpenAI, Anthropic, Ollama, vLLM, etc)

Características principais

Multi-LLM: escolha por workspace (use Claude pra um, Qwen self-hosted pra outro)
Multi-usuário: SSO, roles (admin/manager/default)
Multi-workspace: "Jurídico", "Suporte", "Engenharia" — cada um com docs próprios
40+ formatos: PDF, DOCX, PPTX, MD, TXT, sites, GitHub repos, YouTube, Confluence
Custom agents: agentes que executam tools (web search, scraping, code)
Embed widget: chat plugado em qualquer site
API REST + Slack/Discord bots
Licença MIT

Casos de uso brasileiros

Helpdesk interno: bot que responde sobre políticas RH, manuais TI
Atendimento ao cliente: chatbot público com FAQs e produtos
Jurídico: consulta a contratos e jurisprudência
Saúde: protocolos clínicos, com dados em território nacional (LGPD)
Educação: tutor IA que conhece o material do curso
Compliance: bot sobre normas LGPD, BACEN, ANS, ANATEL

Hardware recomendado

AnythingLLM em si é leve, mas se for usar LLM e embeddings locais junto:

RTX A4000 / 4090: hospeda AnythingLLM + embedding model + LLM 7B
L40S / A100: AnythingLLM + LLM 70B + embeddings simultâneos
Apenas RAG (LLM externo): RTX A4000 ou até CPU

💰 Custo no GPUBrasil

RTX A4000 (R$ 1,80/h) hospedando AnythingLLM + embeddings + Qwen2.5-3B: ~R$ 1.300/mês 24x7. Para uso comercial intermitente (12h/dia úteis): ~R$ 400/mês.

Deploy em 1 clique

Passo 1: Iniciar template

Console → Templates → 📚 RAG & Knowledge
Selecione AnythingLLM
GPU: RTX A4000 (recomendado)
Clique em Iniciar

O template usa mintplexlabs/anythingllm:latest com volume persistente para storage e expõe a UI na porta 3001.

Passo 2: Configuração inicial

Acesse https://<sua-instancia>.gpubrasil.com.br:

Crie usuário admin
LLM Provider: escolha (OpenAI, Anthropic, Ollama, vLLM no GPUBrasil...)
Embedding model: use o built-in (all-MiniLM) ou um vLLM/HuggingFace
Vector DB: LanceDB (built-in, default) ou Qdrant externo
Crie um workspace: ex.: "Jurídico"

Passo 3: Adicionar documentos

Upload PDF, DOCX, PPTX direto da UI
Drag-and-drop de pastas inteiras
"Pull" de site (web scraper integrado)
Conector GitHub (indexa repo inteiro)
YouTube transcript
Confluence / Notion (via API)

Documentos vão para document picker; "movê-los" pro workspace os tornam disponíveis para chat.

Passo 4: API REST

import requests

api = "https://sua-instancia.gpubrasil.com.br/api/v1"
headers = {"Authorization": "Bearer SUA_API_KEY"}

# 1. Stream de chat com workspace
r = requests.post(
    f"{api}/workspace/juridico/chat",
    headers=headers,
    json={
        "message": "Quais são as cláusulas de rescisão no contrato Acme?",
        "mode": "chat"
    }
)
print(r.json()["textResponse"])
print("Fontes:", r.json()["sources"])

# 2. Embed widget num site externo
# (gera-se um snippet na UI)

Passo 5: Conectar ao vLLM brasileiro

Em Settings → LLM Provider → Generic OpenAI:

Base URL: https://outra-instancia.gpubrasil.com.br/v1
API Key: dummy
Model: Qwen/Qwen2.5-7B-Instruct
Token Context Window: 32000

Pronto: AnythingLLM + LLM brasileiro, sem dados saindo do país.

Multi-tenant (clientes finais)

Você pode oferecer AnythingLLM como SaaS:

Cada cliente vira um user com role manager
Cada cliente tem seus próprios workspaces
Permissões granulares por workspace/documento
API keys separadas (rate limiting per cliente via LiteLLM)
Faturamento via spend tracking

Custom agents

Workspaces podem virar agentes que executam tools:

# Configurado na UI Workspace > Agents
@agent "tira-duvidas"
Tools:
  - web-search (Bing/SerpAPI)
  - rag-search (busca nos docs do workspace)
  - sql-query (consulta DB Postgres interno)

# Usuário pergunta:
"Qual cliente teve mais chamados em maio?"
# Agent: SQL → web-search → resposta com fonte

AnythingLLM vs alternativas

AnythingLLM vs LibreChat: AnythingLLM é mais focado em RAG; LibreChat em chat puro
AnythingLLM vs LangFlow: AnythingLLM é app pronta; LangFlow é builder de workflows
AnythingLLM vs PrivateGPT: AnythingLLM tem UI moderna multi-usuário; PrivateGPT é mais barebone
AnythingLLM vs ChatGPT Enterprise: open-source, infra própria, ~10x mais barato

Tenha seu ChatGPT corporativo brasileiro em 90 segundos

Ganhe R$ 25 grátis no GPUBrasil e suba AnythingLLM em 1 clique.

Começar Grátis →

Conclusão

Para qualquer empresa brasileira que precise de IA com seus próprios dados (e não pode mandar para OpenAI por LGPD/contrato/segurança), AnythingLLM no GPUBrasil é a stack completa em 1 clique. Combinada com vLLM rodando Qwen ou LLaMA, é uma alternativa local 100% brasileira ao ChatGPT Enterprise.

Combos: Qdrant para vector DB · vLLM para o LLM