Sua empresa quer um ChatGPT que responde sobre os seus contratos, manuais, normas internas — sem mandar dados pra OpenAI? O AnythingLLM da Mintplex Labs é a aplicação RAG mais polida open-source: interface estilo ChatGPT, multi-usuário, multi-workspace, embeddings locais, e integra com qualquer LLM. Em 1 clique no GPUBrasil.

⚡ Resumo

AnythingLLM = ChatGPT corporativo com seus dados. Faz upload de PDFs, sites, planilhas. Cada workspace tem seu próprio contexto. 100% LGPD-friendly: dados ficam na sua infra brasileira.

O que é o AnythingLLM?

AnythingLLM é uma aplicação full-stack open-source de chat com documentos. Inclui:

Características principais

Casos de uso brasileiros

Hardware recomendado

AnythingLLM em si é leve, mas se for usar LLM e embeddings locais junto:

💰 Custo no GPUBrasil

RTX A4000 (R$ 1,80/h) hospedando AnythingLLM + embeddings + Qwen2.5-3B: ~R$ 1.300/mês 24x7. Para uso comercial intermitente (12h/dia úteis): ~R$ 400/mês.

Deploy em 1 clique

Passo 1: Iniciar template

  1. Console → Templates → 📚 RAG & Knowledge
  2. Selecione AnythingLLM
  3. GPU: RTX A4000 (recomendado)
  4. Clique em Iniciar

O template usa mintplexlabs/anythingllm:latest com volume persistente para storage e expõe a UI na porta 3001.

Passo 2: Configuração inicial

Acesse https://<sua-instancia>.gpubrasil.com.br:

  1. Crie usuário admin
  2. LLM Provider: escolha (OpenAI, Anthropic, Ollama, vLLM no GPUBrasil...)
  3. Embedding model: use o built-in (all-MiniLM) ou um vLLM/HuggingFace
  4. Vector DB: LanceDB (built-in, default) ou Qdrant externo
  5. Crie um workspace: ex.: "Jurídico"

Passo 3: Adicionar documentos

Documentos vão para document picker; "movê-los" pro workspace os tornam disponíveis para chat.

Passo 4: API REST

import requests

api = "https://sua-instancia.gpubrasil.com.br/api/v1"
headers = {"Authorization": "Bearer SUA_API_KEY"}

# 1. Stream de chat com workspace
r = requests.post(
    f"{api}/workspace/juridico/chat",
    headers=headers,
    json={
        "message": "Quais são as cláusulas de rescisão no contrato Acme?",
        "mode": "chat"
    }
)
print(r.json()["textResponse"])
print("Fontes:", r.json()["sources"])

# 2. Embed widget num site externo
# (gera-se um snippet na UI)

Passo 5: Conectar ao vLLM brasileiro

Em Settings → LLM Provider → Generic OpenAI:

Base URL: https://outra-instancia.gpubrasil.com.br/v1
API Key: dummy
Model: Qwen/Qwen2.5-7B-Instruct
Token Context Window: 32000

Pronto: AnythingLLM + LLM brasileiro, sem dados saindo do país.

Multi-tenant (clientes finais)

Você pode oferecer AnythingLLM como SaaS:

Custom agents

Workspaces podem virar agentes que executam tools:

# Configurado na UI Workspace > Agents
@agent "tira-duvidas"
Tools:
  - web-search (Bing/SerpAPI)
  - rag-search (busca nos docs do workspace)
  - sql-query (consulta DB Postgres interno)

# Usuário pergunta:
"Qual cliente teve mais chamados em maio?"
# Agent: SQL → web-search → resposta com fonte

AnythingLLM vs alternativas

Tenha seu ChatGPT corporativo brasileiro em 90 segundos

Ganhe R$ 25 grátis no GPUBrasil e suba AnythingLLM em 1 clique.

Começar Grátis →

Conclusão

Para qualquer empresa brasileira que precise de IA com seus próprios dados (e não pode mandar para OpenAI por LGPD/contrato/segurança), AnythingLLM no GPUBrasil é a stack completa em 1 clique. Combinada com vLLM rodando Qwen ou LLaMA, é uma alternativa local 100% brasileira ao ChatGPT Enterprise.

Combos: Qdrant para vector DB · vLLM para o LLM