
Senior AI Engineer – Agentes, Plataforma & RAG
Posted 6 days ago

Posted 6 days ago
This is a fully remote position, open to applicants in Brazil.
• Você será responsável por desenvolver a plataforma de agentes de IA da Guanabara e o ecossistema que disponibiliza IA generativa governada para a empresa.
• Orquestração de agentes — projetar agentes utilizando LangGraph no padrão Supervisor/ReAct, incorporando memória de curto e longo prazo, bem como um estado persistente (PostgresSaver).
• Camada semântica e RAG — aprimorar a camada semântica determinística (Cube.js) e a recuperação semântica com Qdrant (busca vetorial + re-ranking), ancorando as respostas em informações reais.
• Skills, subagentes e MCP — desenvolver e versionar skills (SKILL.md), subagentes e ferramentas MCP (FastMCP) para o Claude Code, em um fluxo orientado por especificações, interligando agentes a sistemas corporativos.
• Verificação e avaliação — gerenciar o verificador (LLM-as-judge) e suítes de avaliação (offline/online), utilizando amostragem de traces para detectar desvios de qualidade.
• Plataforma de modelos — operar o gateway LiteLLM (Virtual Keys, budget, RBAC, roteamento multi-provider), otimizando custos e latência.
• Adaptação e serviço de modelos — quando RAG e prompting não forem suficientes, realizar fine-tuning supervisionado e PEFT (LoRA/QLoRA), além de quantização e destilação; disponibilizar modelos abertos/privados com vLLM e roteamento SLM↔LLM.
• Governança e segurança — implementar guardrails de PII (Presidio), defesas contra injeção de prompts e garantir observabilidade de ponta a ponta (Langfuse).
• Experiência em desenvolver aplicações de IA generativa em ambientes de produção (agentes ou RAG).
• Habilidade em Python e design de APIs (FastAPI/FastMCP).
• Conhecimento em frameworks de agentes (LangGraph, LangChain) e chamada de funções estruturadas (Pydantic).
• Experiência com RAG e bancos de dados vetoriais (Qdrant ou equivalentes).
• Familiaridade com gateways e roteamento de LLMs (LiteLLM) e o Model Context Protocol (MCP).
• Experiência em fine-tuning e adaptação de modelos: PEFT (LoRA/QLoRA), quantização e serviço (vLLM).
• Capacidade de criar skills e agentes para o Claude Code — aspecto central desta função.
• Conhecimento em camadas semânticas (Cube.js) como fonte de recuperação determinística.
• Experiência em fine-tuning avançado: instruction tuning, destilação, fine-tuning de embeddings e roteamento SLM↔LLM.
• Entendimento de guardrails de PII (Presidio) e defesas contra injeção de prompts.
• Habilidades em observabilidade e avaliação (Langfuse, LLM-as-judge, evals).
• Conhecimento em GraphRAG / Neo4j como evolução híbrida sob demanda.
• Experiência em plataformas de automação (n8n) e integração com sistemas corporativos.
• Trabalho Remoto
• Tempo de Projeto: 6 meses, com possibilidade de extensão/internalização.
Credo AI
Get handpicked remote jobs straight to your inbox weekly.