Remotery

Senior AI Engineer – Agentes, Plataforma & RAG

Posted 6 days ago

This is a fully remote position, open to applicants in Brazil.

📋 Description

• Você será responsável por desenvolver a plataforma de agentes de IA da Guanabara e o ecossistema que disponibiliza IA generativa governada para a empresa.

• Orquestração de agentes — projetar agentes utilizando LangGraph no padrão Supervisor/ReAct, incorporando memória de curto e longo prazo, bem como um estado persistente (PostgresSaver).

• Camada semântica e RAG — aprimorar a camada semântica determinística (Cube.js) e a recuperação semântica com Qdrant (busca vetorial + re-ranking), ancorando as respostas em informações reais.

• Skills, subagentes e MCP — desenvolver e versionar skills (SKILL.md), subagentes e ferramentas MCP (FastMCP) para o Claude Code, em um fluxo orientado por especificações, interligando agentes a sistemas corporativos.

• Verificação e avaliação — gerenciar o verificador (LLM-as-judge) e suítes de avaliação (offline/online), utilizando amostragem de traces para detectar desvios de qualidade.

• Plataforma de modelos — operar o gateway LiteLLM (Virtual Keys, budget, RBAC, roteamento multi-provider), otimizando custos e latência.

• Adaptação e serviço de modelos — quando RAG e prompting não forem suficientes, realizar fine-tuning supervisionado e PEFT (LoRA/QLoRA), além de quantização e destilação; disponibilizar modelos abertos/privados com vLLM e roteamento SLM↔LLM.

• Governança e segurança — implementar guardrails de PII (Presidio), defesas contra injeção de prompts e garantir observabilidade de ponta a ponta (Langfuse).


⛳️ Requirements

• Experiência em desenvolver aplicações de IA generativa em ambientes de produção (agentes ou RAG).

• Habilidade em Python e design de APIs (FastAPI/FastMCP).

• Conhecimento em frameworks de agentes (LangGraph, LangChain) e chamada de funções estruturadas (Pydantic).

• Experiência com RAG e bancos de dados vetoriais (Qdrant ou equivalentes).

• Familiaridade com gateways e roteamento de LLMs (LiteLLM) e o Model Context Protocol (MCP).

• Experiência em fine-tuning e adaptação de modelos: PEFT (LoRA/QLoRA), quantização e serviço (vLLM).

• Capacidade de criar skills e agentes para o Claude Code — aspecto central desta função.

• Conhecimento em camadas semânticas (Cube.js) como fonte de recuperação determinística.

• Experiência em fine-tuning avançado: instruction tuning, destilação, fine-tuning de embeddings e roteamento SLM↔LLM.

• Entendimento de guardrails de PII (Presidio) e defesas contra injeção de prompts.

• Habilidades em observabilidade e avaliação (Langfuse, LLM-as-judge, evals).

• Conhecimento em GraphRAG / Neo4j como evolução híbrida sob demanda.

• Experiência em plataformas de automação (n8n) e integração com sistemas corporativos.


🏝️ Benefits

• Trabalho Remoto

• Tempo de Projeto: 6 meses, com possibilidade de extensão/internalização.

People also viewed

Remofirst10 hours ago

AI Engineer

EG flagEgypt OnlyFull-timeAI Engineer
ApplyView job
Delve10 hours ago

AI Engineer

EuropeFreelanceAI Engineer
ApplyView job
Credo AI1 day ago

AI Engineer – Governance Intelligence, Third Party

IN flagIndia OnlyFull-timeAI Engineer₹3500k – ₹5000k/year
ApplyView job
CodiLime1 day ago

Mid/Senior AI Engineer, Networking

PL flagPoland OnlyFreelanceAI Engineer
ApplyView job
Sweed POS2 days ago

AI Engineer

Anywhere in the WorldFull-timeAI Engineer
ApplyView job
LITIT2 days ago

AI Engineer

LT flagLithuania OnlyFull-timeAI Engineer€3,000 – €6,000/month
ApplyView job

Never miss a great job!

Get handpicked remote jobs straight to your inbox weekly.

Trusted by 7,400+ designers