
AI Engineer – Ingénieur(e) en IA
Posted May 10

Posted May 10
This is a fully remote position, open to applicants in United States.
• Développer et optimiser des workflows complexes et multi-étapes pour permettre à l'IA d'exécuter des tâches et de prendre des décisions de manière autonome.
• Concevoir et maintenir des systèmes de génération augmentée par récupération (RAG) afin de connecter les LLM aux données propriétaires de manière sécurisée et précise.
• Évaluer et configurer divers LLM en fonction des exigences spécifiques des projets, telles que la latence, le coût et la confidentialité des données.
• Établir des normes de conception pour les instructions afin d'assurer que les sorties des modèles soient fiables, sécurisées et adaptées au contexte.
• Concevoir des stratégies de mémoire à court et long terme pour les systèmes agentiques.
• Plus de 3 ans d'expérience dans un environnement d'agence ou en consultation dans un cadre dynamique.
• Intérêt avéré pour les outils d'IA, avec au moins 2-3 cas d'utilisation documentés appliqués à des projets présents ou passés.
• Plus de 5 ans d'expérience en génie logiciel, avec de solides compétences en programmation (Python/Backend).
• Expérience avec les agents, le protocole MCP ou l'orchestration logicielle liée à l'IA, ainsi que les lacs de données (BigQuery, Databricks, Snowflake).
• Connaissance approfondie des techniques de prompt engineering et des particularités des principaux modèles fondateurs.
• Développement d'architectures cloud optimisées pour le temps réel et l'IA.
• Expérience pratique avec des frameworks agentiques tels que LangChain, LlamaIndex, CrewAI, AutoGen, ou des implémentations personnalisées d'appel d'outils utilisant les API natives des modèles.
• Expérience pratique des entrepôts vectoriels (Pinecone, Weaviate, pgvector, ChromaDB), y compris les stratégies d'indexation, l'optimisation de la recherche par similarité et les approches de récupération hybride.
• Familiarité avec des méthodes de réglage fin efficaces, telles que LoRA et QLoRA, et compréhension des contextes dans lesquels appliquer le fine-tuning, le prompt engineering ou le RAG.
• Compréhension des injections de prompts, des vecteurs de jailbreaking et des risques de fuite de données spécifiques aux LLM, ainsi que la capacité de concevoir des mesures d'atténuation au niveau de l'architecture.
• Capacité à concevoir des workflows techniques évolutifs pour gérer efficacement un volume élevé de requêtes IA.
• Solides compétences en débogage des comportements de modèles « boîte noire » et capacité à itérer jusqu'à atteindre les seuils de précision requis.
• Accès à des assurances santé en partie financées par l'employeur, couvrant vous et votre famille.
• Vacances et jours mobiles pour vous permettre de vous reposer.
• Politique de déconnexion pour favoriser l'équilibre entre vie professionnelle et vie personnelle.
• Flexibilité concernant le lieu de travail et les horaires (bureaux situés aux États-Unis et au Canada, possibilité de télétravail à 100%).
• Un programme de reconnaissance sous forme de cartes-cadeaux ou de dons à des associations.
Omada Health
NineTwoThree Studio
Stride, Inc.
KeyBank
Get handpicked remote jobs straight to your inbox weekly.