Remotery

Senior DevOps, AWS

Posted 6 days ago

This is a fully remote position, open to applicants in Brazil.

📋 Description

• Liderar a instrumentação completa de métricas, logs estruturados e rastreamento distribuído, assegurando uma visão holística do ecossistema.

• Implementar, aprimorar e gerenciar ferramentas de Monitoramento de Performance de Aplicações para identificar gargalos no código e otimizar proativamente a experiência do usuário.

• Definir, implementar e monitorar SLIs, SLOs e Error Budgets, atuando como embaixador da disponibilidade e ajudando as equipes a equilibrar a velocidade de inovação com a estabilidade operacional.

• Planejar, arquitetar e realizar experimentos práticos de Engenharia do Caos para validar hipóteses de falha e proteger a arquitetura contra incidentes reais.

• Desenvolver e gerenciar políticas de alertas preditivos e inteligentes, focando na eliminação da fadiga de alertas e garantindo respostas extremamente rápidas a incidentes críticos.

• Atuar de forma colaborativa, apoiando tanto a manutenção de pipelines complexos de Engenharia de Dados quanto as arquiteturas de microsserviços de Backend (APIs REST) hospedadas na AWS.


⛳️ Requirements

• Especialista em Datadog: Domínio avançado da plataforma para criação de dashboards executivos/técnicos, monitores complexos, APM e gerenciamento de logs.

• Infraestrutura Cloud e Orquestração: Experiência sólida e comprovada com o ecossistema AWS, além de proficiência em containerização com Docker e orquestração em larga escala com Kubernetes (EKS).

• Cultura de Automação: Experiência prática no desenvolvimento de automações voltadas para infraestrutura e monitoramento dinâmico.

• Fundamentos de SRE: Conhecimento prático aprofundado na aplicação dos princípios de Site Reliability Engineering (gerenciamento do ciclo de vida de incidentes, Budgets e métricas de SLI/SLO).

• Arquitetura de Sistemas Distribuídos: Compreensão clara de padrões de Alta Disponibilidade, Tolerância a Falhas e Resiliência arquitetural.

• Diferencial: Infraestrutura como Código (IaC): Experiência prática com ferramentas de provisionamento declarativo como Terraform, Pulumi ou CloudFormation.

• Observabilidade em Engenharia de Dados: Familiaridade com a infraestrutura e o comportamento de pipelines de Big Data (Apache Airflow, Spark ou similares) sob a perspectiva de confiabilidade e monitoramento de cargas de trabalho.

• SecOps / DevSecOps: Conhecimento em conceitos de Segurança orientada por Observabilidade.

• Certificações ativas de Arquitetura/DevOps AWS ou de Kubernetes.


🏝️ Benefits

• Cartão multi-benefícios – você escolhe como e onde utilizar.

• Bolsas de Estudos para cursos de Graduação, Pós, MBA e Idiomas.

• Programas de incentivo à Certificações.

• Horário de trabalho flexível.

• Salários competitivos.

• Avaliação de desempenho anual com plano de carreira estruturado.

• Possibilidade de carreira internacional.

• Wellhub e TotalPass.

• Previdência Privada.

• Auxílio-Creche.

• Assistência Médica.

• Assistência Odontológica.

• Seguro de Vida.

People also viewed

Advanced Solutions International, Inc.10 hours ago

DevOps Reliability Engineer

AU flagAustralia OnlyFull-timeDevOps & Site Reliability Engineer (SRE)$90k – $110k/year
ApplyView job
Stone10 hours ago

Senior Site Reliability Engineer – Network

BR flagBrazil OnlyFull-timeDevOps & Site Reliability Engineer (SRE)
ApplyView job
Replit1 day ago

Staff Site Reliability Engineer

EuropeFull-timeDevOps & Site Reliability Engineer (SRE)
ApplyView job
Soum1 day ago

DevOps Engineer, Mid Level

EG flagEgypt OnlyFull-timeDevOps & Site Reliability Engineer (SRE)
ApplyView job
Lakeside Software1 day ago

DevOps Engineer, Azure

IN flagIndia OnlyFull-timeDevOps & Site Reliability Engineer (SRE)
ApplyView job
Interval Group1 day ago

DevOps Engineer, mk8s

DE flagGermany OnlyFreelanceDevOps & Site Reliability Engineer (SRE)
ApplyView job

Never miss a great job!

Get handpicked remote jobs straight to your inbox weekly.

Trusted by 7,400+ designers