Venha ser nosso SRE e garanta a confiança dos nossos sistemas!
Estamos em busca de um Site Reliability Engineer (SRE) para se juntar ao nosso time e assegurar que nossos serviços e plataformas estejam sempre disponíveis, escaláveis e resilientes. Se você é apaixonado por tecnologia, adora automatizar processos e tem experiência em ambientes de alta disponibilidade, queremos te conhecer!
O Que Você Vai Fazer
Desenvolver e implementar soluções para aumentar a confiabilidade e escalabilidade dos nossos sistemas.
Criar e manter pipelines de CI/CD para garantir implantações seguras e eficientes.
Monitorar e otimizar a performance das aplicações e da infraestrutura.
Automatizar processos operacionais para reduzir erros manuais e melhorar a eficiência.
Responder a incidentes críticos, liderando investigações e implementando soluções definitivas.
Trabalhar em colaboração com times de engenharia e produto para definir melhores práticas de arquitetura e SRE.
Implementar e gerenciar estratégias de gestão de capacidade e planejamento de crescimento da infraestrutura.
Garantir a segurança e conformidade das operações com as melhores práticas de proteção de dados e compliance.
O Que Esperamos De Você
Experiência com Cloud Computing (AWS, Azure, GCP e Huawei Cloud).
Conhecimento profundo de Kubernetes e orquestração de containers (Docker).
Experiência com Infrastructure as Code (IaC) Terraform, Ansible, CloudFormation.
Conhecimento em monitoramento e observabilidade (Prometheus, Grafana, Datadog, ELK, OpenTelemetry e NewRelic).
Experiência com automação e Scripting (Bash, Python, Go ou similar).
Familiaridade com CI/CD e ferramentas como GitHub Actions, Jenkins, CodePipeline, ArgoCD e Spinnaker.
Experiência em bancos de dados SQL e NoSQL (PostgreSQL, MySQL, SQL, Oracle, MongoDB, Redis e Postgres).
Conhecimento em gestão de incidentes e resposta a falhas.
Experiência com práticas de segurança em DevOps (DevSecOps, Hardening, IAM).
Boa comunicação para colaboração entre equipes de desenvolvimento e operações.
Diferenciais Que Vão Te Destacar
Experiência com Service Mesh (Istio, Linkerd, Consul).
Certificações em Cloud (AWS, Azure, GCP, Huawei Cloud).
Conhecimento em FinOps para otimização de custos na nuvem.
Experiência com chaos engineering para melhorar a resiliência dos sistemas.
Experiência com plataformas de API Gateway e controle de tráfego.
How strong is your resume?
Upload your resume and get feedback from our expert to help land this job
How strong is your resume?
Upload your resume and get feedback from our expert to help land this job