Engenheiro de Confiabilidade do Site (SRE) com conhecimentos em engenharia de software, sistemas e infraestrutura, com ênfase nas práticas de DevOps, aplicação de segurança e confiabilidade do sistema.
Atribuições Principais
Prover guia técnico e mentor técnico outros engenheiros;
Participar do desenvolvimento e manutenção da infraestrutura Cloud;
Colaborar nas decisões técnicas envolvendo arquitetura e infraestrutura (dimensionamento de carga, distribuição de carga, estratégias para cache, etc.);
Ser responsável por monitoramento e observabilidade dentro dos clusters e parcialmente nas aplicações também (uso de recursos das máquinas, gargalos de desempenho, análises preditivas de custo, etc.);
Estar em rotação on-call para raros incidentes de indisponibilidade ou manipulação de serviço;
identificar e ajudar a solucionar problemas de desempenho e segurança;
identificar oportunidades de melhorias e realizar a implementação de automatizações;
Elevar o nível dos sistemas de forma sustentável, por mecanismos de automação, soluções para que se tornem performáticos, escaláveis e disponíveis;
Disseminar conhecimento sobre as melhores práticas do SRE;
Planejar e direcionar a mudança de cultura através da Reabilidade do Sistema, incluindo: uso de padrões de arquitetura, gerenciamento de capacidade, sobre estrutura de nuvem utilizada pelos desenvolvedores;
Zelar pela manutenção dos serviços produtivos, medindo e monitorando a disponibilidade, latência e integridade geral do sistema;
Se envolva no desenvolvimento de seus pares em um ambiente de aprendizagem colaborativa (trabalho em par, revisão de código, palestras internas, etc).
Requisitos
Experiência em funções de engenharia de software, DevOps ou SRE;
Inglês avançado
Conhecimento em linguagens de programação;
Fortes habilidades analíticas e de resolução de problemas;
Excelentes habilidades de comunicação e colaboração;
Atuação com CI/CD (GitLab, Azure DevOps, Jenkins), Docker, Kubernetes e nuvem (Azure, PCF);
Domínio em bancos relacionais (Oracle, SQL Server) e NoSQL (MongoDB, ElasticSearch).
Diferenciais
Experiência com ferramentas de monitoramento (por exemplo, Prometheus, Grafana, ELK Stack, Splunk, Dynatrace);
Familiaridade com os princípios ITIL ou SRE (SLAs, SLOs, Orçamentos de Erro).
Localidade da posição: 100% remota
Por que construir sua carreira na Meta?
Oferecemos autonomia, metas claras e um ambiente dinâmico e desafiador, onde os profissionais têm oportunidade de interagir com diferentes tecnologias, participar de todos os tipos de projetos, trazer novas ideias e trabalhar de qualquer lugar do Brasil e (por que não?) do mundo. Além disso, somos uma das melhores empresas para se trabalhar no Brasil segundo o Great Place to Work e uma das 10 empresas que mais crescem no país há 3 anos consecutivos, segundo o Anuário Informática Hoje.
Quais são nossos valores?
Somos pessoas servindo pessoas
Pensamos e agimos como donos
Temos gana por performance
Crescemos e aprendemos juntos
Buscamos excelência e a simplicidade
Temos inovação e criatividade no nosso DNA
Todas as pessoas são bem-vindas independentemente de sua condição, deficiência, etnia, crença religiosa, orientação sexual, aparência, idade ou afins. Queremos que você cresça conosco em um ambiente acolhedor e repleto de oportunidades.