SITE RELIABILITY ENGINEER



QUAL SERÁ A TUA PRINCIPAL MISSÃO?

Sou responsável por assegurar os bons níveis de observabilidade em ambientes e infraestruturas cloud, conhecendo o que medir e como fazê-lo e monitorizando a a adoção das melhores práticas a aplicar na área, em linha com a visão da Empresa Plataforma.


QUAIS SERÃO AS TUAS RESPONSABILIDADES?

  • Sou responsável pela definição, procedimentos e disseminação dos standards e boas práticas na área de ambientes e infraestruturas cloud;
  • Analiso métricas de sistemas operacionais e aplicações para apoiar no ajuste do seu desempenho e na deteção de falhas;
  • Participo na criação de sistemas e infraestruturas eficazes e que respondem às necessidades do negócio, utilizando a automação e identificando melhorias;
  • Defino todos os parâmetros que devem ser monitorizados no que toca à observabilidade;
  • Crio um sistema de monitorização e alarmística, que assegure a deteção e a informação imediata sobre situações anómalas, ou que excedam os thresholds definidos;
  • Intervenho diretamente em ambientes ou infraestruturas cloud para as quais esteja mandatado, sempre que tal se justifique e seja necessário;
  • Trabalho com as equipas de Desenvolvimento de forma a melhorar os ambientes e infraestruturas cloud, através de testes rigorosos e frequentes;
  • Apoio os utilizadores, fornecendo suporte e aprendizagem sempre que necessário, partilhando o meu conhecimento;
  • Sou o referente do perímetro técnico de SRE na LEROY MERLIN Portugal, mantendo estreito contacto e fazendo a ponte com as respetivas equipas homólogas do Grupo ADEO e/ou com outras comunidades de SRE existentes no seio de outras BU do Grupo;
  • Participo nos processos de design de sistemas, gestão de plataformas e planeamento de capacidade enquanto referente técnico.


O QUE PROCURAMOS EM TI?

  • Licenciatura em Ciências Digitais, Tecnologias da Informação ou similar;
  • Experiência profissional em áreas semelhantes de pelo menos 3 anos;
  • Experiência comercial em projetar, implementar e manter ambientes cloud em Docker, Kubernetes, GKE;
  • Experiência com ferramentas de infraestrutura como Terraform ou outras;
  • Experiência de ferramentas de construção/implementação de pipeline, como GitHub Actions, ou outras, explorando os  processos de integração e desenvolvimento contínuos (CI/CD);
  • Conhecimento profundo de automação e scripts utilizando ferramentas como PowerShell, AZ CLI, Python, Bash, Ruby, Groovy ou outro;
  • Conhecimento de tecnologias de gestão de configuração como DSC, Puppet, Chef, SaltStack, Ansible, ou outro;
  • Experiência com ferramentas de monitorização e vigilância que permitem medir disponibilidade, desempenho e segurança, além de proporcionar otimização de custos;
  • Fortes competências de comunicação e relacionamento interpessoal,
  • Bons conhecimentos de Inglês ou Francês.


Tens o que procuramos?