Site Reliability Engineer (SRE)

Quem somos?

Na Blue Digital, sabemos que cultura, produto e tecnologia devem ser vetores de uma estratégia digital de sucesso e acreditamos que nossa experiência traz a segurança que pessoas e empresas precisam para trilhar o caminho da jornada digital.

Como SRE da Blue Digital, você fará parte de um time de cloud focado em automação e provisionamento de produtos digitais, onde será protagonista na implementação da cultura DevOps em todos os nossos clientes.

Quem procuramos?

Pessoas com vivência como SRE interessadas pelo estudo e implementação de todo tipo de tecnologia para múltiplos produtos digitais para entregar a melhor experiência aos nossos clientes. Queremos sempre trabalhar com pessoas colaborativas, que se sintam bem com autogestão (devem ter experiência nesse ponto) e prezamos muito pela transparência nas nossas relações, seriedade, serenidade e eficiência para focar nos resultados e soluções.

  • Seu background pode ser como system administrator ou como software engineer;
  • Comportamento e posicionamento consultivo;
  • Gosta de aprender e ensinar, transmitir conhecimento;
  • Tem paixão pelo que faz, gosta de colocar a mão na massa;
  • Pensa sempre na solução mais eficiente e adequada para o cliente, situação, expectativa de tempo e budget;
  • Usa a criatividade para alcançar o item acima;
  • É data-driven equilibrando sempre performance e observabilidade;
  • Tem responsabilidade com sua autonomia e sensibilidade para alinhamento de expectativas.

De quais habilidades precisamos?

  • Entedimento conceitual e prático sobre nuvens tanto para produtos cloud native quanto para produtos cloud newcomers;
  • Topologia e implantação de redes em nuvem, arquitetura de solução;
    • Conhecimento sobre patterns e implementações para computação distribuída, escalabilidade e right sizing.
  • Conhecimento nas plataformas: VMs e containers (Linux), serviços IaaS, PaaS e SaaS para soluções de tecnologia;
  • Observabilidade: entendimento conceitual e prático sobre monitoração, logging, alerting e tracing;
    • Tanto na administração e implantação de plataformas cloud native;
    • Quanto na instrumentação de aplicações e sistemas.
  • Abordagem moderna sobre infraestrutura com infrastructure as code, automações e infraestrutura imutável;
  • Desenvolvimento se dividem em duas categorias:
    • Conhecimento e prática de scripting;
    • ALM com implementação de práticas de confiabilidade para CI e CD.
  • Conhecimento sobre segurança e boas práticas de governança em nuvem;
  • Processos que habilitem equipes de produtos digitais promovendo o co-ownership.

Quais são as competências?

  • Sobre nuvem: experiência de 3 a 4 anos ou mais com um ou mais dos major cloud providers (AWS, Azure ou GCP);
  • Sobre redes e solução: experiência de 2 a 3 anos ou mais com administração, implantação e planejamento;
    • De redes em nuvem e/ou datacenter;
    • De arquitetura de solução;
  • Sobre plataformas: experiência de 3 a 4 anos ou mais com administração, implantação e automação;
    • IaaS das nuvens: EC2, VMs;
    • PaaS como Kubernetes tanto gerenciado como self hosted;
    • PaaS para containers como ECS, App Engine, App Service e/ou serverless;
    • SaaS em geral para soluções em nuvem.
  • Sobre observabilidade: experiência de 3 a 4 anos com administração, implantação e automação;
    • Soluções de logging com algumas das plataformas: Elasticsearch, Logstash, Fluentd, Graylog;
    • Solução de tracing como Jaeger e/ou Zipkin (é bem legal se entender de OpenTelemetry);
    • Visão de performance e confiabilidade: APM e plataforma de métricas como Prometheus e/ou Netdata;
    • Exploração e visualização de dados com Kibana ou Grafana ou semelhantes;
    • Soluções de alerting como o Alertmanager;
    • Infraestrutura com alguma das soluções: Rancher, Zabbix ou Nagios;
  • Sobre infraestrutura e automação: experiência de 2 a 3 anos ou mais com administração, implantação e automação;
    • IaC com Terraform;
    • Automação com Ansible ou Puppet (vale também com linguagens de Shell);
    • É um plus experiência com metodologias de self-healing e automação de deployment.
  • Sobre desenvolvimento: no mínimo 1 ano;
    • No caso de scripting, experiência com uma linguagem de Shell (como Bash) e pelo menos uma das linguagens: Python, Golang, Ruby ou JavaScript (NodeJS);
    • No caso de ALM, experiência com Git, ferramentas, serviços e pipeline as code em CI (Jenkins, GitLab CI, Bitbucket Pipelines, Travis, GitHub Actions);
    • É um plus experiência com ferramentas de CD (ArgoCD, Spinnaker);
  • Sobre segurança e boas práticas: no mínimo 1 ano;
    • Twelve-Factor App;
    • Metodologias para enforcement de policy (tanto de segurança quanto organizacionais);
    • Testing para confiabilidade (análise de código, testes funcionais, não funcionais, de sistemas);
    • Gestão de recursos (tagging, custos em visão de FinOps);
    • Versionamento e armazenamento de artefatos;
    • Gestão de configuração e dados sensíveis (com alguma plataforma como Vault ou metodologia);

Como é nosso ambiente de trabalho

  • Extremamente colaborativo e transparente, todos contam uns com os outros;
  • Composto por pessoas de vários backgrounds;
  • Muito orientado a qualidade, eficiência e eficácia (parece difícil ter os dois, mas é o que fazemos pensando sempre em soluções positivas);
  • Aberto a novas discussões e novas tecnologias (ambas com embasamento);
  • Com bastante autonomia e responsabilidade tanto individual como de equipe;
  • Criativo e inovador ao mesmo tempo que sempre pensamos no melhor para cada cenário de cada cliente.

Se interessou ?

Responda esse formulário com link do LinkedIn, CV ou portfólio (se tiver o link do perfil no GitHub vamos gostar mais ainda) e seu contato para nos conhecermos!