Estamos em busca de um Cientista de Dados Sênior que será responsável por liderar a construção de modelos estatísticos e de machine learning.
Requisitos:
Graduação em Ciência da Computação, Engenharia de Computação, Estatística, Matemática ou áreas relacionadas;
Fundamental experiência em projetos de visão computacional;
Conhecimentos em Cloud Azure Databricks;
Conhecimentos do processo de construção de modelos;
Análise Descritiva e Exploratória de Dados;
Teste de Hipóteses Inferência Clássica e Bayesiana;
Construção de modelos Estatísticos de Machine Learning;
Análise de Diagnósticos;
Fortes Conhecimentos de Python/R | Spark;
Experiência com análise de dados para descobrir padrões ocultos;
Conhecimento em ferramentas de visualização de dados;
Experiência com análise e resolução de problemas relacionados a dados;
Experiência com programação em Python e seu ecossistema de análise de dados (Pandas, Scikit-Learn e Numpy);
Experiência com extração e análise de banco de dados (SQL);
Experiência com limpeza e transformação de dados (Feature Engineering);
Experiência com Algoritmos de Regressão, Classificação e Clustering;
Experiência com Reinforcement Learning e Association Rules Learning;
Experiência com Neural Networks – Supervised and Unsupervised Learning.
Atividades:
Foco no desenvolvimento de soluções, atuando na definição do problema até a entrega de modelos explicáveis e de impacto direto no negócio;
Realizar análises descritivas e exploratórias para entendimento de dados e levantamento de hipóteses técnicas;
Desenvolver modelagem preditiva utilizando o estado da arte em Machine Learning e as métricas adequadas para seleção de modelos;
Validar tecnicamente a utilização dos modelos preditivos;
Desenvolver certificação prática do desempenho dos modelos (teste A/B, controle/intervenção, planejamento e experimentos);
Colaborar com o time de Estatísticos, Engenheiros em Machine Learning, Economistas para resolver problemas usando Data Science;
Validação de estruturas de dados e Feature Engineering;
Trabalhar com o time de Engenheiros de Dados e Arquitetos de Dados na criação de Datasets para treinamento de múltiplos modelos;
Coletar, limpar, armazenar, organizar, integrar dados e ajudar na criação de pipelines de dados;
Auxiliar na expansão do uso da ciência de dados nas frentes dos negócios.
Obs: Necessário disponibilidade de atuação híbrida em São Paulo - SP.