São Paulo - SP

1 posição

Sobre a Paketá

A Paketá é uma empresa de crédito especializada em Crédito do Trabalhador, atuando na originação, estruturação e gestão de carteiras de crédito consignado privado. Somos hoje um dos principais players do segmento, com bilhões de reais sob gestão, múltiplos FIDCs ativos e um ritmo acelerado de crescimento em originação, base de clientes e investidores.

O Crédito do Trabalhador é uma das principais frentes de transformação do mercado de crédito no Brasil, combinando escala, impacto social e elevada complexidade operacional e regulatória. Trata-se de um produto com enorme potencial, desafios relevantes de controle, monitoramento e tomada de decisão em tempo real. Nosso desafio diário é crescer com disciplina, mantendo controle rigoroso de risco, liquidez e performance, em um ambiente de alto volume, múltiplos stakeholders e elevada responsabilidade fiduciária.

Em nosso negócio, capturamos em nossa plataforma centenas de milhares de tokens sobre diversas pessoas físicas e jurídicas todos os dias. É nesse contexto que buscamos um(a) Cientista de Dados Pleno para fortalecer nossa capacidade de análise e tomada de decisões baseadas em dados.

Missão da vaga

Ser o responsável por dados e modelagem da área de Crédito: garantir autonomia em SQL/extração, manutenção e evolução de modelos e motor de crédito, e desenvolvimento de análises avançadas (segmentação/clusterização, testes e novas oportunidades).

Principais responsabilidades (dia a dia)

  • Explorar e consolidar dados (principalmente via SQL e Python) para gerar bases confiáveis de análises e modelos.
  • Manutenção e evolução de modelos/motor de crédito (ex.: regras, score/risk tiers, precificação orientada a risco, cortes de elegibilidade).
  • Testes e validações: backtests, monitoramento de performance (drift, estabilidade, acompanhamento de KPIs do modelo).
  • Estudos de segmentação/clusterização e identificação de oportunidades (ex.: nichos com melhor retorno, risco por empregador/setor/UF, etc.).
  • Enriquecimento de base e melhoria de features (internas/operacionais), com documentação e reprodutibilidade.
  • Apoiar o Head e o Analista de Controle & Risco com análises sob demanda, garantindo consistência e rapidez.

Requisitos técnicos

  • SQL forte (obrigatório): construir consultas complexas, joins, janelas (window functions), agregações e consistência de métricas (ideal: BigQuery).
  • Python ou R (obrigatório): ETL analítico, validação, modelagem, automações e geração de outputs reproduzíveis.
  • Estatística aplicada e fundamentos de ML (classificação, regressão, validação, métricas, overfitting, etc.).
  • Experiência com modelos de gradient boosting ou similares (e.g. XGBoost, LightGBM).
  • Organização e versionamento do trabalho (Git é desejável).

Diferenciais desejáveis

  • Experiência com crédito (consignado/CDC), métricas de risco (Over, roll rate, vintage/MOB, PDD).
  • MLOps “na medida”: monitoramento, rotinas agendadas, estrutura de retreino (mesmo que simples).
  • Experiência com enriquecimento de dados via canais tradicionais (e.g. Serasa, BVS, etc.) e dados não tradicionais (e.g. dados de TelCos, redes sociais, etc.).
  • Power BI para publicar outputs ou suportar camada analítica (não precisa ser foco principal).

Perfil comportamental

  • Autonomia e responsabilidade por ponta a ponta (dados → modelo → validação → recomendação).
  • Capacidade de gerar insights sobre os dados de forma independente e não supervisionada.
  • Curiosidade sobre o negócio e capacidade de trazer sugestões sobre o negócio baseadas em dados, “conectando pontos” (negócio + dados).
  • Comunicação clara: explicar modelo/resultado de forma simples para decisão.

 

 

Requisitos

Escolaridade

  • Graduação
  • Tecnólogo

Habilidade Técnica

  • SQL - Intermediário
  • Python - Intermediário

Como chegar

Itaim Bibi, São Paulo - SP, Brasil, 01451-010