Sobre a Paketá
A Paketá é uma empresa de crédito especializada em Crédito do Trabalhador, atuando na originação, estruturação e gestão de carteiras de crédito consignado privado. Somos hoje um dos principais players do segmento, com bilhões de reais sob gestão, múltiplos FIDCs ativos e um ritmo acelerado de crescimento em originação, base de clientes e investidores.
O Crédito do Trabalhador é uma das principais frentes de transformação do mercado de crédito no Brasil, combinando escala, impacto social e elevada complexidade operacional e regulatória. Trata-se de um produto com enorme potencial, desafios relevantes de controle, monitoramento e tomada de decisão em tempo real. Nosso desafio diário é crescer com disciplina, mantendo controle rigoroso de risco, liquidez e performance, em um ambiente de alto volume, múltiplos stakeholders e elevada responsabilidade fiduciária.
Em nosso negócio, capturamos em nossa plataforma centenas de milhares de tokens sobre diversas pessoas físicas e jurídicas todos os dias. É nesse contexto que buscamos um(a) Cientista de Dados Pleno para fortalecer nossa capacidade de análise e tomada de decisões baseadas em dados.
Missão da vaga
Ser o responsável por dados e modelagem da área de Crédito: garantir autonomia em SQL/extração, manutenção e evolução de modelos e motor de crédito, e desenvolvimento de análises avançadas (segmentação/clusterização, testes e novas oportunidades).
Principais responsabilidades (dia a dia)
- Explorar e consolidar dados (principalmente via SQL e Python) para gerar bases confiáveis de análises e modelos.
- Manutenção e evolução de modelos/motor de crédito (ex.: regras, score/risk tiers, precificação orientada a risco, cortes de elegibilidade).
- Testes e validações: backtests, monitoramento de performance (drift, estabilidade, acompanhamento de KPIs do modelo).
- Estudos de segmentação/clusterização e identificação de oportunidades (ex.: nichos com melhor retorno, risco por empregador/setor/UF, etc.).
- Enriquecimento de base e melhoria de features (internas/operacionais), com documentação e reprodutibilidade.
- Apoiar o Head e o Analista de Controle & Risco com análises sob demanda, garantindo consistência e rapidez.
Requisitos técnicos
- SQL forte (obrigatório): construir consultas complexas, joins, janelas (window functions), agregações e consistência de métricas (ideal: BigQuery).
- Python ou R (obrigatório): ETL analítico, validação, modelagem, automações e geração de outputs reproduzíveis.
- Estatística aplicada e fundamentos de ML (classificação, regressão, validação, métricas, overfitting, etc.).
- Experiência com modelos de gradient boosting ou similares (e.g. XGBoost, LightGBM).
- Organização e versionamento do trabalho (Git é desejável).
Diferenciais desejáveis
- Experiência com crédito (consignado/CDC), métricas de risco (Over, roll rate, vintage/MOB, PDD).
- MLOps “na medida”: monitoramento, rotinas agendadas, estrutura de retreino (mesmo que simples).
- Experiência com enriquecimento de dados via canais tradicionais (e.g. Serasa, BVS, etc.) e dados não tradicionais (e.g. dados de TelCos, redes sociais, etc.).
- Power BI para publicar outputs ou suportar camada analítica (não precisa ser foco principal).
Perfil comportamental
- Autonomia e responsabilidade por ponta a ponta (dados → modelo → validação → recomendação).
- Capacidade de gerar insights sobre os dados de forma independente e não supervisionada.
- Curiosidade sobre o negócio e capacidade de trazer sugestões sobre o negócio baseadas em dados, “conectando pontos” (negócio + dados).
- Comunicação clara: explicar modelo/resultado de forma simples para decisão.