Cientista de Dados

São Paulo - SP

1 posição

Sobre a Paketá

A Paketá é uma empresa de crédito especializada em Crédito do Trabalhador, atuando na originação, estruturação e gestão de carteiras de crédito consignado privado. Somos hoje um dos principais players do segmento, com bilhões de reais sob gestão, múltiplos FIDCs ativos e um ritmo acelerado de crescimento em originação, base de clientes e investidores.

O Crédito do Trabalhador é uma das principais frentes de transformação do mercado de crédito no Brasil, combinando escala, impacto social e elevada complexidade operacional e regulatória. Trata-se de um produto com enorme potencial, desafios relevantes de controle, monitoramento e tomada de decisão em tempo real. Nosso desafio diário é crescer com disciplina, mantendo controle rigoroso de risco, liquidez e performance, em um ambiente de alto volume, múltiplos stakeholders e elevada responsabilidade fiduciária.

Em nosso negócio, capturamos em nossa plataforma centenas de milhares de tokens sobre diversas pessoas físicas e jurídicas todos os dias. É nesse contexto que buscamos um(a) Cientista de Dados Pleno para fortalecer nossa capacidade de análise e tomada de decisões baseadas em dados.

Missão da vaga

Ser o responsável por dados e modelagem da área de Crédito: garantir autonomia em SQL/extração, manutenção e evolução de modelos e motor de crédito, e desenvolvimento de análises avançadas (segmentação/clusterização, testes e novas oportunidades).

Principais responsabilidades (dia a dia)

Explorar e consolidar dados (principalmente via SQL e Python) para gerar bases confiáveis de análises e modelos.
Manutenção e evolução de modelos/motor de crédito (ex.: regras, score/risk tiers, precificação orientada a risco, cortes de elegibilidade).
Testes e validações: backtests, monitoramento de performance (drift, estabilidade, acompanhamento de KPIs do modelo).
Estudos de segmentação/clusterização e identificação de oportunidades (ex.: nichos com melhor retorno, risco por empregador/setor/UF, etc.).
Enriquecimento de base e melhoria de features (internas/operacionais), com documentação e reprodutibilidade.
Apoiar o Head e o Analista de Controle & Risco com análises sob demanda, garantindo consistência e rapidez.

Requisitos técnicos

SQL forte (obrigatório): construir consultas complexas, joins, janelas (window functions), agregações e consistência de métricas (ideal: BigQuery).
Python ou R (obrigatório): ETL analítico, validação, modelagem, automações e geração de outputs reproduzíveis.
Estatística aplicada e fundamentos de ML (classificação, regressão, validação, métricas, overfitting, etc.).
Experiência com modelos de gradient boosting ou similares (e.g. XGBoost, LightGBM).
Organização e versionamento do trabalho (Git é desejável).

Diferenciais desejáveis

Experiência com crédito (consignado/CDC), métricas de risco (Over, roll rate, vintage/MOB, PDD).
MLOps “na medida”: monitoramento, rotinas agendadas, estrutura de retreino (mesmo que simples).
Experiência com enriquecimento de dados via canais tradicionais (e.g. Serasa, BVS, etc.) e dados não tradicionais (e.g. dados de TelCos, redes sociais, etc.).
Power BI para publicar outputs ou suportar camada analítica (não precisa ser foco principal).

Perfil comportamental

Autonomia e responsabilidade por ponta a ponta (dados → modelo → validação → recomendação).
Capacidade de gerar insights sobre os dados de forma independente e não supervisionada.
Curiosidade sobre o negócio e capacidade de trazer sugestões sobre o negócio baseadas em dados, “conectando pontos” (negócio + dados).
Comunicação clara: explicar modelo/resultado de forma simples para decisão.

Requisitos

Escolaridade

Graduação
Tecnólogo

Habilidade Técnica

SQL - Intermediário
Python - Intermediário

Como chegar

Itaim Bibi, São Paulo - SP, Brasil, 01451-010