
Belo Horizonte - MG
0 posições
Desenvolver e evoluir soluções de Ciência de Dados e IA Generativa, com foco em LLMs, aplicando abordagens como prompt engineering, RAG e fine-tuning quando necessário;
Atuar no desenho e implementação de pipelines de dados ponta a ponta, desde a ingestão até a disponibilização para consumo;
Trabalhar com AWS (especialmente AWS Bedrock) e Databricks, garantindo escalabilidade, performance e governança;
Construir, versionar e expor modelos via APIs (FastAPI), com preocupação com segurança e observabilidade;
Atuar de forma colaborativa com engenharia de dados, DevOps e stakeholders do cliente;
Participar de reuniões, alinhamentos técnicos e apresentações, explicando soluções de forma clara e objetiva;
Garantir boas práticas de CI/CD, versionamento de código e automação no ciclo de vida dos modelos;
Apoiar decisões técnicas considerando custo, desempenho, riscos e valor para o negócio.
Experiência sólida como Cientista de Dados Sênior (ou perfil muito próximo a sênior);
Experiência prática com LLMs e IA Generativa, incluindo:
Prompt engineering;
RAG (Retrieval-Augmented Generation);
Fine-tuning de modelos (open-source ou serviços gerenciados);
Conhecimento consistente em NLP, embeddings e modelos de Deep Learning;
Domínio em Python e fundamentos sólidos de Machine Learning supervisionado e não supervisionado;
Experiência com AWS (serviços de dados e/ou IA) e Databricks;
Conhecimento prático em CI/CD e versionamento com Git (GitHub/GitLab);
Noções de Infraestrutura como Código (Terraform, CloudFormation ou similar);
Capacidade de comunicação clara, especialmente em ambientes com contato direto com o cliente.
Experiência com AWS Bedrock;
Vivência com MLOps (monitoramento, versionamento e deploy de modelos);
Experiência com bancos de dados vetoriais (FAISS, Pinecone, Weaviate, ChromaDB);
Conhecimento em Docker e Kubernetes;
Experiência prévia em consultorias ou projetos com clientes enterprise;
Vivência em ambientes multicloud (AWS, GCP, Azure).