Giovane Carvalho.
Transformando informações complexas em decisões estratégicas e impacto real como Senior Data Scientist no Nubank.
Transforming complex information into strategic decisions and real-world impact as a Senior Data Scientist at Nubank.
ExperiênciaExperience
Senior Data Scientist
Nubank
- Liderança técnica em Marketing Science, colaborando no desenvolvimento e aplicação de metodologias avançadas como MMM (Marketing Mix Modeling), Geo-Tests e Causal Impact.
- Desenvolvimento de modelos de propensão para campanhas de re-marketing, otimizando a segmentação do público.
- Otimização de algoritmos de Séries Temporais Interrompidas utilizando Scala e SQL no Databricks, reduzindo falsos positivos e acelerando a velocidade de experimentação.
- Technical leadership in Marketing Science, collaborating in the development of advanced methodologies such as MMM (Marketing Mix Modeling), Geo-Tests, and Causal Impact.
- Development of propensity models for re-marketing campaigns, optimizing audience segmentation.
- Optimization of Interrupted Time Series algorithms utilizing Scala and SQL on Databricks, reducing false positives and accelerating experimentation speed.
Professor de Data Science
Preditiva Analytics
- Gestão de comunidade e resolução de dúvidas técnicas avançadas dos alunos.
- Condução de mentorias síncronas.
- Gravação e produção de conteúdo educacional completo, incluindo aulas e exercícios abrangendo SQL, Python, Análise de Dados e Machine Learning.
- Community management and resolution of advanced technical doubts from students across the platform.
- Conducting synchronous mentoring sessions.
- Recording and producing comprehensive educational content, including classes and exercises covering SQL, Python, Data Analytics, and Machine Learning.
Senior Data Scientist
Bosch Brasil
- Desenvolveu o PrognostiQ, um modelo de IA que prevê problemas de qualidade em fornecedores, melhorando a sensibilidade em 30% e vencendo o Prêmio Automotive Business 2024.
- Construiu o Text2SQL, um Agente de IA utilizando arquiteturas RAG e LLMs para permitir que Analistas de Compras executem consultas SQL complexas sobre dados de fornecedores via linguagem natural.
- Produziu o PVI (PUR Volume Inspector), fornecendo previsões abrangentes de volume de materiais para a equipe de compras, comparando o consumo histórico com negociações fechadas.
- Developed PrognostiQ, an AI model predicting quality issues in suppliers, which improved sensitivity by 30% and won the Automotive Business Award 2024.
- Built Text2SQL, an AI Agent utilizing RAG architectures and LLMs to allow Procurement Analysts to execute complex SQL queries over supplier data via natural language.
- Produced the PVI (PUR Volume Inspector), delivering comprehensive material volume forecasts to the procurement team comparing historical consumption against closed negotiations.
Especialista em Data Science & Analytics
Messer Gases Brasil
- Liderou o Centro de Excelência em Dados (COE) e desenvolveu a política de Governança de Dados da empresa.
- Implementou múltiplas soluções de ML: um modelo de Clusterização de Clientes, um sistema de recomendação de Cross-Sell gerando imenso ROI, e Previsão de entregas automatizada (+78% de precisão).
- Criou modelos de detecção de anomalias, reportando mais de 150 TBRL em redução de perdas.
- Venceu três Embrace Awards Brazil distintos nas categorias de Eficiência, Crescimento e Segurança.
- Spearheaded the Data Center of Excellence (COE) and developed the company's Data Governance policy based on DAMABOOK principles.
- Implemented Multiple ML Solutions: A Customer Clustering model optimizing logistics, a Cross-Sell recommendation system generating immense pipeline ROI, and automated delivery Forecasting (+78% accuracy).
- Created anomaly detection models for abnormal operations, reporting over 150 TBRL in loss reduction.
- Won three separate Embrace Awards Brazil across Efficiency, Growth, and Safety categories.
Formação & AcadêmicaEducation
UNICAMP
- Bacharelado em Engenharia Química (2016-2021).
- Especialização em Mineração de Dados Complexos e Aluno Especial em Aprendizado de Máquina e Reconhecimento de Padrões.
- Conduziu avançada Iniciação Científica (bolsa FAPESP) desenvolvendo código para cálculos de propriedades via simulações moleculares.
- Bachelor's Degree in Chemical Engineering (2016-2021).
- Specialization in Complex Data Mining and Special Student standing in Machine Learning & Pattern Recognition.
- Conducted advanced Scientific Research (FAPESP funded) developing code to calculate properties via molecular simulations of Lennard-Jones fluids.
Projetos em DestaqueFeatured Projects
Uma coleção de algoritmos, modelos e ferramentas construídas com paixão.A collection of algorithms, models, and analytical tools built with passion.
AI Assistant & Supervisor - InduTech
Arquitetura Multi-Agente: Sistema inteligente que utiliza LangGraph para roteamento supervisor-especialista. Implementação de RAG local ultra-rápida via FAISS, processando PDFs e Excel para respostas técnicas corretas, impulsionado pelo Gemini 1.5 Flash.
Multi-Agent Architecture: An intelligent system leveraging LangGraph for supervisor-to-specialist routing. Implements ultra-fast local RAG via FAISS, processing PDFs and Excel files for accurate technical answers, powered by Gemini 1.5 Flash.
B2W Review NLP Classification
Deep Learning & NLP: Extração de valor a partir de avaliações reais de consumidores. Aplicação desde algoritmos convencionais (Random Forest) até Fine-Tuning de Transformers avançados (Hugging Face BERTimbau) para classificação de sentimento (positivo/negativo), clusterização de 1 a 5 estrelas e categorização de assunto.
Deep Learning & NLP: Extracting value from real consumer reviews. Applied a range of methodologies from conventional algorithms (Random Forest) to advanced Transformer Fine-Tuning (Hugging Face BERTimbau) for sentiment classification, 1-5 star clustering, and subject categorization.
Danish Energy Time-Series Forecasting
Modelagem Preditiva Avançada: Previsão robusta de demanda energética integrando a API Pública da Energinet. Combinação de decomposição clássica SARIMA com algoritmos intensivos de Machine Learning (XGBoost), trackeados por MLFlow, atingindo redução massiva de 50% de erro (MAPE) sobre modelos base.
Advanced Predictive Modeling: Robust energy demand forecasting integrating Energinet's Public API. Combined classical SARIMA decomposition with intensive Machine Learning (XGBoost), tracked via MLFlow, achieving a massive 50% error reduction (MAPE) over baseline.
End-to-End ETL & Recommendation Engine
Full-Stack Data Science: Pipeline analítico de ponta a ponta. Automatizou Web Scraping (BeautifulSoup), carga ETL massiva em PostgreSQL via SQLAlchemy e desenvolveu um algoritmo de recomendação Content-Based (Cosine Similarity) implantado visualmente em um dashboard Power BI.
Full-Stack Data Science: Complete end-to-end analytical pipeline. Automated Web Scraping (BeautifulSoup), heavy ETL loading into PostgreSQL via SQLAlchemy, and developed a Content-Based recommendation algorithm (Cosine Similarity) visually deployed to a Power BI dashboard.
Conteúdos & LivesContents & Live Streams
Uma seleção de aulas e apresentações ao vivo que realizei cobrindo Ciência de Dados e IA.A selection of live classes and presentations I've given covering Data Science and AI.
Previsão de vendas para E-commerceSales Forecasting for E-commerce
Aprenda na prática a criar análises que geram valor, em um workshop feito para quem quer iniciar na área de dados do jeito certo.Learn in practice how to create value-generating analyses in a workshop designed for those starting in the data field the right way.
O que faz um Data Scientist no dia a diaWhat a Data Scientist Does Day-to-Day
Descubra como gerar de fato valor com dados e Inteligência Artificial nas empresas, analisando o trabalho real de um Cientista de Dados.Discover how to genuinely generate value with data and Artificial Intelligence in companies, analyzing the real work of a Data Scientist.
Uma Introdução a Séries TemporaisAn Introduction to Time Series
Mergulhe fundo nos conceitos de modelagem de séries temporais para realizar previsões de demanda robustas no mercado financeiro.Dive deep into time series modeling concepts to perform robust demand forecasting in the financial market.
Eleve sua Carreira com Dados e IAElevate Your Career with Data and AI
Estratégias vitais e dicas práticas focadas em elevar seu papel profissional como Especialista de Dados e Inteligência Artificial.Vital strategies and practical tips focused on elevating your professional role as a Data and Artificial Intelligence Specialist.
Correlação vs. CausalidadeCorrelation vs. Causation
Entenda definitivamente a diferença técnica e interpretativa entre correlação pareada e os impactos profundos da causalidade.Understand definitively the technical and interpretative difference between paired correlation and the profound impacts of causality.
Tabelas Dinâmicas e de FrequênciaPivot and Frequency Tables
Aprenda a realizar análises exploratórias ricas e criar tabelas de frequência altamente descritivas usando as abordagens corretas.Learn to conduct rich exploratory analyses and create highly descriptive frequency tables using the correct approaches.
MLOps na PráticaMLOps in Practice
Explore todas as etapas que transformam um modelo isolado de algoritmo de Machine Learning em uma arquitetura funcional com real entrega de valor (MLOps).Explore all the steps that transform an isolated Machine Learning algorithm model into a functional architecture with real value delivery (MLOps).