Please enable JavaScript.
Coggle requires JavaScript to display documents.
CRISP-DM, 1_hcyFS7bnLbg2tmthUnLuVQ - Coggle Diagram
CRISP-DM
Entendimento do Negócio
Esta fase inicial estabelece os alicerces do projeto, onde se traduzem necessidades empresariais em objetivos analíticos.
Por exemplo, uma empresa de e-commerce pode definir como meta "reduzir o churn de clientes em 15% nos próximos trimestres". Aqui, identificam-se stakeholders, critérios de sucesso e restrições orçamentárias.
Um caso real é a Amazon usando esta fase para priorizar seu sistema de recomendações, alinhando-o com a estratégia de aumentar o valor médio do carrinho.
Entendimento dos Dados
Nesta etapa, os cientistas de dados catalogam e exploram os dados disponíveis. Para o caso do e-commerce, isso incluiria análise da base de clientes, registros de transações e logs de navegação. Ferramentas como Pandas Profiling ou Tableau ajudam a identificar padrões iniciais, como a correlação entre frequência de visitas e probabilidade de churn.
Preparação dos Dados
Considerada a fase mais trabalhosa (consumindo ~60% do tempo do projeto), envolve limpeza, transformação e engenharia de features.
A Uber utiliza técnicas avançadas nessa fase para processar bilhões de registros de GPS, convertendo trajetórias brutas em features como "velocidade média por trecho".
Modelagem
Aqui selecionam-se e treinam algoritmos preditivos. Para prever churn, testar-se-iam modelos como XGBoost (para dados tabulares) ou redes neurais (para dados sequenciais). É crucial realizar validação cruzada e ajuste de hiperparâmetros para evitar overfitting, usando ferramentas como Optuna ou MLflow.
O Spotify emprega ensembles nesta fase, combinando saídas de diferentes modelos para recomendar playlists.
Avaliação
Os modelos são testados contra métricas de negócio definidas na fase 1. No e-commerce, validaria-se se o modelo de churn atinge pelo menos 85% de recall (para capturar a maioria dos clientes em risco), sem muitos falsos positivos. .
Casos reais incluem bancos como o Nubank que realizam testes A/B com modelos em shadow mode antes da implantação total. Esta fase também verifica se os resultados atendem a requisitos éticos e regulatórios
-
-