🎯 Objetivo del Proyecto
Este proyecto implementa un análisis avanzado de fuga de clientes utilizando técnicas de machine learning y análisis de variables fantasma (Ghost Variables). El objetivo es identificar y predecir qué clientes tienen mayor probabilidad de abandonar los servicios de una entidad financiera.
🚀 Características Principales
👻 Variables Fantasma
Implementación de técnicas avanzadas para evaluar la relevancia de variables en el modelo de predicción.
🤖 Machine Learning
Uso de Random Forest y otros algoritmos para predicción de fuga de clientes.
📊 Análisis Exploratorio
Visualizaciones y análisis estadísticos completos de los datos de clientes.
🔧 Pipeline Completo
Preprocesamiento de datos con limpieza y transformación automatizada.
📈 Evaluación Avanzada
Métricas y validaciones exhaustivas de los modelos de predicción.
🎨 Visualizaciones
Gráficos interactivos y análisis de correlaciones entre variables.
🛠️ Tecnologías Utilizadas
📊 Visualizaciones Generadas
Correlación Categórica
Análisis de relaciones entre variables categóricas
Correlación Completa
Matriz de correlación general del dataset
Correlación Continua
Relaciones entre variables numéricas
Correlación con Target
Variables más relacionadas con la fuga
📁 Estructura del Proyecto
- 📊 Data/ - Datos originales y procesados (Excel)
- 🖼️ Images/ - Visualizaciones generadas (PNG)
- 📈 cat_importances/ - Importancias de variables categóricas
- 📊 num_importances/ - Importancias de variables numéricas
- 👻 ghost_analysis_data/ - Resultados de variables fantasma
- 📓 Notebooks/ - Análisis completo en Jupyter
🚀 Cómo Usar el Proyecto
Instalación:
git clone https://github.com/alfa7g7/fuga-clientes-bc-v2-ghost-v.git
cd fuga-clientes-bc-v2-ghost-v
pip install -r requirements.txt
Ejecución:
1. Abre los notebooks en Jupyter o Google Colab
2. Ejecuta las celdas en orden
3. Explora los resultados y visualizaciones