Hoy comparto un proyecto muy interesante que he hecho en 2023 como parte de mi formación en OpenClassrooms (Licencia de Analista de Datos). En este proyecto, nos pusieron en una situación real como consultores de análisis de datos para la Organización Nacional de Lucha contra la Falsificación de Moneda (ONCFM). Nuestro objetivo era desarrollar un modelo que pudiera identificar automáticamente los billetes falsos de los auténticos.
Contexto del Proyecto
La organización «ONCFM» nos contrató para implementar un sistema de detección de billetes falsos basado en las dimensiones y características físicas de los billetes en euros. Este proyecto me dieron gran autonomía, había un propósito y teníamos que usar modelos predictivos, pero no mucho mas.
Preparación y Análisis de Datos
Al llegar, revisé el conjunto de datos proporcionado y noté algunas faltantes en los valores, lo cual es bastante común. Esto se llama análisis exploratorio de datos. Utilicé los consejos de mi mentor sobre usar regresión lineal para imputar estos valores, así que lo apliqué junto con otros métodos como KNN Imputer para comparar resultados.
Modelado y Resultados
Probé varios modelos para determinar cuál sería más eficaz en la detección de billetes falsos. Entre ellos, utilicé regresión logística y K-Means para clasificar los billetes.
Visualización de Resultados
Además, utilicé diversas técnicas de visualización para presentar los resultados y asegurarnos de que fueran comprensibles para todos los involucrados.
Código del Proyecto
Aquí está el código completo del proyecto, con comentarios en francés, ya que OpenClassRooms es un centro de formación en Francia, desde la preparación de datos hasta el modelado y la visualización de resultados:
Presentación del proyecto
Presentación del proyecto para la defensa de mi solución:
Conclusiones
Este proyecto ha sido una experiencia enriquecedora y me permitió aplicar técnicas avanzadas de análisis de datos para resolver un problema real y crítico. La clave del éxito fue la combinación de métodos estadísticos y de machine learning, junto con una buena preparación y limpieza de datos.
Si tienes alguna pregunta o necesitas más detalles sobre este proyecto, no dudes en contactarme. ¡Gracias por leer!
Juan Luis Acebal Rico
Analista y Científico de Datos
data@juanluisacebal.com
juanluisacebal.com
Deja una respuesta