¿Qué es calidad de datos?
Según el DAMA (metodología en la que nos basamos); consiste en la planificación, la ejecución y el control de las actividades que aplican las técnicas de gestión de la calidad de los datos para garantizar que se ajustan a su finalidad y satisfacen las necesidades de los usuarios.
Fases
- Levantamiento de información
Definir la caracterización de los datos basados en la priorización de negocio para generar valor a la organización. Definir estándares y especificaciones para controles de calidad de datos como parte del ciclo de vida de los datos.
- Evaluar Calidad
Obtener una imagen completa del estado actual de la calidad de los datos de la organización.
- Definición e Implementación de mejoras
Definir e implementar mejoras que permitan a la organización realizar una corrección y prevención de sus datos actuales y eliminar la causa raíz para alcanzar el valor de negocio esperado.
- Monitoreo y Mantenimiento
Implementar herramientas que permitan a la operación gestionar y mantener los estándares de calidad de datos; monitorear el cumplimiento de los mismos e identificar nuevos problemas de calidad.
Caso de Éxito
Calidad de datos en el cliente XM, donde se han venido trabajando diferentes maestras de datos, aplicando reglas de calidad mediante la ejecución de consultas (Querys) a través de Python (en este proceso se utiliza nuestro framework de Antpy), guardando los resultados en un modelo de datos de SQL Server y visualizando dicha información en un tablero de Power BI, esto le ha permito al cliente tener un sistema base donde validar la madurez de sus datos en las distintas fuentes y poder tomar acciones correctivas sobres los datos donde se presenten mayores falencias.