Calidad de Datos o Data Quality, si preferimos el término en inglés, es un concepto muy amplio del que se pueden encontrar tantas definiciones como autores han escrito sobre el tema. Se podría resumir como el arte -otros prefieren decir la ciencia- de mantener la información de las organizaciones completa, precisa, consistente, actualizada, única y, lo más importante, válida para el fin para el que se creó.

Calidad de Datos es un concepto reciente, surgió hace apenas 10 ó 12 años, aunque hoy en día forma parte de los conceptos fundamentales de un sistema gestor de bases de datos, como ya lo eran otros como la integridad o la seguridad.El interés creciente por el tema entre las organizaciones es debido a que, para una gran mayoría de las empresas, los datos constituyen su principal activo y, por otro lado, de todos es bien conocido que manejar datos que tienen mala calidad suele ser muy costoso en tiempo y en dinero, y, lo que es aún peor, puede llevar a los responsables de las compañías a tomar decisiones equivocadas.Todos estamos acostumbrados a que nos digan que la Calidad de los Datos de nuestros clientes influye en la imagen de la compañía. Esta imagen se verá beneficiada si tenemos unos datos correctos y se empobrecerá, en caso contrario.Asimismo, sabemos que una buena Calidad de los Datos permite potenciar las acciones de marketing y la gestión: se mejora el análisis de datos, se pueden hacer segmentaciones precisas y, en definitiva, contribuye a una mayor eficacia.El problema que se nos plantea es que estos conceptos son difíciles, por no decir imposibles, de estudiar en términos económicos, que es lo que realmente interesa a nuestras compañías.En estas condiciones, no es fácil proponer a la gerencia una inversión para mejorar la Calidad de nuestros Datos: ¿Cómo hago el cálculo de retorno de la inversión si, aún sabiendo el importe que me puede a costar el servicio, no tengo un cálculo económico de lo que me va a suponer en posibles ahorro de costes e incremento de los ingresos?Para ayudar a esta labor valga un pequeño cálculo:Por la experiencia de Deyde, una media del 2,87% de las direcciones en una BD de clientes son ilocalizables, un 1,25% de los nombres inidentificables y hay un 1,38% de duplicados.Si aplicamos estas medias sobre una BD de, por ejemplo, un millón de clientes, habría unos 55.000 registros inservibles para mailings y si hiciéramos un mailing sobre la totalidad de la BD que nos costase, por ejemplo, un euro por unidad, estaríamos “tirando” 55.000 euros.Un servicio típico de normalización y deduplicación, para esa BD, puede costar 50.000 euros. Si realizáramos este proceso, previo al mailing, ahorraríamos unos 4.000 euros, sobre la situación anterior.Además de este claro ahorro, no tendríamos que preocuparnos en cuantificar, en términos económicos, lo que significa para nuestra empresa la mejora de imagen, ni la potenciación de las acciones de marketing, ni la mayor eficacia en la gestión.