Haga click para descargar y leer el informe.
Resumen ejecutivo
El concepto de calidad es definido por Deming [English 1998] como cero defectos o menos variaciones, y se basa en el control estadístico del proceso como la técnica esencial para la solución de problemas. La búsqueda de la calidad se traduce en costos más bajos, mayor productividad y el éxito en el plano competitivo.
Los conceptos sobre la calidad total y los principios de la buena administración de la calidad existen desde hace algún tiempo, pero se les suele considerar como conceptos separados y a veces se llega a pensar que no están relacionados entre sí. Estos conceptos por lo general no suelen ser aplicados a la generalidad del desarrollo de sistemas pues, si bien a veces se habla de la calidad del software, casi nunca se especifican aspectos sobre la calidad de los datos.
Aunque son tres las características que sustentan y facilitan la buena marcha de una empresa: plazo, costo y calidad. Tradicionalmente sólo las dos primeras han sido objeto de atención prioritaria por parte de la gerencia y sólo en ellas se han realizado esfuerzos e implantación de técnicas de uso generalizado que permiten su medición. De la misma forma, es poco lo que se conoce en cuanto a las técnicas, metodologías y herramientas que existen para la calidad de los datos. Esto resulta paradójico, si se considera que muchas veces los datos o la información son la herramienta principal de trabajo para las organizaciones, tanto en sus aspectos de control operativo, como en los de orientación táctica o estratégica.
El principal papel que desempeñan hoy los sistemas de información es presentar una vista del mundo real para las personas en una organización, quienes crean productos o toman decisiones. Si estas vistas no coinciden sustancialmente con el mundo real por algún motivo o período extendido de tiempo, entonces los sistemas son parcialmente inconsistentes o no son lo suficientemente completos y por ende los datos que pueden extraerse para la toma de decisiones corren el riesgo de no aportar información de gran valor. Peor aún, la información podría conducir a la toma de decisiones desacertadas o producir errores operativos.
Obtener la calidad de datos para un sistema representa una de las muchas consideraciones que se deben manejar en cuanto al diseño, desarrollo, operación y evolución de un sistema. Los sistemas de información deben diseñarse de manera que propicien el manejar datos de calidad. Este es probablemente el punto más importante de tratar cuando se lleva a cabo la implementación de un sistema, pero es a menudo el menos atendido. Por lo general, las iniciativas para asegurar la calidad de los datos se dan poco o quizás se ven obstaculizadas por la falta de presupuesto. De cualquier forma, la inconsistencia o la pobre calidad de los datos puede tener un dramático impacto en los sistemas de información ejecutivos y operacionales.
Las organizaciones frecuentemente toman decisiones con base en los datos diarios. Muchas veces la búsqueda de estos datos en los sistemas puede dar como resultado datos inconsistentes. La inconsistencia ocurre porque los datos en los sistemas operacionales a menudo son elementos replicados, es decir, están en varios sistemas y su significado debería ser el mismo. Los elementos de datos algunas veces tienen nombres que no corresponden a la realidad, es decir, son definidos impropiamente. En otras ocasiones, la falta de documentación de las reglas de transformación hacen más difícil la eliminación de las inconsistencias. También hay inconsistencias originadas en: mal diseño de datos (redundancia innecesaria, desnormalización sin control), no hacer valer reglas de integridad, falta de validación en el ingreso o actualización, etc.
La finalidad de este informe es proporcionar un panorama general de los conceptos sobre la calidad de los datos, así como también brindar algunos lineamientos que puedan servir para solucionar los problemas relacionados con la pobre calidad de estos. La intención es concienciar a los gerentes, personal usuario y personal de técnico de la importancia de mantener un nivel alto en la calidad de los datos.
De la autora
Lilia Esther Muñoz Arracera es Ingeniera en Sistemas Computacionales de la Universidad Tecnológica de Panamá y M.Sc. en Computación (Sistemas de Información) del Instituto Tecnológico de Costa Rica. Actualmente es profesora e investigadora de Ingeniería en Sistemas Computacionales de la Universidad Tecnológica de Panamá, Sede Regional de Chiriquí (David). Su investigación se concentra alrededor de las bases de datos y los sistemas de información, particularmente los depósitos de datos y el apoyo a la toma de decisiones.
Consejo Editorial
La revisión editorial de este informe estuvo a cargo del Ing. Franco Quirós (Infotec) y del Ing. Ignacio Trejos (Club de Investigación Tecnológica).
Agradecimientos
Se agradecen los comentarios y observaciones aportados por los profesores Franco Quirós e Ignacio Trejos, así como las facilidades brindadas por la Biblioteca del Instituto Tecnológico de Costa Rica.
Descargue aquí el Informe Nº 28: Calidad de los datos: Un enfoque conceptual