Por: Óscar Varela Sánchez
Responsable Territorial Galicia de DAMA España.
-
Acompañan a los archivos, documentos, tablas, están presentes en los diferentes catálogos web que visitamos, revelando información valiosa y de interés. Los metadatos están presentes en nuestras vidas, pero no son visibles a primera vista y en algunas ocasiones solemos ignorarlos.
Sabemos que están ahí, pero ¿Qué son los metadatos?
El concepto de metadatos proviene de la composición de dos palabras:
La palabra “meta”, que proviene del griego significa “después de, más allá de”.
Datos proviene del latín “datum” que significa “dato”. El significado de metadatos según la etimología sería “sobre datos”. Partiendo de esta base, la definición más común y extendida es la de: los metadatos son los datos sobre los datos.
Concepto Metadatos
Aunque el uso de los metadatos ha ido creciendo con la necesidad de catalogar información y el crecimiento digital de la sociedad así lo ha requerido, el concepto de metadato ya existía antes de lo que conocemos hoy en día. El término fue acuñado por Jack Myers en la década de los 60 para describir conjuntos de datos. La primera acepción que se le dio (y actualmente la más extendida) fue la de dato sobre el dato, ya que proporcionaban la información mínima necesaria para identificar un recurso de información.
En este mismo trabajo se menciona que se puede incluir información descriptiva sobre el contexto, calidad y condición o característica del dato. La evolución del término desde esta fecha hasta 1997 fue acuñada por Lange y Winkler.
Incidiendo en la definición básica del metadato, otros autores amplían el concepto de “datos sobre el dato” al afirmar que incluyen información sobre su contexto, contenido y control, así como todo lo que tenga que ver con el “dato”.
¿Por qué son tan importantes?
En el mundo digital de hoy en día está lleno de metadatos: en el correo, en las redes sociales, en las páginas web, en las bases de datos, en los productos de integración, …
Un ejemplo característico pueden ser los metadatos de las tablas de una base de datos: los comentarios, los atributos, estadísticas, los tipos de datos, la sensibilidad de los datos. Otro ejemplo más sencillo, los metadatos que tenemos en el mail: quién manda el mail, fecha y hora del envío…
Imagina que trabajas en una empresa de retail o alimentación y que pasa una gran cantidad de información por tus manos. Los metadatos nos pueden ofrecer datos de:
Productos: qué tipo de producto es, fecha de entrada en el almacén, el proveedor del producto, procedencia de este.
Proveedores: Productos asociados a cada proveedor, transacciones entre proveedor.
Clientes: Edad, gustos, hábitos de consumo, datos bancarios, sexo, edad
Los metadatos te ayudan a clasificar todos estos datos para luego poder analizarlos, consultarlos y utilizarlos en nuestro beneficio. ¿Qué nos aportan estos metadatos al negocio?
- Favorecen la búsqueda de la información, dado que disponemos de categorización y clasificación de los datos.
- Nos ayuda a la toma de decisiones, dado que podemos realizar un estudio más exhaustivo debido a la multitud de dimensiones por la que analizar la información.
Clasificación de los Metadatos:
Las clasificaciones de los metadatos obedecen o atienden a distintos aspectos: forma, funcionalidad, estructura, entidad que los origina, … De acuerdo con la naturaleza de los datos que describen, se clasifican en:
Descriptivos
Su función es la de describir e identificar los distintos recursos de información que nos permitan la búsqueda y recuperación.
Estructurales
Nos permiten identificar y describir las distintas partes que componen los recursos, así como las relaciones entre los mismos.
Administrativos
Su función primordial es la de gestionar todos aquellos aspectos inherentes a los recursos, en definitiva, gestionar el ciclo de vida de estos.
Cuando nos ceñimos al ámbito de la tecnología de la información, los metadatos se clasifican en:
De Negocio
Incluyen los aspectos no técnicos y las definiciones de los conceptos que se manejan en el mundo empresarial.
Artículo: Glosario de negocio del dato
Técnicos
Proporcionan información sobre los aspectos técnicos de los datos, los procesos que mueven los datos, el catálogo de bases de datos donde se almacenan, los modelos de datos, etc…
Operacionales
Describen los detalles del procesamiento y el acceso a los datos
Estándar para representar Metadatos
Las organizaciones intercambian multitud de datos entre ellas. Con el objetivo de entenderse en el proceso de integración surge ISO/IEC 11179 que es un estándar para el intercambio de datos impulsado por metadatos en entornos distribuidos y heterogéneos.
ISO/IEC 11179 es un estándar internacional para definir, representar metadatos y que nos permita el intercambio de datos haciendo que los datos sean comprensibles y se puedan compartir.
La estructura de la norma consta de siete partes:
- Marco ISO/IEC 11179-1:2015 (denominado ISO/IEC 11179-1)
- Clasificación ISO/IEC 11179-2:2005
- ISO/IEC 11179-3:2013 Modelo de registro y atributos básicos
- ISO/IEC 11179-4:2004 Formulación de definiciones de datos
- ISO/IEC 11179-5:2015 Principios de denominación e identificación
- Registro ISO/IEC 11179-6:2015
- ISO/IEC 11179-7:2019 Metamodelo para el registro del conjunto de datos
Fuentes de Metadatos
La creación de metadatos sin un objetivo claro no tiene mucho futuro. Deben ser creados como producto de un proceso y gestionados al igual que gestionamos los datos. Cuando hablamos de organizaciones data-driven, hablamos intrínsicamente de organizaciones metadata-driven, porque gestionan sus metadatos al igual que los datos y sin ellos, no somos capaces de dar contexto a los datos.
Algunas fuentes de metadatos que se puede enumerar son las siguientes:
- Glosario de Negocios
- Herramientas de BI
- Diccionario de Datos
- Herramientas de integración y movimiento de Datos
- Bases de Datos
- Herramientas de Calidad de Datos
- Mensajería de Eventos
- Herramientas de Modelados de Datos
- Servicios de Datos
Estrategia de Metadatos
Para una buena gestión de los metadatos, es necesario establecer una estrategia que describa como una organización pretende gestionar todo el conjunto de metadatos y su ciclo de vida, proporcionando un marco de referencia para todos los equipos de la organización.
Esta estrategia debe ir acompañada de una arquitectura de Metadatos, donde se especifique las distintas fuentes de metadatos existentes, la estrategia de actualización del repositorio o repositorios de metadatos o la búsqueda de estos por parte de los diferentes usuarios.
La arquitectura debe proporcionar un punto único de acceso a todo el conjunto de metadatos, de forma transparente a los diferentes entornos de las fuentes de metadatos por parte del usuario final.
Adicionalmente se debe dar una solución integrada de todas las fuentes de metadatos, donde la calidad de estos juega un papel clave. Para ello es vital la creación de un metamodelo, que represente las distintas entidades y relaciones existentes entre los diferentes tipos de metadatos para dar una visión global e integrada del todo el conjunto: negocio, técnicos y operativos.
Además de la calidad de los mismos, es preciso control de la seguridad de acceso a dichos metadatos, dado que parte de la información que se integra en el repositorio posee un cariz sensible y que una brecha de seguridad sobre los mismos, puede provocar una pérdida de reputación de la organización dado que podemos a disposición del intruso, todo el conjunto de metadatos y por ejemplo, poder identificar donde se almacenan los datos más sensibles de la compañía.
Tipos de Arquitectura de Metadatos
Arquitectura Centralizada
Una arquitectura centralizada consiste en la integración de todas las fuentes de metadatos, en un único repositorio.
Arquitectura distribuida
Una arquitectura distribuida, por el contrario, no integra todas las fuentes en un único repositorio, sino que existe un único punto de acceso a la información y desde aquí, en tiempo real, se consulta el metadato directamente en la fuente.
Arquitectura bidireccional
Una arquitectura bidireccional tiene las ventajas de los dos anteriores con el enfoque de que cuando se necesite un detalle especifico de la fuente, se dirija al origen del mismo y para datos más comunes, se acude al repositorio centralizado.
Herramientas
Actualmente existe multitud de herramientas en el mercado, que pueden ayudar a la gestión de los diferentes tipos de metadatos. Estos metadatos pueden introducirse manualmente o extraerse directamente de las diferentes fuentes a través de conectores específicos para las diferentes tecnologías.
A su vez, estas herramientas se suman como una nueva fuente de metadato que permitirá el intercambio de estos en la organización o a terceros.
Organización y cultura
La gestión de Metadatos no se considera una actividad primordial en la mayoría de las organizaciones. Pasar de un entorno en el cual no se gestionan los metadatos a otro que sí, se requiere compromiso y disciplina de todos los interesados y es por ello necesario establecer procesos de gobierno donde se pueda habilitar esta dinámica.
Se requiere que negocio y tecnología trabajen estrechamente colaborando en dichos procesos.
Conclusión
Cada vez las organizaciones necesitan gestionar una ingente cantidad de datos que son vitales para su progreso y evolución. Necesitamos una solución que permita agilidad en la consulta de la información que nos ayude a buscar y localizar los datos de una forma sencilla y efectiva agilizando el proceso de toma de decisiones, una mayor seguridad para proteger los datos sensibles para que el negocio pueda garantizar el cumplimiento de normativas y un análisis de impacto rápido y efectivo que nos permita agilizar la gestión del cambio.
Y es aquí donde la gestión de metadatos desempeña un papel clave y fundamental en la gestión de datos de las organizaciones.
Referencias
- DAMA-DMBOK
- El concepto de metadato – José A. Senso
- Red Nacional de Metadatos (Colombia)– Mónica L. Vera
- Datos.gob.es
- Iso.org