8 principios datos abiertos

Los 8 principios básicos de los Datos Abiertos

El concepto de datos abiertos está tan en boga y se emplea en tantos entornos que muchas veces lleva a confusión, catalogando como tales a aquellos que realmente no lo son. Por ello se hace más que necesario recordar una serie de 8 pautas que caracterizan a este tipo de información y de las que hablamos en este artículo.

Resultaría extraño encontrar a alguien que no haya oído hablar a estas alturas de los datos abiertos, así como de conceptos relacionados, como Linked Open Data. Su influencia alcanza un amplio espectro de ámbitos, desde administrativos y de gobierno hasta muchas esferas del sector privado.

Esta expansión de los datos abiertos, como ocurre con tantos otros aspectos, hace que llegue a distorsionarse su definición, publicándose con la etiqueta de abiertos datos que no cumplen con los requisitos establecidos para ello. ¿Cuáles son estas exigencias? Las describimos a continuación.

¿Cómo comenzó todo?

Para conocer el origen de las exigencias a los datos abiertos tenemos que remontarnos a diciembre de 2007 y trasladarnos a Sebastopol, en California. Fue entonces cuando durante una reunión del Grupo de Trabajo de Gobierno Abierto vieron la luz los 8 pilares fundamentales que sustentan el concepto de datos abiertos.

¿Por qué era tan importante definir qué son los datos abiertos? Además de la confusión conceptual que hemos explicado anteriormente, debemos hacer hincapié en la importancia que tienen estos datos para la evolución de la democracia y de la sociedad en general.

Esta información puesta a disposición de la ciudadanía gracias al auge de internet permite que todos podamos participar de forma activa en la gobernanza y, además, permite a terceros reutilizar esos datos para desarrollar todo tipo de herramientas con las que conseguir un beneficio económico y/o proporcionar una integración de los mismos en servicios inexistentes hasta ese momento y, con una visión global, contribuye a una sociedad más avanzada.

Pero eso no es todo, guiándose por estos 8 principios para los datos abiertos, administraciones de todo el mundo y a todos los niveles (municipal, provincial, autonómico o estatal) son más eficaces y más transparentes.

¿Cuáles son los 8 principios básicos de los datos abiertos?

Una vez que nos hemos situado respecto a su necesidad y sus aplicaciones, pasemos a analizar en profundidad las premisas que, si se cumplen, permiten denominar a unos datos con la categoría de abiertos.

1.- Completos

Todos los datos públicos se ponen a disposición. Los datos públicos son datos que no están sujetos a limitaciones de privacidad, seguridad o privilegios válidos.

Con esta condición que exhorta a que toda la información que producen o colectan los gobiernos esté disponible para toda la población, se tiene la intención de que esta pueda tomar las mejores decisiones para el bien general y/o reutilizarlos en interés propio o de terceros.

Esta disponibilidad dará lugar a una evolución en múltiples facetas sociales, como puede ser el caso de las Smart Cities.

Además, podemos decir que cada uno de nosotros tenemos pleno derecho a conocer y reutilizar el contenido de los datos que contienen los gobiernos, puesto que hemos pagado por ellos a través de nuestros impuestos.

Uno de los principales impedimentos con los que podemos topar a la hora de aplicar este primer principio, es el hecho de que mucha de esta información gubernamental aún no se ha digitalizado. Por tanto, esta conversión a formato electrónico reutilizable es apremiante para las administraciones que estén más rezagadas en este sentido.

2.- Primarios

Los datos se recogen en la fuente, con el más alto nivel de granularidad, no hay agregaciones o modificaciones.

Este principio exige que para que los datos abiertos sean tales, deben adoptar tres cualidades ineludibles:

  • Nivel alto de detalle.
  • Vírgenes, es decir, no deben haber sufrido ninguna criba ni tratamiento previo. Deben presentarse exactamente igual que como surgieron de la fuente primitiva.
  • Puede comprobarse su origen y las referencias que contienen, de forma que cualquiera pueda verificar su validez.

Entendemos que este principio basa su razón en la objetividad y transparencia, y que gracias a esta segunda condición se facilita que el reutilizador de esta información pueda procesar los datos no “cocinados” según mejor le convenga.

3.- Oportunos

Los datos se pondrán a disposición tan pronto como sea necesario para preservar el valor de los datos.

Alguna información solamente tiene valor durante un tiempo determinado, por este motivo hay que publicarla cuanto antes y mantenerla actualizada periódicamente. Por supuesto, si estos datos se brindan en tiempo real, estaremos ante una situación óptima.

Por esta razón, en OGoov se ha desarrollado el módulo Real Time Open Data (RTOD), un middleware que permite el acceso en tiempo real a contenidos proporcionados por diferentes fuentes de forma automatizada, incorporándolos en varios formatos al catálogo de datos abiertos de la organización.

La cantidad de datos abiertos en tiempo real no es todo lo abundante que debería, siendo esta una mejora a tener en cuenta, tal y como indica el Informe sobre madurez de los Datos Abiertos en la Unión Europea.

Principios de los datos abiertos

4.- Accesibles

Los datos están disponibles para la gama más amplia de usuarios con la más amplia gama de propósitos.

Es fundamental que los datos abiertos puedan ser consultados por todos los ciudadanos, implicando esto a personas con algún tipo de discapacidad.

Pero eso no es todo, la información referente a Open Data debe ser interoperable, o lo que es lo mismo, debe poder ser accesible independientemente del software y el hardware con el que se acceda a ella. Para alcanzar esta meta, debe publicarse con los estándares y protocolos actuales que marca la industria, a la vez que en formatos alternativos cuando así se requiera para la reutilización.

Los datos no son accesibles si sólo pueden obtenerse a través de un formulario web o si las herramientas automatizadas no pueden acceder a los mismos debido a un archivo robots.txt, o cualquier otra política o restricción tecnológica.

5.- Procesables por máquinas

Los datos se estructuran razonablemente para permitir el procesamiento automatizado.

Al publicar datos siempre debemos incluir formatos cuya codificación permita el procesado automático. Estos formatos deben estar adecuadamente documentados y aclarados.

Esto significa que debe evitarse la publicación de datos en formatos no estructurados, como textos libres, archivos PDF o aquellos de carácter gráfico, como JPG o PNG, y si estos se exponen deberían estar acompañados versiones en formatos estructurados (CSV, XML, JSON, RDF, etc.).

6.- No discriminatorios

Los datos están disponibles a cualquier persona, sin necesidad de registro.

Para que un conjunto de datos sea abierto, debe poder accederse a ellos sin necesidad de aportar ningún dato identificatorio, como podría ser un usuario y contraseña, entre otros métodos de autenticación. Esto se debe a que, mediante estas prácticas se está dificultando la distribución de contenido público.

Deben de ofrecerse todas las facilidades de acceso a los mismos sin necesidad de registro o autenticación tanto a través de interfaces web como de APIs públicas al efecto.

7.- No propietarios

Los datos están disponibles en un formato sobre el cual ninguna entidad tiene el control exclusivo.

Es necesario que los datos publicados lo estén en un formato abierto, para así facilitar su acceso gratuito a todos, así como su reutilización. Si se da la situación de que se cataloguen datos en formato propietario, estos mismos deberán tener su homólogo en un formato abierto.

Por tanto, tendrán prioridad los archivos con extensiones como CSV, XML, SVG, etc.

8.- Libres de licencia

Los datos no están sujetos a ningún derecho de autor, patentes, marcas o regulación. Se permiten restricciones razonables de privacidad y seguridad.

Para permitir la redistribución, reutilización y comercialización de estos datos, deben tener una licencia abierta como pueden ser la CC0, CC-BY, PDDL, ODC-BY, etc.

Esta condición excluye los impedimentos surgidos de los derechos de autor o de patentes. Por otro lado, esto no implica que no se deban tener en cuenta las políticas relacionadas con la privacidad de la información personal.

A través de portales de datos abiertos, como los desplegados usando la plataforma OGoov, las Administraciones Públicas pueden poner a disposición de la ciudadanía datos que dispongan de una licencia abierta que facilite la redistribución, reutilización y comercialización de los mismos.

¿Se cumplen estos principios?

Una vez que hemos dejado claro qué condiciones deben cumplir los datos abiertos para ser considerados como tales, es oportuno analizar hasta qué punto los países cumplen con ellas. Para ello nos será de gran utilidad el informe que analiza el nivel de madurez de las iniciativas de datos abiertos de la Unión Europea, que hemos mencionado anteriormente.

En este informe se evalúan 4 aspectos dentro de los datos abiertos, políticas, impacto, portales y calidad. Como media, los resultados obtenidos fueron:

  • Políticas: 82%.
  • Impacto: 50%.
  • Portales: 63%.
  • Calidad: 62%.

En lo que incumbe a España, esta se encuentra a la cabeza en cuanto a madurez de sus datos abiertos, siendo sus resultados: políticas (93%), impacto (97%), portales (78%) y calidad (78%).

De este informe podemos extraer que, aunque estamos inmersos en una tendencia positiva, el margen de mejora es amplio. Por ejemplo, hay conjuntos de datos que contienen errores en sus distribuciones, que son incompletos o están poco detallados. Esto imposibilita tanto a la ciudadanía como a reutilizadores hacer un uso práctico de ellos.

Desde OGoov ofrecemos soluciones para facilitar que los diferentes conjuntos de datos de los que disponen los organismos públicos y que deben estar a disposición de todos en portales y catálogos como los desplegados por nuestra plataforma, se ajusten a estas exigencias (y a la legislación española y europea) y que todo ello pueda ser implementado con un alto nivel de automatización y mínimo impacto sobre la organización que los publica.

De esta forma daremos un paso muy importante en un mayor aprovechamiento de una información de un valor incalculable para el progreso de la sociedad.

Compartir entrada

Share on facebook
Share on google
Share on twitter
Share on linkedin
Share on pinterest
Share on print
Share on email