open data y fair data

Open Data y FAIR Data: diferencias y similitudes

Open Data y FAIR Data son dos conceptos muy similares, ya que comparten una filosofía parecida a la hora de compartir los datos y potenciar la colaboración entre usuarios, pero no son exactamente iguales. En este artículo te contamos en qué consisten estos dos tipos de datos, en qué se parecen y en qué se diferencian.

La información se ha convertido en uno de los recursos básicos de la sociedad. Según el informe de The Software Alliance, el 90% de los líderes de negocios aseguran que los datos son uno de sus recursos claves, junto a la mano de obra y el capital, y también un factor distintivo fundamental para sus empresas.

No todas las forma de presentar los datos son iguales y poco a poco van surgiendo nuevas tipologías para identificarlas con nuevos propósitos. Open Data, FAIR Data, Linked Data, Linked Open Data… Estas son sólo algunas de las terminologías. En ocasiones, es difícil diferenciarlas entre sí, sobre todo cuando los conceptos son muy similares como es el caso entre Open Data y FAIR Data, que vamos a explicar a continuación.

¿Qué diferencia hay entre Open Data y FAIR Data?

El concepto de Open Data (Datos Abiertos) está más extendido que el de FAIR Data, por eso puede ser necesario hacer una diferenciación clara entre ambos. A pesar de que tienen algunas similitudes, no son exactamente lo mismo ni tienen la misma audiencia.

La definición de FAIR Data viene incluida en su propio nombre, ya que son las siglas de Findable (del inglés, que se puede encontrar), Accesible, Interoperable y Reusable, solo que como se verá no están siempre disponibles para cualquiera. Por otro lado, Open Data, según la definición del Open Data Handbook, son “datos que pueden ser utilizados, reutilizados y redistribuidos libremente por cualquier persona, y que se encuentran sujetos, cuando más, al requerimiento de atribución y de compartirse de la misma manera en que aparecen”.

Como puede verse, la principal diferencia es el acceso a dichos datos. Aunque en las siglas de FAIR encontremos el término accesible, éste se refiere a que sea accesible por las personas definidas, en el momento definido y por el método definido.

Como último apunte entre ambos conceptos, FAIR Data no tiene por qué ser Open. Por ejemplo, un conjunto de datos que cumple con esas características definitorias, pero que sólo sea accesible por el grupo de investigadores que está trabajando con ellos (por lo tanto, no son abiertos). El lema de FAIR Data deja bastante clara esta diferencia: “tan abierto como sea posible, tan cerrado como sea necesario”.

El caso contrario también es perfectamente posible: no todo el Open Data tiene por qué ser FAIR. Por ejemplo, un conjunto de datos con licencia abierta archivado en un repositorio sin curar y que no se puede encontrar.

Una vez establecidas las diferencias más claras, vamos a ver en profundidad cuáles son las principales características y objetivos de estos diferentes datos.

Con el paso del tiempo, los Datos Abiertos se extenderán a otros aspectos de la sociedad.

FAIR Data, en favor de la investigación científica abierta

FAIR Data nace en el contexto de la comunidad científica, la cual se beneficia de la cooperación y de compartir datos e información de los resultados de las investigaciones. Esto es lo que se conoce como Open Science, la cual fomenta que los datos obtenidos sean de acceso público, especialmente aquellos producidos gracias a fondos públicos.

A partir de esta necesidad, la revista especializada Scientific Data de Nature publicó en 2016 el artículo “Principios FAIR para el manejo y la administración de datos científicos”, en el cual se detallan cómo deben ser este tipo de datos y qué características deben tener obligatoriamente.

  • Findable: se trata del primer paso para que la reutilización de los datos, que es encontrarlos. Los metadatos son absolutamente necesarios para que puedan ser leídos por las máquinas y encontrados por los humanos. Por eso, deben tener asignados un identificador único y persistente, con una descripción correcta y abundante.
  • Accesible: una vez el dato haya sido encontrado por el usuario, debe saber cómo puede acceder a él, posiblemente a través de un proceso de autenticación y autorización. Los protocolos de comunicación deben ser abiertos, gratuitos e implementados universalmente.
  • Interoperable: los datos necesitan ser integrados no sólo con otros datos, sino también con aplicaciones o flujos de trabajo para su análisis, almacenamiento y procesamiento. Por eso, tanto los datos como los metadatos deben usar un lenguaje formal, accesible y compatible.
  • Reusable: todos los datos pueden ser reutilizados por otros investigadores. Con el propósito de optimizar esto, es importante dejar clara su procedencia y las condiciones de reutilización.

La utilidad del FAIR Data resultó tan grande que incluso la Unión Europea manifestó su interés en estos principios y los incorporó en el proyecto Programa Horizonte 2020 de Investigación e Innovación.

Open Data, en favor del acceso a todos los datos

Los datos abiertos no tienen un contexto de actuación restringido, pero su principal fuente son los gobiernos y las administraciones públicas, en favor de alcanzar la deseada transparencia hoy en día.

Para considerar que un dato es abierto, éste no debe tener ninguna limitación que prevenga a nadie de usarlo, combinarlo y compartirlo, incluso con fines comerciales. Por tanto los datos abiertos son ser libres de uso aunque se contempla la posibilidad de que su acceso, en algunos casos, no sea necesariamente gratuito, ya que crear, mantener y publicar los datos conlleva un coste.

Una parte destacable sobre los datos abiertos, más allá de su contribución a la transparencia, son sus posibilidades de reutilización y cómo ésto pueda afectar positivamente a la economía local. El informe anual la Asociación Multisectorial de la Información (ASEDIE) destaca que las empresas que “utilizan datos públicos y privados para crear productos y servicios de valor añadido para la sociedad” facturaron 1.720€ millones en 2016, con un crecimiento del 2% con respecto al año anterior.

Muchas administraciones locales y regionales en España tienen en cuenta el potencial de la reutilización de los datos abiertos entre los ciudadanos. La Ordenanza de Transparencia de la Ciudad de Madrid busca fomentar el uso de “formatos estándar, de uso libre y abiertos”. El plan de Gobierno Abierto de la Generalitat de Catalunya cuenta con quince acciones con el objetivo de acercar los datos abiertos a la ciudadanía y también fomentar su uso.

A pesar de sus diferencias, FAIR Data y Open Data dejan clara la importancia que tienen en la actualidad compartir datos, información y su acceso, permitiendo la colaboración y ahorro de costes y tiempos entre científicos o entre otras comunidades de usuarios y posibles reutilizadores.

Compartir entrada

Share on facebook
Share on google
Share on twitter
Share on linkedin
Share on pinterest
Share on print
Share on email