Google y los datos abiertos

La apuesta de Google por los datos abiertos

Dentro del amplio espectro de recursos tecnológicos en los que trabaja Google, los datos abiertos se encuentran entre los prioritarios. ¿A qué se debe que Google les dedique especial atención? ¿Qué herramientas e iniciativas han puesto en marcha al respecto?

Disponer de datos de interés a libre disposición puede marcar la diferencia para que un proyecto salga adelante o para la mejora continua de las operaciones de una institución o empresa.

En Google tienen todo esto muy en cuenta, por lo que han desarrollado todo un ecosistema que gira en torno al concepto Open Data, ofreciendo una serie de recursos con un enorme potencial para todos los profesionales de los datos abiertos.

En este artículo hablaremos de los motivos que mueven a Google a trabajar en pro de los datos abiertos y cómo se está materializando este trabajo en diferentes proyectos y herramientas.

Los datos abiertos como soporte para el avance científico

Con anterioridad ya hemos hablado ampliamente de cómo los datos abiertos están transformando nuestra sociedad. Detrás de este proceso de cambio se suelen encontrar numerosas innovaciones científicas y tecnológicas.

La comunidad científica muestra un cada vez más claro interés por los datos abiertos, tal y como demuestran los resultados de la encuesta The State of Open Data Report 2019, de los que podemos extraer las siguientes conclusiones:

  • El 79% apoyan una iniciativa legal para que los resultados de investigaciones primarias sean abiertos.
  • El 67% piensa que se debería penalizar a quienes no compartan sus datos si el financiador lo ha ordenado así.
  • El 69% cree que la apertura de datos debe ser requisito obligatorio para acceder a subvenciones.
  • El 36% tiene el temor de que se haga un mal uso de sus datos si se procede a su apertura.

¿Qué papel juega Google en el mundo de los datos abiertos?

En Google están muy implicados con la apertura de datos. De hecho, muchos de sus proyectos relacionados con este ámbito están destinados a facilitar la vida de investigadores científicos y de trabajadores de empresas privadas y públicas en general.

Desde este gigante tecnológico se manifiesta una predisposición clara y activa respecto a lo que apertura de datos se refiere. Muestra de ello son los proyectos que vamos a comentar más adelante.

¿Por qué Google apuesta por los datos abiertos?

Según Google, existen 3 motivaciones claras que les llevan a impulsar acciones de Open Data. Estas son:

  • Marcan como uno de sus principales objetivos poner a disposición de todo el mundo información útil, accesible y gratuita.
  • Fomentar el avance científico más allá del propio Google. De esta manera, la comunidad investigadora obtiene un poderoso combustible para su trabajo en forma de datos de interés.
  • Hace que sus nuevos trabajadores ya conozcan las propias herramientas de Google, por lo que se reduce el período de adaptación y aprendizaje, siendo más productivos desde el primer momento.
Open Data y Google

Las herramientas de datos abiertos de Google

Esta clara apuesta de Google por los datos abiertos se materializa en una serie de soluciones y recursos tecnológicos útiles para el trabajo de los profesionales de Open Data y para el ciudadano en general. A continuación trataremos los más destacados.

Quizás, el recurso más popular es el buscador de conjuntos de datos de Google, con el que poder consultar información alojada en los diferentes datasets de este gigante tecnológico.

¿Qué opciones nos ofrece esta herramienta? Por una parte, presenta la posibilidad de filtrar los contenidos según su tipo. O sea, si son textos, gráficos, tablas de datos o de acceso gratuito, entre otros filtros.

Además, para facilitar su búsqueda, estos datos constan de metadatos que sirven para ampliar la información sobre el propio conjunto de datos. Metadatos en los que se puede reflejar información como la fecha de la última actualización, su origen, una breve descripción, autor, etc.

Pero esta no es la única forma en la que Google trabaja con aspectos relacionados con la apertura de datos.

El servicio en la nube de Google, Google Cloud, también muestra claramente su inclinación hacia los datos abiertos. Este servicio pone a disposición de sus usuarios más de un centenar de conjuntos de datos públicos de diferente índole y provenientes del almacén de datos BigQuery.

Estos datos en la nube están debidamente preparados para aplicarles procesos de aprendizaje automático, además, cuenta con funcionalidades específicas para información geoespacial, como las imágenes por satélite. Además, permiten su integración con herramientas como Data Studio, pudiendo así dar forma a informes muy visuales y atractivos.

Ya que hablamos de una representación visual de los datos, de forma que se permita una mejor comprensión de estos, debemos hacer mención a Google Public Data Explorer. Esta solución permite precisamente crear representaciones gráficas de datos ofrecidos por instituciones públicas y académicas como pueden ser el Banco Mundial o el Instituto Nacional de Estadística.

Podemos continuar con el contenido visual, concretamente, tenemos el banco de imágenes abiertas y de vídeos de Google. En lo que a imágenes se refiere, Open Images Dataset cuenta con unos 9 millones con sus categorías y objetos etiquetados. De hecho, se etiquetan de media 8.4 objetos por imagen.

Sobre los vídeos, estos se alojan en el conjunto YouTube-8M. Este dataset cuenta con más de 6 millones de vídeos, clasificados en cerca de 4.000 clases y que contienen un promedio de 3 etiquetas por vídeo. Un etiquetado que, al igual que con las imágenes, se realiza automáticamente por Inteligencia Artificial. Ambas fuentes son muy útiles para el desarrollo de sistemas de reconocimiento biométrico.

En cuanto a las contribuciones de Google al código abierto, u Open Source, destacamos iniciativas como el archiconocido Android, Chromium, TensorFlow y Kubernets. Además, Google ha contribuido enormemente en GitHub.

Entre los proyectos relacionados con poner a disposición del público general información útil, son destacables aquellas iniciativas relacionadas con los datos recogidos por entidades de carácter público.

Entre estas encontramos Kaggle, una plataforma especializada en la formación y creación de una comunidad de especialistas en Machine Learning y ciencia de datos, que fue adquirida por Google en 2017. Kaggle cuenta con unos 20.000 conjuntos de datos abiertos.

Google cuenta con una amplia presencia en el mundo de los datos abiertos, tal y como avalan las iniciativas que acabamos de mencionar. Es por ello interesante realizar un seguimiento pormenorizado de su evolución, así como de los nuevos proyectos que vayan surgiendo de cara al futuro. Permaneceremos al tanto para hablaros de todo ello y que estéis debidamente informados al respecto.

Compartir entrada

Share on facebook
Share on google
Share on twitter
Share on linkedin
Share on pinterest
Share on print
Share on email