¿Qué son?

Datos abiertos (Open Data en inglés) es una filosofía y práctica que persigue que determinados datos estén disponibles de forma libre a todo el mundo, sin restricciones de copyright, patentes u otros mecanismos de control. Los datos deben publicarse en bruto (sin procesar), bien estructurados y en formatos conocidos que faciliten la reutilización.

El sector público produce una gran variedad de información interesante para los ciudadanos y empresas, como por ejemplo, información social, económica, geográfica, estadística, meteorológica o turística y sobre empresas y educación. Esta información tiene unas características que la hacen particularmente atractiva para el sector de los contenidos digitales, ya que es completa, fiable y de calidad.

La apertura de datos del sector público permite que cualquier persona u organización pueda construir sobre ellos una nueva idea que resulte en nuevos datos, conocimientos, mejorar procesos, dar valor añadido a los existentes o incluso crear nuevos servicios.

Por lo tanto, tiene un considerable potencial económico y además favorece la transparencia, participación y colaboración ciudadana, necesarios para contar con un gobierno más abierto.

Para Qué

  • Transparencia. La fiabilidad y origen de los datos hacen que se convierta en un excelente medio para comunicar la gestión pública realizada, la rendición de cuentas y control externo a la gestión todo ello destinado a ser transparente en la gestión del servicio público y generar confianza en la población.
  • Reutilización de la información publica. Cualquier organización genera ingentes cantidades de información útil para otros departamentos u organizaciones. Los Datos Abiertos se establecen como una herramienta de publicación y reutilización de la información en la que las administraciones ponen a disposición de la ciudadanía su trabajo para que esta lo reutilice.
  • Generación e incentivación de economías. La generación de economías a partir de los datos abiertos tiene múltiples facetas como son la eficiencia en la gestión ahorros debidos a la reutilización de la información eliminando gastos duplicados, eficiencias asociadas a una mayor visibilidad de los procesos y posibilidad de establecer acciones de mejora sobre ellos, creación de servicios nuevos, permitir establecer mecanismos de colaboración internos o externos, permitir mecanismos de generación de servicios a bajo coste, establecer modelos de comercialización de los datos, …
  • Fuente de innovación. La disponibilidad de nuevas fuentes de datos dan paso a la innovación permitiendo reforzar líneas de negocio, crear nuevos servicios, enfocar problemas desde otras perspectivas, colaboración frente a retos, …

Para Quién

  • Para Desarrolladores: Fomentando la reutilización de la información pública, permitiendo la creación de nuevos servicios, favoreciendo la innovación, disminuyendo las inversiones necesarias para el desarrollo de aplicaciones y en general proporcionando una información fiable sobre la que desarrollar investigación y negocio.
  • Para la Ciudadanía: Poniendo en valor el resultado de la Gestión pública de un modo transparente, consistente y fiable.
  • Para la Administración: Disminuyendo las barreras a la reutilización de la información, eliminando redundancias, favoreciendo la eficiencia en la gestión y dificultando situaciones no deseables como corrupción o malversación de fondos públicos.

Principales formatos expuestos

SHP – Formato de datos espaciales, considerado como el estándar de facto para el intercambio de información geográfica entre Sistemas de Información Geográfica (GIS). Es un formato vectorial de almacenamiento digital, desarrollado por ESRI, donde se guarda la localización de elementos geográficos y los atributos asociados a ellos.

GML – Es un sublenguaje de XML descrito como una gramática en XML Schema para el modelaje, transporte y almacenamiento de información geográfica. Su importancia radica en que a nivel informático se constituye como una lengua franca para el manejo y trasvase de información entre los diferentes software que hacen uso de este tipo de datos, como los Sistemas de Información Geográfica.

WFSWeb Feature Service o WFS del Consorcio Open Geospatial Consortium o OGC es un servicio estándar, que ofrece una interfaz de comunicación que permite interactuar con los mapas servidos por el estándar WMS , como por ejemplo, editar la imagen que nos ofrece el servicio WMS o analizar la imagen siguiendo criterios geográficos. Para realizar estas operaciones se utiliza el lenguaje GML que deriva del XML , que es el estándar a través del que se transmiten las órdenes WFS.

WMS – Es un servicio definido por el OGC (Open Geospatial Consortium) que produce mapas de datos referenciados espacialmente, de forma dinámica a partir de información geográfica. Es un estándar internacional que define un mapa como una representación de la información geográfica en forma de un archivo de imagen digital.

KML – del acrónimo en inglés Keyhole Markup Language, es un lenguaje de marcado basado en XML para representar datos geográficos en tres dimensiones. Fue desarrollado para ser manejado con Keyhole LT, precursor de Google Earth. Su gramática contiene muchas similitudes con la de GML.

KMZ – Es un fichero KML comprimido para ahorrar espacio y ganar en velocidad de transmisión.

CSV – Tipo de documento de texto plano en formato sencillo para representar datos tabulares en columnas separadas por punto y coma, y filas separadas por saltos de línea.

JSON – acrónimo de JavaScript Object Notation, es un formato ligero para el intercambio de datos. JSON es un subconjunto de la notación literal de objetos de JavaScript que no requiere el uso de XML .

JSON-LD – JSON-LD, o JavaScript Object Notation for Linked Data, es un método de transporte de datos enlazados (Linked Data) utilizando JSON.

RDF XML/TURTLE /N3 – RDF o Resource Description Framework no es un formato concreto sino una infraestructura para la descripción de los recursos de la web mediante expresiones de la forma sujeto-predicado-objeto. El sujeto es el recurso que se describe, el predicado es la propiedad sobre la que se quiere establecer el recurso y el objeto es el valor de la propiedad con el que se establece la relación. La combinación de RDF con otras herramientas permite añadir significado a las páginas y es una de las tecnologías esenciales para la web semántica. Existen varios formatos de representación: XML, para procesamiento automático; N3, para representación en texto plano de forma más legible para humanos; Turtle,como simplificación de la anterior.