L’expressió Open Data s’ha posat molt de moda en els últims temps. És una disciplina que genera molt d’interès, per la seva flexibilitat i varietat de camps d’aplicació: demografia, transports, mobilitat…

Però, que és exactament l’Open Data, i quines són les implicacions del seu ús?

Què és el concepte de dades obertes?

El concepte de dades obertes (Open Data) és la idea que algunes dades han d’estar obertament disponibles per al públic general. Aquest concepte estableix que les dades no han de tenir drets de propietat intel·lectual. Avui dia, les administracions públiques són un dels grans productors de dades obertes.

Perquè un conjunt de dades pugui considerar-se que està en obert, ha de complir certs requisits:

Les dades han d’estar disponibles a baix o nul cost.
Les dades s’han de poder utilitzar, reutilitzar i distribuir de forma lliure.
Tothom ha de poder accedir a les dades, sense restriccions.

Hi ha diverses raons a favor d’aquesta causa:

  • Les dades són propietat de la raça humana: Aquest argument explica que algunes dades, com ara la seqüenciació de l’ADN, o certes dades del medi ambient no són propietat d’una sola persona, sinó que pertanyen a tots els éssers humans.

 

  • Si un projecte ha estat finançat per fons públics, hauria d’estar en obert: Aquest és també un dels principals argument a favor de l’accés obert. Si un projecte ha rebut finançament públic, no té sentit que després s’hagi de tornar a pagar per accedir als resultats.

 

  • Si s’ha creat per l’administració pública, ha de ser d’accés lliure: Molt lligat amb els principis de transparència, sosté que totes les dades generades per l’administració pública i el govern, han d’estar a lliure disposició dels ciutadans.
  • Els fets no tenen drets d’autor: Els mers fets o successos no tenen cap dret d’autor associat, ja que no hi ha cap intenció creativa o original al darrere, i per tant, les dades han de seguir el mateix principi.

 

  • Les dades són clau pel desenvolupament socioeconòmic: Gran part del desenvolupament socioeconòmic d’una societat rau en les dades que aquesta genera. Impedir o restringir l’accés a aquestes dades endarrereix el progrés.

 

  • La ciència se sosté en les dades: tot experiment científic ha de poder ser reproduïble. Per tant, facilitar les dades de recerca afavoreix tant la replicació com la creació de coneixement derivat i complementari.

La Carta Internacional de les Dades Obertes

L’any 2015, durant la Cimera Global de l’Aliança per al Govern Obert a Mèxic, es va crear la Carta Internacional de les Dades Obertes. Aquesta carta proposa un conjunt de principis i bones pràctiques per a l’alliberament de dades obertes governamentals. Avui dia, Espanya no s’hi ha adherit, però sí que ho han fet diverses comunitats autònomes, inclosa Catalunya, que ho va fer l’any 2018.

La carta estableix que les dades alliberades per governs han de seguir aquests principis:

  • Obert per defecte.
  • Oportú i complet.
  • Accessible i utilitzable.
  • Comparable i interoperable.
  • Per la millora de la governança i la participació ciutadana.
  • Pel desenvolupament inclusiu i innovació.

Els formats de les dades

La teoria de les dades obertes està molt bé, però no serveix de gaire si a l’hora de la veritat no triem un format adequat. No obstant això, per a compartir correctament les dades hem de triar formats que tots els usuaris puguin obrir. Per això, generalment es recomana fer servir formats derivats del programari lliure.

En molts casos, s’acostuma a triar el format en el qual s’han generat les dades. Un dels formats més comuns per a compartir les dades és el format CSV (Valors separats per comes). Altres formats utilitzats inclouen:

TXT

TXT: Format de text pla.

XLS

XLS: Format dels arxius d’Excel.

XML

XML: Extensible Markup Language, llenguatge web per a l’intercanvi de dades.

ZIP

ZIP: Format de compressió sense pèrdua.

JSON

JSON: JavaScript Object Notation, llenguatge web per a l’intercanvi de dades, actualment se’l considera una alternativa a XML.

 

RDF

RDF: Resource Description Framework. Infraestructura de descripció de recursos en xarxa.

RSS

RSS: Really Simple Syndication. Format derivat d’XML.

Dificultats d’accés als conjunts de dades

Triar formats propietaris és un dels errors més comuns que dificulten l’accés a aquestes dades. Altres pràctiques errònies que poden dificultar l’accés són:

  1. Fer pagar per accedir a les dades.
  2. Obligar els usuaris a registrar-se per accedir-hi.
  3. Utilitzar una llicència que no permet la reutilització.
  4. Patentar les dades.
  5. Restringir l’accés a només els rastrejadors d’internet d’alguns cercadors.
  6. Incloure les dades en una base de dades protegida pel dret sui generis de la propietat intel·lectual.
  7. Limitar el temps durant el qual les dades es poden accedir.

Com estructurar les dades

No totes les dades es poden expressar correctament en un full de càlcul. Actualment, hi ha tres estructures utilitzades en la difusió dels datasets:

Estructura en taula

Les dades s’organitzen en files i columnes. Per exemple, el nombre d’usuaris que té un museu cada dia.

excel

Estructura jeràrquica

Ideal per dades vinculades en una estructura arbòria vertical. Per exemple, la plantilla d’una organització.

jerarquia

Estructura en xarxa

Idoni per dades on es pot establir una combinació en qualsevol direcció. És l’estructura dels contactes de les xarxes socials.

redes sociales

Qui genera les dades obertes?

Tot i que qualsevol persona o organització pot generar dades i posar-les en obert, generalment els conjunts d’Open Data acostumen a provenir de tres grans productors:

  • L’administració pública i el govern.
  • La ciència.
  • Grans organitzacions internacionals.

Governs oberts

Gran part de les dades generades per l’administració pública i el govern són consultables sota les diferents iniciatives de transparència i govern obert. L’obertura de les dades públiques fomenta la transparència de les administracions públiques i promou la col·laboració de la societat en la millora dels serveis públics.

A la nostra societat hi ha diversos casos d’aplicacions o programes creats a partir de les dades en obert que ofereix el govern. Alguns bons exemples són el portal de dades obertes de la Generalitat de Catalunya o el de l’Ajuntament de Barcelona. En l’àmbit internacional tenim el portal de dades obertes del Regne Unit o el de la Unió Europea.

Data Server

Open Science Data

Els científics van ser els pioners en tot el món de les dades obertes. El concepte de dades científiques en obert data de l’any 1957. No va ser fins a l’any 1966 que es va crear la primera base de dades en línia: Medline.

A hores d’ara, s’està produint un boom de dades obertes en ciència, promoguts en part per la popularitat de l’Open Access. També hi influeix que gran part dels contractes sota la iniciativa Horizon 2020, estableixen que s’ha de disposar en obert no només de les publicacions derivades de la recerca, sinó també les dades que aquesta ha generat. Tot i que hi ha moltes institucions que opten per introduir les dades derivades de la recerca en els seus propis repositoris institucionals, també podem trobar-hi grans iniciatives internacionals com el European Open Science Cloud o l’ Open Science Data Cloud.

Organitzacions internacionals

Seguint l’estratègia dels governs, i afavorint la transparència, grans organitzacions internacionals com l’ ONU o l’ OMS també tenen els seus propis portals de dades obertes.

Open Data i altres moviments oberts

Els objectius que impulsen el moviment de dades obertes són en gran part compartits per altres moviments que defensen el coneixement obert. Les iniciatives obertes més populars són:

  • Accés obert: Moviment a favor del lliure accés a les publicacions científiques i acadèmiques.
  • Continguts oberts: Inclou tot el contingut publicat sota una llicència de lliure accés, copia distribució o modificació. Inclou materials audiovisuals i d’altres formats.
  • Coneixement obert: Aquesta iniciativa comprèn gairebé tots els continguts oberts, inclosos materials docents.
  • Programari lliure: Tot el programari que pot ser usat, estudiat, modificat, copiat i redistribuït sense cap restricció.

Conclusions

En poques paraules, les dades obertes no són només una necessitat, si no directament una obligació en els temps que corren. Tothom ha de tenir dret a l’accés d’aquestes dades, ja que d’una manera o d’altra participen en la seva creació. Per tant, qualsevol individu o entitat hauria de tenir la llibertat per utilitzar aquesta informació, ja siguem un govern o una persona anònima.