Costruire l’economia dei dati, sbloccare il potenziale di riuso delle informazioni e agevolare il libero scambio di conoscenza tra diversi Paesi europei a vantaggio di economia e società sono gli obiettivi di ogni forma di apertura della conoscenza. EOSC, European Open Science Portal, progetto Horizon 2020, vuole proprio essere una infrastruttura cloud abilitante dell’open science.
“Grazie a questo progetto – spiega Giorgio Rossi, ordinario di fisica all’Università degli studi di Milano, già chair di ESFRI, European Strategy Forum for Research Infrastructures – potremo dare libero accesso ai dati della ricerca scientifica al fine di consentirne l’analisi e il riutilizzo da parte di tutti. Tanti sono, infatti, i dati prodotti dalla ricerca che potrebbero acquisire ulteriore valore nel momento in cui a leggerli e usarli fosse una persona diversa da quella che li ha prodotti. Ed è tanto più importante che questo avvenga quando la ricerca è finanziata con soldi pubblici”.
Qual è la caratteristica principale dei dati pubblicati in EOSC?
Tutti i dati pubblicati dovranno essere “FAIR”, un acronimo che sintetizza le caratteristiche che i dati devono avere per rientrare sotto l’ombrello dell’Open Science: Findable, descritti secondo set di metadati standard riconosciuti dalle diverse comunità disciplinari; Accessible, accessibili e aperti; Interoperable, ovvero in formato possibile da leggere da sistemi conformi ai principi FAIR; Reusable, corredati da una licenza che ne spiega le possibilità di riuso. Ma la caratteristica più importante di EOSC sta nel fatto che i dati saranno riferiti non solo a diversi Paesi della UE, ma anche a diverse discipline, mentre al momento attuale esistono ottime esperienze di Open Science, ma spesso riferibili a un’unica materia (come per esempio l’astronomia).
Quali i vantaggi dell’apertura dei dati di ricerca?
Rendere riusabili e interoperabili i dati, e consentire pertanto l’estrazione di conoscenza da parte di diversi soggetti è un investimento che paga. Non certo nell’immediato, ma già nel medio periodo può portare a impatti positivi sia sulla sostenibilità economica che quella sociale. Pensiamo per esempio all’emergenza COVID. Nell’ambito del progetto EOSC, in tempi quasi record, proprio per agevolare la condivisione delle informazioni scientifiche, è nato COVID portal che vuole essere una prima rappresentazione dell’infrastruttura EOSC. Tramite il portale sono stati resi accessibili tutti i dati riferibili alle caratteristiche del virus. E se, da un lato, abbiamo avuto un riscontro immediatamente positivo dell’iniziativa, dall’altro, abbiamo potuto comprendere anche un grande limite: dal portale si raggiungono i dati prodotti dalle comunità scientifiche, ma non quelli altrettanti importanti per studiare e comprendere la pandemia, ovvero i dati clinici che le organizzazioni sanitarie possiedono ma non aprono. Pensiamo per esempio ai tamponi che vengono fatti alle persone: questi generano una grande quantità di dati, come per esempio la carica virale e il posto in cui sono stati eseguiti, che ci consentirebbero di costruire una mappa di diffusione. Ma questi dati non vengono condivisi e ci aiuterebbero invece a comprendere meglio la modalità di propagazione del virus. Parliamo molto di data governance, ma dobbiamo renderci conto che la cultura del dato non appartiene a molti ambiti e molte organizzazioni, con le ripercussioni negative che ognuno di noi può toccare con mano oggi.
Quali i tempi del progetto? Quando sarà possibile vedere costruita questa infrastruttura della conoscenza aperta?
Il progetto ha una sua roadmap che si estende in sette anni, ma ritengo che i primi servizi saranno disponibili già fra tre o quattro anni. Quello su cui si dovrà lavorare adesso è la federazione delle esperienze positive che esistono già in diverse discipline, e sulle quali si deve costruire un sistema generalista. Inoltre, ci si concentrerà sulla formazione di figure professionali come i Data Scientist e i Data Steward che potranno non solo sviluppare nuove forme di organizzazione dei dati, ma anche fare da facilitatori tra mondo della ricerca e infrastrutture dati. Altro aspetto non trascurabile è, poi, la qualità dei dati esposti, per la quale sarà fondamentale sensibilizzare le comunità scientifiche, anche ricorrendo a forme di peer review che, come avviene oggi per Wikipedia, nel mondo scientifico, a livello globale, possono funzionare bene.
La sostenibilità passa anche dall’Open Science quindi?
Sicuramente ogni SDG di Agenda 2030 potrebbe trarre vantaggio dall’apertura dei dati di ricerca, anche se l’economia dei dati e la data governance in generale richiedono alfabetizzazione all’uso dei dati che oggi purtroppo non abbiamo. Troppo raramente la troviamo nei decisori politici per esempio. Se guardiamo a questa pandemia possiamo comprendere come, nonostante ci sentissimo quasi invincibili, è bastato un virus a metterci in seria difficoltà e soprattutto a farci prendere decisioni non basate sull’analisi dei dati. Avremmo potuto fare molto meglio affidandoci alle evidenze piuttosto che alla lettura personale della realtà da parte di alcuni esperti. Le opinioni espresse da molti in questi giorni dovrebbero essere misurate con la realtà e i dati. Cosa che ci auguriamo in futuro possa rappresentare la normalità.
Facebook Comments