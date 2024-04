E’ stata appena lanciata la Barcelona Declaration on open research information. I firmatari si impegnano a perseguire una serie di impegni che prevedono che strumenti aperti, accessibili e trasparenti affianchino i tradizionali strumenti proprietari, superandone i limiti (legati al riuso, alla copertura geografica e linguistica, alla assegnazione a specifiche subjects categories). Un ulteriore passo avanti verso i principi espressi da COARA (Coalition for Advancing Research Assessment).

Ormai da anni, e soprattutto nel nostro paese, ci siamo abituati a ragionare sulla ricerca prodotta e disseminata sulla base di informazioni di ricerca che derivano da banche dati chiuse e commerciali, come Scopus o Web of Science. Queste informazioni, denominate metadati, includono (1) riferimenti bibliografici, titoli, abstract, autori e loro affiliazione, ma (2) anche metadati su software o metodologie di ricerca, campionamenti e strumenti utilizzati, oppure (3) informazioni sui finanziamenti e le sovvenzioni così come (4) informazioni sulle organizzazioni, e sui collaboratori che hanno contribuito alla ricerca. Questi metadati non includono i “contenuti” della ricerca o della pubblicazione, ma rappresentano un patrimonio informativo rielevante, che spesso svolge un ruolo fondamentale nella distribuzione delle risorse e nella valutazione dei ricercatori e delle istituzioni: le organizzazioni che si occupano di ricerca e di finanziamento della ricerca utilizzano queste informazioni per valutare e stabilire le priorità strategiche, così come per analizzare le collaborazioni e valutare l’impatto dei propri lavori.

Queste metadati, mediante l’uso di banche dati chiuse e commerciali, sono la fonte utilizzata da Anvur e dal Ministero dell’Università e della Ricerca per la definizione, ad esempio, delle soglie ASN e degli indicatori individuali per la Abilitazione Scientifica Nazionale. A queste banche dati ci si affida quando si tratta di definire gli indicatori della qualità scientifica dei membri dei collegi di dottorato per l’accreditamento, o nello scorso esercizio di Valutazione della qualità della ricerca: da queste banche dati sono state ricavate le citazioni e gli indicatori di rivista.

Queste banche dati non sono prive di errori, di omissioni e di importanti limitazioni. Sdoppiamento di profili, errata attribuzione, mancata indicizzazione di interi fascicoli o di articoli all’interno dei fascicoli, ad esempio. Ma anche scelta “dall’alto”, operata direttamente dalle società proprietarie di queste banche dati, di quali riviste indicizzare e quali no, quali lingue considerare e quali no, quali discipline includere e quali no. A livello di analisi macro questi errori potrebbero non essere considerati significativi, ma per chi decide utilizzando questi dati, questi errori, insieme alla mancanza di trasparenza e inclusione, potrebbero rappresentare un grande problema.

Un argomento comunemente avanzato è che queste banche dati offrono una garanzia sulla qualità delle riviste scientifiche e dati integrati. Tuttavia, tale argomento è sempre più oggetto di discussione oggi, poiché la decisione su quali riviste siano considerate di ‘qualità’ non dovrebbe essere lasciata a un provider privato, spesso in conflitto di interessi con gli editori delle riviste (ad esempio, Scopus è di proprietà di Elsevier), ma piuttosto affidata alla comunità scientifica di riferimento o agli organi di valutazione nazionale.

Queste banche dati proprietarie e chiuse sono anche la base per costosissimi strumenti di business intelligence in cui vengono messi a disposizione strumenti per generare indicatori spesso opachi e difficili da riprodurre, contribuendo a generare una proliferazione di indicatori quantitativi non replicabili e di dubbio valore, ai fini della valutazione della ricerca scientifica e della presa di decisioni.

A chi voglia effettuare analisi approfondite e descrittive della ricerca di singole istituzioni o Paesi, o su aree specifiche, o relative a gruppi di ricerca, vengono messi a disposizione i dati solo in modalità protetta da diritti di proprietà intellettuale, per cui non è possibile renderli disponibili alle comunità, come è ormai pratica diffusa (e richiesta) per le ricerche e le analisi che utilizzano e producono dati.

Lo sanno bene i ricercatori del CWTS che pubblicano il ranking di Leiden e che fino a quest’anno non hanno mai potuto esporre i dati di Web of Science utilizzati per il loro ranking, anche se su quei dati hanno sempre dovuto effettuare un grosso lavoro di pulizia e rielaborazione. Lo sanno bene le numerose università che puliscono in maniera certosina i dati relativi alla propria istituzione per apparire nei rankings universitari internazionali, ma anche in questo caso, questi dati non vengono poi restituiti alla comunità, generando uno spreco di risorse ed energie pubbliche.

Da quest’anno al CWTS hanno cominciato a produrre un secondo ranking basato su dati aperti provenienti da infrastrutture come OpenAlex e ROR (Research organization Registry) che garantiscono la completa trasparenza dei dati utilizzati. L’esercizio che è stato poi fatto è quello di comparare i risultati del ranking basato su dati proprietari con quello basato su dati aperti, confrontandone punti critici e punti di forza. In un post sul blog Leidenmadtrics i ricercatori responsabili del ranking spiegano come procederanno nei prossimi anni:

In the next one or two years, we expect the traditional Leiden Ranking and the Open Edition to co-exist. In the somewhat longer term, CWTS will make a full transition to open research information. Within the next few years, all bibliometric indicators produced by CWTS, including those in the Leiden Ranking, will be based on open data.

I ricercatori del CWTS non sono però gli unici ad avere compreso l’importanza dell’utilizzo di dati sulla ricerca aperti. Alla fine dello scorso anno l’università della Sorbona ha deciso di non rinnovare il proprio abbonamento a Web of Science (quello a Scopus non è mai stato sottoscritto) , e il CNRS non ha rinnovato l’abbonamento a Scopus. Entrambe le istituzioni hanno dichiarato di voler utilizzare dati aperti per la analisi e descrizione della ricerca.

E’ all’interno di questo contesto che, alla fine del 2023, in un incontro a Barcellona fra 25 esperti rappresentanti di istituzioni di ricerca, enti finanziatori e enti di valutazione è stata definita la dichiarazione sui dati sulla ricerca aperti (Barcelona Declaration on open research information), attraverso la constatazione che il panorama dell’informazione sulla ricerca richieda un cambiamento fondamentale e che pertanto sia necessario che le istituzioni decidano di impegnarsi attivamente ad assumere un ruolo guida nella trasformazione delle pratiche attuali verso soluzioni completamente aperte.

La dichiarazione, che ha ricevuto la firma di oltre 40 istituzioni è stata pubblicata oggi, martedì 16 aprile e si basa su una serie di impegni che le istituzioni firmatarie intendono perseguire:

1 Fare in modo che l’apertura sia la norma per le informazioni sulla ricerca che utilizziamo e produciamo.

2 Lavorare con servizi e sistemi che supportano e consentono l’apertura delle informazioni sulla ricerca.

Supportare le infrastrutture per le informazioni aperte sulla ricerca

4 Sostenere azioni collettive per accelerare la transizione verso l’apertura delle informazioni sulla ricerca.

Sono già molte le istituzioni che hanno aderito alla dichiarazione di Barcellona, per l’Italia hanno già firmato l’Università Di Milano e l’Università di Bologna, il Museo Galileo e la Regione Toscana. Altre hanno avviato una riflessione interna e presto si aggiungeranno all’iniziativa.