Mentre H2020 decreta l’obbligo di pubblicazione ad accesso aperto dei dati a supporto delle ricerche finanziate nel programma a partire da gennaio 2017, mentre la LERU dissemina la sua Roadmap for research data, mentre vengono diffusi in workshop europei e oltremare gli esiti del progetto LEARN, mentre il progetto FOSTER raccoglie casi ed esperienze sugli open research data, mentre in Austria si sta creando una infrastruttura a supporto della raccolta e archiviazione dei dati prodotti nelle attività di ricerca, mentre sempre più riviste scientifiche e la International Committee of Medical Journal Editors chiedono agli autori di fornire accanto agli articoli anche i dati da cui gli articoli sono derivati affinché la comunità scientifica possa validare gli articoli e riprodurre le ricerche in esse illustrate, ancora poco è stato fatto in Italia rispetto a questo tema, e nel rapporto di recente pubblicato dal gruppo di lavoro del MIUR sui big data, l’open access ai dati della ricerca occupa una mezza colonna delle 74 pagine del rapporto con alcune affermazioni molto generiche ben lontane da quella che potrebbe essere definita una strategia sui dati della ricerca che nelle intenzioni della EC devono essere “as open as possible, as closed as necessary” [un utile confronto su come potrebbe invece essere trattato il tema lo si trova qui]. Il ritardo da parte del Ministero è evidente, così come una certa mancanza di sensibilità verso un tema ritenuto di grande importanza nel resto dell’Europa. Mancano le politiche, mancano le infrastrutture. Ma gli atenei e i centri di ricerca, che a differenza del Ministero evidentemente il contatto con l’Europa lo mantengono (perché i loro ricercatori pubblicano su riviste internazionali e acquisiscono grant da parte della EC) hanno ben chiaro il problema della gestione dei dati della ricerca e stanno cercando di affrontare la tematica in gruppi di studio informali a partecipazione volontaria come quello coordinato dal NOAD (National Open Access Desk) di OpenAIRE che ha organizzato un seminario a Bologna e un workshop di due giorni al CNR insieme ad AISA e che sta studiando e producendo documenti in relazione alle policy, ai requisiti per le infrastrutture, ai Data management plans, ma soprattutto che mantiene il contatto con le iniziative portate avanti negli altri paesi. Non si può infatti affrontare questo tema senza un confronto con quanto viene fatto altrove.
A questo proposito un recente post sul sito di Research Councils UK segnala la pubblicazione del Concordat on Open Research data ad opera dei Research Councils UK, della British library, del Research Information network, del Russel Group e di alcune università britanniche.
Il documento dà in primo luogo una definizione di cosa sono i research data:
Research data are the evidence that underpins the answer to the research question, and can be used to validate findings regardless of its form (e.g. print, digital, or physical). These might be quantitative information or qualitative statements collected by researchers in the course of their work by experimentation, observation, modelling, interview or other methods, or information derived from existing evidence. Data may be raw or primary (e.g. direct from measurement or collection) or derived from primary data for subsequent analysis or interpretation (e.g. cleaned up or as an extract from a larger data set), or derived from existing sources where the rights may be held by others. Data may be defined as ‘relational’or ‘functional’ components of research, thus signalling that their identification and value lies in whether and how researchers use them as evidence for claims.
They may include, for example, statistics, collections of digital images, sound recordings, transcripts of interviews, survey data and fieldwork observations with appropriate annotations, an interpretation, an artwork, archives, found objects, published texts or a manuscript.
e di cosa sono gli open research data
Open research data are those research data that can be freely accessed, used, modified, and shared, provided that there is appropriate acknowledgement if required
E soprattutto sottolinea che, per vari motivi, non tutti i dati della ricerca possono essere aperti
Not all research data can be open and the concordat recognises that access may need to be managed in order to maintain confidentiality, guard against unreasonable cost, protect individuals’ privacy, respect consent terms, as well as managing security or other risks
Scopo di questo documento è la definizioni di alcuni principi che tengano conto delle esigenze di tutti I soggetti coinvolti:
In is not the intention to mandate, codify or require specific activities, but to establish a set of expectations of good practice
Nella convinzione che
Openness implies more than disclosure of data. All those engaged with research have a responsibility to ensure the data they gather and generate is properly managed, and made accessible, intelligible, assessable and usable by others unless there are legitimate reasons to the contrary. Access to research data therefore carries implications for cost and there will need to be trade-offs that reflect value for money and use.
I dieci principi che riportiamo in forma sintetica rimandando alla lettura del testo esplicativo per approfondimenti recitano:
1 Open access to research data is an enabler of high quality research, a facilitator of innovation and safeguards good research practice
2 There are sound reasons why the openness of research data may need to be restricted but any restrictions must be justified and justifiable.
3 Open access to research data carries a significant cost, which should be respected by all parties
4 The right of the creators of research data to reasonable first use is recognised
5 Use of others’ data should always conform to legal, ethical and regulatory frameworks including appropriate acknowledgement
6 Good data management is fundamental to all stages of the research process and should be established at the outset
7 Data curation is vital to make data useful for others and for long-term preservation of data
8 Data supporting publications should be accessible by the publication date and should be in a citeable form
9 Support for the development of appropriate data skills is recognised as a responsibility for all stakeholders
10 Regular reviews of progress towards open research data should be undertaken
Il documento è anche una risposta (con i principi # 2,4) alle perplessità espresse da un gruppo nutrito di ricercatori sul New England Journal of Medicine rispetto alla pubblicità dei dati sui trial clinici. Per una serie di motivi gli autori dell’articolo sostengono la necessità di embarghi molto lunghi per i dati sui trials clinici, che possono arrivare fino a 2 anni e mezzo.
Un principio importante è il #3 che richiama l’attenzione e la responsabilità dei diversi portatori di interesse sul fatto che l’open access ai dati della ricerca ha dei costi considerevoli per cui è responsabilità dei ricercatori individuare fin dall’inizio della propria ricerca quali e quanti dati verranno poi conservati e messi ad accesso aperto.
Un altro principio importante è il #6 che pone l’accento sulla necessità della gestione dei dati che va condotta e pianificata fin dall’inizio seguendo standard internazionali. Solo a queste condizioni i dati potranno essere conservati a lungo termine e riutilizzati da altri (principio#7).
Nonostante il tema dei dati della ricerca sia oggetto di discussione da tempo e grandi passi siano stati fatti da parte della EC, in Italia
- manca una conoscenza approfondita del tema e un soggetto che ne sia responsabile
- mancano delle politiche e delle direttive da parte del ministero (e di conseguenza anche da parte delle Università) armonizzate con quanto avviene nel resto dell’Europa
- manca una infrastruttura tecnologica che possa essere di appoggio per gli atenei e i loro ricercatori
Il gruppo di lavoro coordinato dal NOAD di OpenAIRE e la Associazione italiana per la scienza aperta hanno accumulato un bel po’ di esperienza su queste tematiche, ci auguriamo che quando il ministero deciderà di colmare l’enorme lacuna rispetto all’open science (e agli open research data) in Italia, sappia giovarsi dei percorsi e degli studi già avviati da atenei, centri di ricerca e associazioni, per non reinventare ogni volta la ruota.