I processi di comunicazione scientifica si stanno gradualmente adeguando a soddisfare i requisiti più moderni della ricerca, ovvero la pubblicazione degli esperimenti e dei dati necessari alla loro esecuzione. Tuttavia, in molte comunità scientifiche le pratiche di pubblicazione on-line dei dati o degli esperimenti sono vaghe o totalmente assenti. In assenza di adeguati meccanismi d’attribuzione del merito, la condivisione e pubblicazione dei dati arrivano persino a essere ritenute controproducenti. Di conseguenza, gli ostacoli non sono da imputare unicamente a problemi di carattere legislativo o economico, ma anche a problematiche di ordine culturale e tecnologico. Ma qual è lo stato delle cose per la condivisione di dati e esperimenti e quali soluzioni addita la ricerca in questo settore?

I processi di comunicazione scientifica, tradizionalmente incentrati sulla pubblicazione di letteratura, si stanno gradualmente adeguando a soddisfare i requisiti più moderni della ricerca, ovvero la pubblicazione degli esperimenti e dei dati necessari alla loro esecuzione. Affrontare le sfide all’accesso aperto ai prodotti della ricerca oggi, significa dunque dover superare le barriere tecnologiche e i problemi legati ai diritti d’accesso non solo ad articoli scientifici, ma anche a dati ed esperimenti a questi associati.

1. L’evoluzione della comunicazione scientifica

Con il termine “infrastrutture per la ricerca” s’intende l’intero complesso degli elementi organizzativi (ruoli, procedure, ecc.), strutturali (edifici, laboratori, ecc.) e tecnologici (microscopi, telescopi, sensori, risorse ICT, ecc.) a supporto dei processi investigativi e sperimentali degli scienziati. La parte ICT di queste infrastrutture è divenuta oggigiorno essenziale per fruire dei flussi di comunicazione scientifica. Da un lato gli scienziati depositano i file e i metadati delle pubblicazioni in “publication repository” istituzionali o tematici o presso riviste online (“journal”). In seguito, vari applicativi web svolgono l’utile compito di aggregare, indicizzare e catalogare queste sorgenti di informazione, allo scopo di offrire ai ricercatori servizi avanzati per la ricerca della letteratura (es. Google Scholar, DBPL).

Tuttavia, rispetto al passato, la ricerca moderna pone un forte accento sull’elaborazione di grandi quantità di dati (“The Fourth Paradigm”, Jim Gray), portando gli scienziati a investire fondi ed energie per collezionare, curare e produrre dati per la ricerca. Nell’ultimo decennio, questo trend ha spinto i dati a ricoprire il ruolo di “cittadini di prima classe” nell’ambito della comunicazione scientifica, alla stessa stregua della letteratura. A supporto e riprova di questo processo evolutivo si è assistito alla diffusione di “data repository” (GigaScience, Dryad, FigShare, Pangaea, ecc.), di varie iniziative di standardizzazione per la citazione dei dati (DataCite, Dataverse, Force11, ecc), e, in senso più ampio, alla definizione di pratiche scientificamente riconosciute per la pubblicazione di dati sperimentali. A rafforzare e completare questa rivoluzione di paradigma, un’altra sfida tecnologica ha di recente suscitato vivo interesse: la pubblicazione degli esperimenti (myexperiment.org, Carol Goble, 2010), intesi come i processi metodologici o i flussi (“workflow”) necessari a trarre date conclusioni scientifiche. L’obiettivo è di fornire ai ricercatori gli strumenti necessari per ripetere (“stesso esperimento, stesso laboratorio”), replicare (“stesso esperimento, altro laboratorio”), riprodurre (“stesso esperimento, diversa configurazione”) o riusare (“includere parte dell’esperimento in altro esperimento”) l’esperimento, massimizzando quindi la trasparenza e il riuso dei risultati scientifici.

Introdurre nei flussi di comunicazione scientifica la possibilità di pubblicare letteratura unitamente a dati ed esperimenti a essa correlati consentirebbe: (1) una miglior interpretazione dei risultati scientifici, (2) l’applicazione di più rigorosi criteri di valutazione del lavoro scientifico, riducendo la possibilità di “frodi”, (3) l’introduzione di criteri di premiazione omnicomprensivi del merito scientifico, e (4) la riduzione dei costi della ricerca, promuovendo il riuso.

2. Barriere all’accesso aperto a dati ed esperimenti

I vantaggi dell’accesso aperto alla letteratura scientifica sono noti ai più e possono essere brevemente elencati come: pari opportunità nello svolgimento della ricerca, riduzione dei costi alla ricerca pubblica (Houghton et al., 2009), aumento della produzione scientifica (Willinsky, 2005), aumento delle citazioni (Wagner, 2010)(Opcit Project, 2012) e coinvolgimento del pubblico non-scientifico (Swan, 2010). È quindi lecito porsi il problema di come applicare lo stesso paradigma ad altre forme di prodotti per la ricerca, quali i dati e gli esperimenti sopra citati. Ad esempio, il programma di finanziamento Horizon 2020 della Commissione Europea ha introdotto il “Data Pilot”, un’attività che ha come obiettivo la regolazione degli obblighi riguardanti la pubblicazione e la persistenza dei dati prodotti dai progetti finanziati dalla Commissione stessa. Tuttavia, la maturità dei flussi di comunicazione scientifica per dati ed esperimenti è ancora a un livello embrionale se comparata a quella della letteratura. In molte comunità scientifiche le pratiche di pubblicazione on-line dei dati o degli esperimenti sono vaghe o totalmente assenti, quindi tali prodotti rimangono a tempo indeterminato negli hard-disk, negli appunti, o nelle menti dei ricercatori. Di conseguenza, gli ostacoli ad attuare l’accesso aperto a dati ed esperimenti non sono da imputare unicamente a problemi di carattere legislativo o economico, ma anche a problematiche di ordine culturale e tecnologico.

2.1 Flussi di comunicazione scientifica per dati e esperimenti: stato delle cose

Come sopra accennato, per la letteratura scientifica i flussi sono ben stabiliti, con qualche idiosincrasia tipica delle singole discipline. I ricercatori inviano un articolo a una conferenza o a una rivista scientifica, l’articolo è revisionato secondo pratiche condivise (single-blind, double-blind, self-archiving, ec.), se accettato, l’articolo viene depositato in formato elettronico nel repository istituzionale o tematico di riferimento e al sito della rivista scientifica, se disponibile. La ricerca on-line della letteratura è effettuata tramite aggregatori di carattere più o meno tematico, come Google Scholar, OpenAIRE, Scopus, ecc. Le pratiche di citazione della letteratura sono infine ben stabilite grazie a standard di metadati (Dublin Core, Bibtex, MARC, ecc.) che tendenzialmente prescindono dalla disciplina. Ben diversa è la situazione riguardante dati ed esperimenti, di seguito brevemente descritta:

Dati della ricerca In assenza di adeguati meccanismi d’attribuzione del merito, in molte discipline la condivisione e pubblicazione dei dati arrivano a essere ritenute controproducenti. I flussi di comunicazione scientifica sono invece ben stabiliti nell’ambito delle discipline scientifiche in cui il riuso dei dati è ritenuto storicamente importante (es. biodiversità) o in quelle in cui la coesione scientifica e le infrastrutture per la ricerca hanno permesso il cambiamento (es. INSPIRE, dati geo-spaziali). E’ tuttavia complesso arrivare a condividere flussi di carattere inter-disciplinare – come accade per la letteratura- a causa del carattere disciplinare dei dati e delle loro molteplici forme di riuso. Molte iniziative stanno oggi studiando il problema (Force11, RDA, ecc.), dii conseguenza le soluzioni per peer-review (es. assente, manuale, semi-automatica) e deposito digitale (es. “data repository” in appositi “data centres”) sono le più svariate, così come quelle offerte per la ricerca on-line (es. DataCite e “data repository” tematici) e gli standard per la citazione (Data Cite, Dataverse, CERIF, ecc.).

Esperimenti Non esistono a oggi flussi di comunicazione per esperimenti accreditati da una comunità scientifica e tutte le attività a contorno sono di carattere investigativo o sperimentale. Per la peer-review e il deposito di esperimenti in formato digitale riferimenti ormai noti sono il lavoro fatto da myexperiments.org (research objects, wf4ever), le attività svolte nel contesto degli “executable papers” e quelle relative agli appunti sperimentali tipo E-notebook. Se per i dati la granularità del problema è spesso riconducibile a quella di una disciplina scientifica, per gli esperimenti può essere ricondotta a quella del laboratorio o dell’infrastruttura di ricerca.

2.2 Ricerca nel settore

Le comunità scientifiche sono oggi impegnate a definire, consolidare e stabilire precisi flussi di comunicazione scientifica per dati ed esperimenti, allo scopo di identificare le pratiche e le tecnologie per la valutazione della qualità (peer-review), il deposito e la ricerca on-line, e la citazione. Scopo di questo post è anche indicare quelli che ad oggi sono identificabili come i principali filoni di ricerca:

Definizione di pratiche e standard a supporto dei dati e degli esperimenti: questo tipo di ricerca è tipicamente fondazionale, ovvero tenta di identificare rappresentazioni digitali dei dati e degli esperimenti, di definire i relativi formati di metadati per la citazione e il riuso, di stabilire politiche per l’accesso aperto e la condivisione (es. Joint Declaration of Data Citation Principles, Force11).

Letteratura orientata a dati ed esperimenti: le soluzioni adottate in questo settore hanno come idea di fondo quella di pubblicare dati ed esperimenti in modo indiretto, sfruttando i flussi di comunicazione scientifica per la letteratura. Ad esempio, per dati si assiste a due pratiche, con relative tecnologie a supporto:

  • l’obbligo di depositare on-line i dati in un “data repository” per poter sottoporre un articolo a peer-review e, in caso di accettazione dell’articolo, l’obbligo a mantenere un riferimento dalla pubblicazione ai dati e viceversa (es. Joint Data Archiving Policy, JDAP);

  • la nascita delle riviste di tipo “data journals” dedicate alla pubblicazione dei dati, nelle quali l’articolo descrive aspetti riguardanti la produzione dei dati della ricerca e contiene un riferimento ai dati depositati e accessibili on-line.

Altra categoria di soluzioni è quella che riguarda le cosiddette “enhanced publication” (Bardi, 2014). Queste sono pubblicazioni digitali che comprendono, oltre alla tradizionale pubblicazione, riferimenti a dati scientifici e/o esperimenti ad essa correlati.

Realizzazione di infrastrutture per la comunicazione scientifica: tali infrastrutture (Castelli, 2013) mirano a integrare le attività di produzione scientifica in fase di svolgimento direttamente con i flussi di comunicazione scientifica dei ricercatori. La motivazione è di fondere il luogo in cui la ricerca si svolge e quello in cui la ricerca si pubblica, fornendo tecnologie che anticipino, semplifichino e quindi accelerino i processi di pubblicazione.

BiBliografia

(“The Fourth Paradigm”, Jim Gray)
Lynch, C.: Jim Gray’s fourth paradigm and the construction of the scientific record. In: Hey, T., Tansley, S., Tolle, C. (eds.) The Fourth Paradigm, pp. 177–183. Microsoft Corporation, Redmond (2009)
(myexperiment.org, Carol Goble, 2010)
De Roure, David, et al. “Towards open science: the myExperiment approach.” Concurrency and Computation: Practice and Experience 22.17 (2010): 2335-2353.
(Houghton et al., 2009)
Houghton, John, and Peter Sheehan. “Estimating the potential impacts of open access to research findings.” Economic Analysis and Policy 39.1 (2009): 127-142.
(Willinsky, 2005)
Willinsky, John. “Scholarly associations and the economic viability of open access publishing.” Open Journal Systems Demonstration Journal 1.1 (2005).
(Wagner, 2010)
Wagner, Benno. “Open access citation advantage: An annotated bibliography.” Issues in Science and Technology Librarianship 60 (2010): 2.
(Opcit Project, 2012): Web link: http://opcit.eprints.org/oacitation-biblio.html
(Swan, 2010)
Swan, Alma. “The Open Access citation advantage: Studies and results to date.” (2010). http://eprints.soton.ac.uk/268516/
(Bardi, 2014)
Bardi, Alessia, and Paolo Manghi. “Enhanced Publications: Data Models and Information Systems.” Liber Quarterly 22 (2014). https://liber.library.uu.nl/index.php/lq/article/view/8445
(Castelli, 2013)
Castelli, Donatella, Paolo Manghi, and Costantino Thanos. “A vision towards Scientific Communication Infrastructures.” International Journal on Digital Libraries 13.3-4 (2013): 155-169.
(Joint Declaration of Data Citation Principles, Force11)  Web link: http://www.force11.org/datacitation
Send to Kindle

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.