I4OC o la fine dell’oligarchia delle citazioni

30 Maggio 2018

La citazione bibliografica tra due pubblicazioni scientifiche è il collegamento concettuale che intercorre tra un’opera citante e un’opera citata, istanziato tipicamente attraverso l’inclusione di un riferimento bibliografico in bibliografia, in nota, o in un riferimento intratestuale. Una citazione è il risultato di uno specifico processo creativo dell’autore citante, il quale vuole fare riferimento a un contributo terzo funzionale al lavoro che sta scrivendo, come fonte d’informazioni o termine di confronto.

Le citazioni permeano da sempre il tessuto accademico, e sono utilizzate per dare credito a teorie e studi necessari all’avanzamento della ricerca in un certo dominio – concetto ben espresso da Newton nel suo “If I have seen further it is by standing on the shoulders of Giants”. Tuttavia, nel tempo, le citazioni hanno iniziato a ricoprire anche altre funzioni. In particolare, reti di citazioni scientifiche possono essere caratterizzate topologicamente (definendo il grafo di connessione tra gli articoli citanti e citati nel tempo), in termini sociologici (per l’identificazione di cattivi processi di condotta della ricerca scientifica e di accesso elitario alla scienza), o sottostare a logiche prettamente quantitative (creando metriche basate su citazioni per valutare l’impatto scientifico di un’idea e/o di una persona) ed economiche (intese come moneta con la quale un ricercatore provvede alla sua sostentazione accademica).

Le informazioni che caratterizzano una citazione, ovvero il collegamento tra articolo citante e citato e i loro relativi metadati (titolo, lista degli autori, anno di pubblicazione, rivista, numero di pagine, DOI, etc.) sono dati fattuali. Queste informazioni non sono il prodotto dell’opera creativa di un autore – non veicolano cioè il suo contenuto ma servono solo a identificarlo – e pertanto non sono coperti dal diritto d’autore. Numerosi servizi, detti indici di citazioni, mettono a disposizione, anche in forma strutturata, grandi collezioni di questi dati citazionali. Tra questi, i più conosciuti, utilizzati e, probabilmente, completi sono Web of Science di Clarivate Analytics e Scopus di Elsevier. Tuttavia, l’accesso a questi indici è possibile solo a seguito del pagamento di svariate centinaia di migliaia di euro, che soltanto determinate istituzioni e aziende si possono permettere. Fin qui, niente di nuovo.

La situazione ha subito un drastico cambiamento di rotta nell’ultimo anno e mezzo. Crossref è un’associazione senza scopo di lucro che riceve dagli editori i metadati degli articoli da essi pubblicati e li mette a disposizione come materiale di Pubblico Dominio mediante l’uso di API. A metà del 2016, un gruppo di persone coinvolte a vario titolo nella divulgazione accademica ha notato che Crossref dava anche la possibilità di rilasciare l’intera lista dei riferimenti bibliografici degli articoli depositati in formato totalmente aperto. Purtroppo, mentre i metadati degli articoli – titolo, lista degli autori, anno di pubblicazione, etc. – vengono messi a disposizione liberamente attraverso le API di Crossref, il libero accesso alla lista dei riferimenti bibliografici degli articoli deve essere esplicitamente concesso dall’editore che deposita questi dati in Crossref. Inoltre, depositare questa lista non è obbligatorio per l’editore, per cui esistono articoli depositati in Crossref che non la specificano. A fine 2016, soltanto l’1% degli articoli che presentavano liste di riferimenti bibliografici in Crossref avevano effettivamente rilasciato queste liste in modo totalmente aperto.

È da queste premesse che è nata, nell’Aprile del 2017, la Initiative for Open Citations (o I4OC), grazie al coinvolgimento diretto di OpenCitations, Wikimedia Foundation, PLOS, eLIFE, DataCite, e il Centre for Culture and Technology della Curtin University. Questa iniziativa nasce con lo scopo di promuovere il rilascio di dati citazionali in modo che siano strutturati (ovvero espressi in formati che siano facilmente processabili da software), separabili (ovvero che possano essere analizzati senza avere a disposizione la sorgente originale da cui sono stati estratti), e aperti (ovvero rilasciati come materiale di Pubblico Dominio).

Il primo anno di attività dell’iniziativa è stato dedicato alla sensibilizzazione degli editori che già depositavano i loro dati citazionali su Crossref, al fine di dare libero accesso alle loro liste di riferimenti bibliografici. Tra gli editori che hanno risposto positivamente (la cui lista completa e aggiornata è messa a disposizione da Crossref) ci sono: American Geophysical Union, Association for Computing Machinery, BMJ, Cambridge University Press, EMBO Press, Oxford University Press, Royal Society of Chemistry, SAGE Publishing, Springer Nature, Taylor & Francis, e Wiley. A tutto ciò si sono aggiunti una serie di supporter internazionali, che hanno favorito il dialogo con editori e la diffusione dell’iniziativa attraverso i loro canali di comunicazione. Questi includono fondazioni (es. Open Research Founders Group e Mozilla), biblioteche (es. British Library e California Digital Library), progetti (es. Hypothes.is e OpenAIRE), aziende (es. ScienceOpen e Figshare), associazioni (es. ISSI e SPARC) e istituti di ricerca (es. Centre for Science and Technology Studies e Allen Institute for Artificial Intelligence).

Ad oggi, più di 20 milioni di articoli depositati in Crossref rilasciano le liste di riferimenti bibliografici liberamente accessibili attraverso le Crossref API. Questi articoli rappresentano il 51% di tutti quelli depositati in Crossref che includono anche le liste di riferimenti bibliografici. In altri termini, in un anno di lavoro più della metà di dati citazionali presenti in Crossref sono stati “liberati” e messi a disposizione del pubblico senza l’applicazione di alcuna licenza restrittiva che ne limiti il loro riutilizzo.

Lo scenario generale è indubbiamente più roseo di un anno fa. Nonostante una significativa svolta nell’apertura dei dati citazionali disponibili, rimangono ancora dei nodi irrisolti. Tra i 20 editori che vantano il maggior numero di dati citazionali depositati in Crossref, 5 si sono finora rifiutati di dare pubblico accesso a questi dati attraverso la piattaforma, ovvero: Elsevier, IEEE, Wolters Kluwer Health, IOP Publishing, ACS – detentori di una grossa fetta del rimanente 49% dei dati citazionali non pubblici in Crossref. Quello che più colpisce non sono tanto i due editori presenti in questa lista, uno dei quali (Elsevier) ricopre il doppio ruolo di editore e di service provider di dati citazionali (Scopus), ma piuttosto le 3 società accademiche che dovrebbero essere, quanto meno, simpatetiche con la causa della libera circolazione e divulgazione di materiale accademico di qualunque genere, inclusi i dati citazionali.

I dati liberati da I4OC, oltre ad aver avuto una notevole copertura mediatica da parte di molte testate accademiche e giornalistiche negli ultimi 12 mesi, hanno permesso la nascita e/o estensione di servizi (l’integrazione delle citazioni aperte in Europe PMC), software (Scholia e la nuova versione di VOSViewer), eventi (il Workshop on Open Citations che si terrà a Bologna dal 3 al 5 settembre), collezioni aperte al riuso di dati (l’OpenCitations Corpus), e aziende (ScienceOpen e Dimensions) che prima non erano auspicabili.

L’obiettivo imminente dell’iniziativa è riuscire ad ottenere una copertura completa dei dati citazionali liberamente accessibili su Crossref. Ciò è possibile soltanto se tutti gli attori coinvolti nel dominio accademico – editor-in-chief di riviste i cui riferimenti bibliografici non sono ancora pubblici su Crossref, aziende, fondazioni, singoli ricercatori, bibliotecari, e chiunque sia simpatetico con la causa – cooperano sinergicamente, in modo da convincere gli editori estranei a questo movimento a rilasciare i loro dati citazionali senza restrizioni. In questo senso, I4OC non si propone come mero strumento di supporto tecnologico al movimento di apertura dei dati, ma vuole intraprendere tutte le iniziative necessarie a disseminare, raggiungere e garantire il suo fine ultimo: la necessità della scienza aperta a tutti.

Share this on WhatsApp

LASCIA UN COMMENTO Cancella la risposta

Questo sito utilizza Akismet per ridurre lo spam. Scopri come vengono elaborati i dati derivati dai commenti.