Un’analisi pubblicata nel 2025 sulla diminuzione della copertura dei metadati di affiliazione nell’infrastruttura aperta OpenAlex, basata su oltre 13 milioni di articoli pubblicati da grandi editori commerciali tra il 2018 e il 2025, conclude che il fenomeno è “probabilmente” dovuto al fatto che alcuni editori non hanno fornito a Crossref metadati di affiliazione sufficienti e vengono citati esplicitamente editori come Elsevier e Springer Nature. Tradotto: non basta dire che “mancano i dati”; bisogna ammettere che spesso qualcuno ha scelto di non depositarli in modo completo. Il problema, allora, non è semplicemente che “OpenAlex ha buchi”. Il problema è che una parte rilevante dell’ecosistema editoriale internazionale continua a beneficiare dell’uso pubblico dei risultati della ricerca senza restituire al pubblico metadati completi, aggiornati e interoperabili. E quando gli strumenti aperti fanno emergere questa carenza, il bersaglio polemico diventa il tool che la mostra, non l’attore che la produce. È il solito gioco: privatizzare il controllo dell’informazione e socializzare i costi dell’opacità.

Se oggi si prova a costruire una lettura critica della comunicazione scientifica usando infrastrutture aperte, ci si imbatte subito in due strumenti interessanti: Journal Trends e Author Trends di cui si parla anche in un recente articolo su Nature. Il primo è un tool che visualizza, per una rivista, l’andamento delle pubblicazioni nel tempo, le distribuzioni per paese, istituzione e autore, e aggiunge segnali di integrità come i flag del Problematic Paper Screener (PPS) e lo stato di indicizzazione o delisting in Scopus. Il secondo fa qualcosa di analogo sul versante dei singoli ricercatori: mostra statistiche di pubblicazione anno per anno, citazioni, collaborazioni, geografia, temi, retractions e altri segnali di rischio, sempre a partire da dati aperti (OpenAlex). Entrambi si presentano, correttamente, come strumenti di visualizzazione e analisi costruiti su dati aperti, non come oracoli infallibili.

Ed è proprio qui che comincia il problema vero. Perché quando questi strumenti mostrano buchi, coperture incomplete o metadati mancanti, la reazione più comune è sempre la stessa: “vedete? gli strumenti aperti non sono affidabili”. Il punto, però, non è solo che il dato manca. Il punto è capire perché manca.

Su questo la letteratura recente è molto meno indulgente di quanto non siano molti commentatori. Un’analisi pubblicata nel 2025 sulla diminuzione della copertura dei metadati di affiliazione in OpenAlex, basata su oltre 13 milioni di articoli pubblicati da grandi editori commerciali tra il 2018 e il 2025, conclude che il fenomeno è “probabilmente” dovuto al fatto che alcuni editori non hanno fornito a Crossref metadati di affiliazione sufficienti, pur segnalando anche possibili problemi tecnici nella transizione a una nuova versione di OpenAlex. Nel testo vengono citati esplicitamente editori come Elsevier e Springer Nature. Dunque: non solo limiti dell’infrastruttura aperta, ma anche — e in modo rilevante — limiti nella condivisione a monte dei metadati da parte degli editori.

Questo punto è essenziale, perché ribalta una narrazione diventata quasi automatica. Gli editori raccolgono informazioni sulle affiliazioni, sugli autori, sui finanziamenti, sulle versioni, sui DOI e sugli apparati editoriali nei loro flussi di submission e produzione. Eppure, quando si tratta di restituire queste informazioni in forma aperta, interoperabile e riutilizzabile, la completezza evapora. Non sempre, certo. Non allo stesso modo per tutti. Ma abbastanza spesso da produrre effetti strutturali sui sistemi che poi quei metadati dovrebbero usare per il monitoraggio, la valutazione e l’analisi. Uno studio del 2026 su PLOS One osserva che è ampiamente noto come molti editori rendano disponibili alcuni metadati ma non altri, e mostra che editori che usano lo stesso sistema di submission possono avere livelli di completezza molto diversi: segno che il problema non è soltanto tecnologico e che “sono in gioco anche altre considerazioni”. Tradotto: non basta dire che “mancano i dati”; bisogna ammettere che spesso qualcuno ha scelto di non depositarli in modo completo.

A rendere il quadro ancora più istruttivo è la posizione di Crossref* stessa. Nella documentazione ufficiale, Crossref ricorda ai propri membri che far parte della comunità significa condividere i metadati con il mondo della ricerca, che i record devono essere mantenuti “clean, complete and up-to-date”, che è possibile correggere omissioni o errori e che non ci sono costi per aggiornare i metadati dopo la registrazione iniziale (basta volerlo). Raccomanda inoltre di depositare metadati ricchi e di completare anche i record retrospettivi. Insomma: la scusa dell’inevitabilità tecnica regge poco. Se i metadati mancano, non è perché il sistema aperto non li vuole; molto spesso è perché chi controlla i contenuti non li ha depositati, non li ha aggiornati o non li ha resi disponibili in forma adeguata.

La stessa documentazione di OpenAlex è sorprendentemente esplicita. Quando un’istituzione non trova le proprie pubblicazioni correttamente collegate, OpenAlex indica tra le cause più comuni il fatto che i metadati di affiliazione nel record dell’opera siano inaccurati o incompleti, e suggerisce di farlo presente all’editore, che potrebbe dover aggiornare i record registrati presso un’agenzia DOI come Crossref. È un’ammissione importante: il problema dei metadati mancanti non nasce nel momento in cui OpenAlex li usa, ma in quello in cui la filiera editoriale li deposita male, parzialmente o non li deposita affatto.

A questo punto diventa più chiaro anche il valore reale di Journal Trends e Author Trends. Non sono interessanti soltanto perché producono grafici eleganti o aggiungono segnali di integrità. Sono interessanti perché rendono visibile il non detto. Journal Trends mostra che una rivista può avere una quantità significativa di articoli per cui i dati geografici sono assenti, e proprio per questo ha introdotto una categoria “unknown” per evitare che il grafico simuli una copertura completa che non esiste. Author Trends, dal canto suo, visualizza per i ricercatori non solo citazioni e collaborazioni, ma anche retractions, segnali provenienti dal Problematic Paper Screener e pubblicazioni in riviste dismesse da Scopus, presentandosi come un tool beta che dipende dai dati di OpenAlex e che mette in guardia sugli errori di attribuzione dei profili. In entrambi i casi il merito non è l’illusione della perfezione, ma la trasparenza sull’imperfezione.

Ed è proprio questa trasparenza a risultare scomoda. Perché per anni il sistema della valutazione ha tollerato, e spesso interiorizzato, l’idea che i database commerciali fossero una sorta di natura fatta sistema: opachi, costosi, poco contestabili, ma considerati affidabili per definizione. Le infrastrutture aperte come OpenAlex spezzano questo automatismo non perché siano magicamente prive di problemi, ma perché espongono i problemi alla vista. Uno studio del 2024 su otto banche dati accademiche aperte rileva che i database di terza parte, tra cui OpenAlex, hanno in generale più metadati e una maggiore completezza rispetto ai motori accademici, ma soffrono anche di perdite di informazione dovute all’integrazione di fonti diverse. Questo non è un argomento contro l’open; è un argomento contro la favola secondo cui si possa fare valutazione seria ignorando come i dati vengono prodotti, depositati e trasformati.

Il problema, allora, non è semplicemente che “OpenAlex ha buchi”. Il problema è che una parte rilevante dell’ecosistema editoriale internazionale continua a beneficiare dell’uso pubblico dei risultati della ricerca senza restituire al pubblico metadati completi, aggiornati e interoperabili. E quando gli strumenti aperti fanno emergere questa carenza, il bersaglio polemico diventa il tool che la mostra, non l’attore che la produce. È il solito gioco: privatizzare il controllo dell’informazione e socializzare i costi dell’opacità.

Bisognerebbe dirlo con chiarezza: l’assenza di metadati non è una fatalità naturale del mondo aperto; è spesso il prodotto di una scelta, di una trascuratezza o di una gerarchia di interessi dentro la filiera editoriale. Journal Trends e Author Trends non risolvono questo problema. Ma hanno almeno il merito di renderlo finalmente visibile. E in un sistema abituato a chiamare “qualità” ciò che in realtà è solo opacità ben confezionata, non è poco

* Crossref è un’infrastruttura no‑profit che raccoglie e collega i metadati delle pubblicazioni scientifiche e assegna i DOI per renderle identificabili, citabili e interoperabili