Negli ultimi anni si è assistito al fenomeno dell’aumento esponenziale del numero degli autori nelle pubblicazioni scientifiche. La presenza di grandi collaborazioni internazionali è senza dubbio un fattore positivo (e talvolta necessario) per lo sviluppo delle ricerche in alcune aree scientifiche (ad esempio la fisica), ma ciò ha da un lato sollevato il problema della authorship, e di cosa significhi essere un autore all’epoca delle grandi collaborazioni, dall’altro ha anche posto la questione di quale possa essere il reale contributo portato da un autore di 40 lavori in un anno. L’attribuzione di un lavoro ad un autore segue spesso percorsi diversi da quelli del credito e, oltre a chi viene ospitato “per cortesia” nella lista degli autori non è raro nemmeno il caso di autori “fantasma”, non citati nella lista pur avendo contribuito in modo significativo ad un lavoro scientifico di cui altri si prendono il credito.
“Piled Higher and Deeper” by Jorge Cham http://www.phdcomics.com
_____________________
Uno dei problemi maggiori quando si tratta di analizzare pubblicazioni a più autori è come calcolare il contributo dato da ciascuno. Questo non ha a che fare solo con l’etica della ricerca e quindi con il principio generale di attribuzione del merito a chi lo merita, ma ha anche una serie di ripercussioni su come vengono utilizzati gli indicatori bibliometrici in caso di pubblicazioni con più autori.
La soluzione più semplice ed economica (anche se ridondante) è quella di attribuire le citazioni di una pubblicazione a ciascuno dei suoi autori in maniera uguale (full counting).
Data una pubblicazione che ha 10 autori ed è stata citata 40 volte a ciascuno dei dieci autori saranno attribuite 40 citazioni. Questa è stata la modalità utilizzata ad esempio per la VQR 2004-2010 e anche per il calcolo della seconda mediana della ASN nei settori bibliometrici.
Una seconda modalità è quella di suddividere le citazioni per il numero degli autori (fractional counting). Nel caso della pubblicazione con 10 autori e 40 citazioni a ciascun autore vengono attribuite 4 citazioni.
Un’altra modalità (a dire il vero ormai in disuso) è quella di attribuire tutte le citazioni al primo autore o al corresponding author.
Una quarta modalità è quella di attribuire le citazioni in maniera pesata a seconda della posizione dell’autore nella stringa, ma ciò è valido solo per quelle aree in cui la posizione ha un significato (ci sono tuttavia ormai molti dubbi sul fatto che la posizione nella stringa autori rappresenti la traduzione del reale contributo di un autore a un articolo).
Ma quanti autori contribuiscono veramente alla stesura di un articolo e cosa significa essere autore nelle diverse discipline? E’ la domanda che si pone un recente articolo sul Wall Street Journal di R.L. Hotz ripreso da R. Holmes nel suo blog University Ranking Watch per denunciare le ripercussioni di quella che definisce come authorship inflation sui ranking internazionali.
In un certo senso è anche la domanda che si pone Phil Baty, editor dei THE World University Rankings. L’inclusione di lavori di ricerca con un numero elevato di autori mentre non muta la posizione di grandi università multidisciplinari, potrebbe avere effetti distorsivi sul posizionamento di istituzioni con un numero molto più esiguo di pubblicazioni. Per questo motivo THE ha deciso di escludere nella edizione 2015-16, i lavori di ricerca con più di 1000 autori, riconoscendo tuttavia l’imperfezione di questo tipo di soluzione.
Editori, ricercatori ed organismi che si occupano di come descrivere al meglio le attività di ricerca definendo gli standard (ad esempio CASRAI Consortia Advancing Standards in Research Administration Information) partendo da una situazione che non è molto differente da quella rappresentata nella vignetta si sono posti il problema di come descrivere chi ha fatto cosa all’interno di un lavoro di ricerca.
Con questa finalità è nato il progetto CRediT . Ormai sono molti gli editori che in fase di submission di un articolo chiedono di esplicitare chi ha fatto cosa e riportano questa informazione in calce all’articolo quando viene pubblicato. Alcuni fanno ciò secondo un format strutturato, altri richiedono invece semplicemente di compilare una stringa di testo. Affinché tuttavia questa informazione possa essere utilizzata per analisi su larga scala e per elaborazioni di grandi numeri di articoli è necessaria una standardizzazione della tassonomia utilizzata e la possibilità di esprimerla in un linguaggio leggibile dalle macchine.
Nel 2012, a seguito di un workshop organizzato da Wellcome Trust e Università di Harvard, che metteva insieme diversi stakeholders (editori, enti finanziatori della ricerca, ricercatori) interessati ad analizzare diversi modelli di attribuzione degli articoli, è stato avviato un progetto pilota per lo sviluppo di una tassonomia per la descrizione delle diverse attività che ruotano intorno alla stesura di un articolo [Ne avevamo parlato qui l’anno scorso].
I vantaggi dell’adozione di una simile tassonomia in termini di trasparenza, individuazione delle competenze e dei crediti anche per lo sviluppo di metriche applicabili a pubblicazioni con un numero elevato di autori (recentemente è stato pubblicato un articolo con 5000 autori) sono evidenti.
La tassonomia prevede 14 diversi tipi di attività:
#1 conceptualization
Ideas; formulation or evolution of overarching research goals and aims.
#2 methodology
Development or design of methodology; creation of models.
#3 software
Programming, software development; designing computer programs; implementation of the computer code and supporting algorithms; testing of existing code components.
#4 validation
Verification, whether as a part of the activity or separate, of the overall replication/reproducibility of results/experiments and other research outputs.
#5 formal analysis
Application of statistical, mathematical, computational, or other formal techniques to analyse or synthesize study data.
#6 investigation
Conducting a research and investigation process, specifically performing the experiments, or data/evidence collection.
#7 resources
Provision of study materials, reagents, materials, patients, laboratory samples, animals, instrumentation, computing resources, or other analysis tools.
#8 data curation
Management activities to annotate (produce metadata), scrub data and maintain research data (including software code, where it is necessary for interpreting the data itself) for initial use and later re-use.
#9 writing – original draft
Preparation, creation and/or presentation of the published work, specifically writing the initial draft (including substantive translation).
#10 writing – review & editing
Preparation, creation and/or presentation of the published work by those from the original research group, specifically critical review, commentary or revision – including pre- or post-publication stages.
#11 visualization
Preparation, creation and/or presentation of the published work, specifically visualization/data presentation.
#12 supervision
Oversight and leadership responsibility for the research activity planning and execution, including mentorship external to the core team.
#13 project administration
Management and coordination responsibility for the research activity planning and execution.
#14 funding acquisition
Acquisition of the financial support for the project leading to this publication.
Se questo dovesse divenire lo standard (come pare) varrebbe la pena di cominciare ad adottarlo anche nelle anagrafi locali e in quella nazionale (quando ci sarà).
Il problema (reale) di come giudicare i contributi a pubblicazioni con migliaia di autori e’ solo la punta dell’ iceberg. Ma è anche un ottimo test per qualsiasi “soluzione”. Attribuzioni dettagliate secondo tassonomie standard ? Ha veramente senso da varie decine di autori in su’ ? Ed e’ una soluzione “scalabile” fino alle migliaia di autori ?
.
Ma anche restando alla scala di pochi autori, siamo sicuri che il “rimedio” sia migliore del “male” ? O non sarebbe il caso di chiedersi il senso di questa pretesa di poter attribuire una misura precisa all’ autorship del singolo lavoro ? Mi sembra l’ n-esima degenerazione delle deviazioni della bibliometria, dove qui si dovrebbe parlare di autore-metria. Che pero’ e’ cosa molto diversa, molto più delicata e ancora più diversificata da micro-settore a micro-settore di altri parametri.
.
E soprattutto, quale dovrebbe essere l’ output ? La possibilità di attribuire in modo pesato i lavori alle strutture ? ai singoli ? valutare le capacità ed esperienza di ricerca dei singoli ? Pensando a vari esempi che conosco molto bene sono estremamente perplesso.
In ambito ASN 2012-2013 una scelta è già stata fatta: moltiplicare articoli e citazioni per il numero degli autori. E’ sicuramente una scelta che favorisce distorsioni e comportamenti opportunistici, sovrastimando la produzione scientifica dei ricercatori appartenenti a grossi gruppi.
La scorsa VQR invece attribuiva i lavori (e le citazioni) ad un singolo autore.
In ambito bibliometrico la scelta “meno sbagliata” mi pare quella di dividere lavori e citazioni per il numero di autori, egualmente pesati.
Solo una commissione “umana” potrà poi speculare sulla posizione dell’autore, reale contributo etc. Intanto si mette un freno alla proliferazione incontrollata degli autori. Deve essere chiaro che se aggiungo autori ad una pubblicazione, il merito (o demerito) di questa deve essere condiviso con un maggior numero di persone.
Attenzione però al criterio della divisione… Ci sono articoli da 100 e passa pagine che trattano in maniera molto esaustiva un argomento e articoli più ristretti. Il numero di autori di per sé non dice molto sulla quantità di lavoro svolta.
@gab La scorsa VQR invece attribuiva i lavori (e le citazioni) ad un singolo autore.
Nella scorsa VQR una pubblicazione poteva essere presentata una sola volta per ogni ateneo, ma il suo valore in termini di citazioni veniva esteso a tutti gli atenei che avevano presentato quella pubblicazione utilizzando quindi il metodo del full countig come per la ASN.
Interessanti sia il precedente di De Nicolao sia questo di Galimberti. Divertente e azzeccata la vignetta.
Rispetto ad altre epoche, vicine e lontane o lontanissime, e´ cambiato il concetto di autorialita´ (l´equivalente it. di authorship), la sua utilita o necessita e la sua etica. Copyright, valore commerciale, professionale, la sua trasformazione o utilizzazione per ottenere benefici economici, di carriera, morali (autorevolezza, fama personali, individuali) ne determinano le finalita.
I ghost collaboratori (ad es. aiutanti per le ricerche bibliografiche, per la correzione di bozze, per la compilazione di indici, revisori ecc.) e collaboratrici (mogli, figlie, sorelle, segretarie) esistono da quanto esiste l´autorialita. Altrimenti uno da solo non se la caverebbe, non avrebbe potuto scrivere e pubblicare un numero cosi alto di lavori, scientifici e non. Non sarebbero bastate h 24/24. Per non dire che certe volte, sentendo parlare di argomenti professionali in tono informale, uno si domanda se ha davanti a se´ la stessa persona, tanto e´ il divario tra scritto e parlato. Per via delle questioni dei benefici derivati e´ anche cambiato il concetto di autorialita´ dei beni cosiddetti immateriali tradizionali (saperi, fiabe, musica e simili). Il detentore del diritto autoriale, anche se solo a livello morale, e´ colui/colei che condivide con il ricercatore il proprio patrimonio culturale.
L’aggiunta del nome di chi non ha dato nessun contributo è sbagliato sia moralmente che eticamente e non si differenzia dal rubare, dal non pagare le tasse e da tutti quei comportamenti che riassume molto bene Irène Némirovsky nel libro “I fuochi dell’autunno” del 1957 e pubblicato di recente.
“Sì, ogni volta che un uomo ha detto: ‘Ma a me, in fin dei conti, che me ne importa…’, ogni volta che un uomo ha pensato: ‘Se non ne approfitto io lo farà qualcun altro’, ogni volta che una donna ha mormorato: ‘Tu sei uno sciocco… Guarda gli altri’, ogni volta, ogni singola volta… ciascuno di loro, senza saperlo, ha contribuito a recidere il filo di una vita innocente.
Si è sbagliato. Ma è anche sbagliato non porre nessun rimedio. Mettendo il numero degli autori a divisore si introduce un feedback semplice ed efficace. Se pur non ottimale, lo è certo di più che valutare (in automatico) un autore sulla base dell’articolo senza tenere minimamente in conto dei coautori.
Per questo potrebbe essere utile distinguere quale ruolo e responsabilta’ un ricercatore abbia avuto nella ideazione, progettazione e stesura di un lavoro di ricerca.
Molte riviste lo richiedono da tempo
A (s)proposito di autorialità, l’autore della vignetta che avete usato richiede esplicitamente di essere avvisato e citato:
Can I use one of your comics in my thesis/defense/website or graduate student newsletter?
We’ll be happy to grant you permission, but you MUST e-mail us at questions(at)phdcomics.com to let us know how and which strips you are using (by sending this email, you obtain official permission to use the images). In all cases, the strips must have the following text printed next to them:
“Piled Higher and Deeper” by Jorge Cham http://www.phdcomics.com
Provveduto. Grazie!
Qualsiasi pratica di valutazione innesca comportamenti adattativi. Questo è un aspetto fondamentale che tutti i valutatori dovrebbero sempre tenere a mente. Optare per dei criteri rispetto ad altri determinerà dei comportamenti atti a ottimizzare tali criteri da parte dei valutati. In quest’ottica il numero dei co-autori in una pubblicazione scientifica è un problema molto serio che provoca notevoli distorsioni nelle valutazioni e favorisce i papers di scambio (in particolare nei gruppi di ricerca numerosi). Il fatto che non tutti i co-autori abbiano contribuito con la stessa intensità è riconosciuto da tutti (in tutte le discipline scientifiche) ma non ammesso da tutti. Non ha senso nascondersi dietro ad un dito. Un lavoro non si esaurisce con una pubblicazione scientifica ma ci sono gli inviti a tenere seminari in varie università/istituzioni scientifiche, inviti ai congressi, premi etc. etc.
Nel campo biomedico che conosco, provate all’estero a ottenere una posizione in un’università di livello oppure un finanziamento avendo solo lavori da 20-30 autori e con il vostro nome sempre in mezzo al gruppone. Non si percorre molta strada.
Non credo che tutti i co-autori di un lavoro a 30 autori abbiano la conoscenza e la competenza per difenderlo nelle varie sedi. Se un’agenzia decide per una valutazione molto approfondita di un lavoro scientifico (impact factor della rivista e citazioni del lavoro) allora in modo altrettanto puntuale è necessario riconoscere il diverso contributo degli autori. Ci sono molte soluzioni possibili alcune molto semplici.
Fa un po’ impressione che la necessità di identificare chi ha “fatto” quale pezzo di un lavoro, introdotta in Italia anni fa, prima in ambiente umanistico (ricordo bene?), perché se no il lavoro veniva ignorato dalle commissioni (vero o bufala?), diventi una seria esigenza mondiale. Una collega francese, ricercatrice in ambiente biomedico, mi raccontava tempo fa che da loro si mettevano gli autori in ordine alfabetico, facendo scorrere la lettera di inizio da un lavoro all’altro, a rotazione. Altro che pesi per il primo l’ultimo, il penultimo, come si usa (ancora?) in Italy.
Meglio dividere, pesi uguali, meno peggio allora?
Il mio capo americano, trent’anni fa, era molto rigido sulla tendenza buonista di noi fellow italiani per aggiungere tutti. I criteri per l’autorship erano, per lui: chi ha avuto l’idea, chi ha fatto il lavoro, eventualmente chi ha apportato una metodica esterna ma indispensabile, chi ha scritto il lavoro. Stop.
Quindi: dividere in parti uguali come incentivo alla parsimonia.
Autorialità, dice Marinella più sopra: grazie, io sono sempre contento quando qualcuno tira fuori la parola italiana giusta, rimuovendo l’alibi ad usare quella inglese.
“I criteri per l’autorship erano, per lui: chi ha avuto l’idea, chi ha fatto il lavoro, eventualmente chi ha apportato una metodica esterna ma indispensabile, chi ha scritto il lavoro. Stop.”
Questi erano i criteri del suo capo americano. CASRAI essendo un organismo internazionale che si occupa della gestione delle informazioni riguardanti tutte le aree ha definito una tassonomia che possa comprendere tutte le tipologie di ricerche.