L’ornitorinco assomiglia a un canguro? Secondo il suo DNA potrebbe (cortesia S. Kraft).

 

C’è DNA umano anche dove non dovrebbe esserci.


Va bene: passi pure che un po’ di DNA dell’Uomo di Neanderthal sia presente nel nostro genoma. Ma che tracce del nostro DNA siano presenti in quello di batteri,piantepesci… beh, francamente è un po’ strano. Che cosa sta succedendo?

La prima notizia è stata giudicata fra le migliori scoperte scientifiche del 2010 dalla prestigiosa rivista “Science”. La seconda notizia difficilmente sarà ricordata come uno dei (tanti, speriamo) progressi scientifici del 2011, tuttavia rappresenta un fatto importante, che deve far riflettere. Nel primo caso, Svante Paabo, del Max Planck Institute for Evolutionary Anthropology di Lipsia, ha dimostrato che gli attuali Asiatici ed Europei condividono fino al 4 per cento del proprio DNA con gli antenati neanderthaliani. Nel secondo caso, Rachel J. O’Neill, biologa dell’Università del Connecticut, denuncia che ci sono sequenze di DNA dove effettivamente non dovrebbero esserci.

Il gruppo di O’Neill ha pubblicato un articolo sulla rivista “PLoS ONE” nel quale sostiene che il 18 per cento dei database genomici relativi a batteri, piante, pesci è contaminato da sequenze di DNA umano. I database in questione sono le banche dati di genomicaproteomica e altre informazioni relative al patrimonio genetico di diverse specie non appartenenti ai Primati. Siamo quindi nel campo applicativo dei bioinformatici, cioè gli smanettoni informatici della genomica. E parliamo di migliaia e migliaia di sequenze grezze di DNA, cioè il risultato diretto deisequenziamenti genetici prodotti da costosi strumenti di laboratorio. Queste sequenze grezze devono poi essere unite e verificate attraverso potenti algoritmi di calcolo per renderci (ragionevolmente) sicuri di ottenere alla fine il genomacompleto di un singolo organismo vivente. Questi programmi dovrebbero occuparsi anche di individuare e rimuovere le sequenze sbagliate, siano esse puri errori ocontaminazioni.

In pratica, secondo O’Neill, su 2.749 database genomici relativi a non-Primati ben 492 contengono sequenze di DNA umano. I database considerati non hanno ovviamente nulla a che vedere con la nostra specie, quindi le sequenze di DNA umano individuate rappresentano degli errori, frutto di contaminazioni. Le porzioni incriminate di DNA sono le sequenze AluY, abbondanti ma presenti solo nei genomi dei Primati. E ci sono dati genetici ancora più singolari: il genoma dell’ornitorinco contiene infatti sequenze che sembrerebbero provenire dal genoma di wallaby tammar, un piccolo marsupiale che non ha nulla a che spartire con l’ornitorinco salvo l’Australia come regione di provenienza.

Le contaminazioni sono solitamente causate da cellule della cute, dai capelli, dalla saliva che accidentalmente possono cadere all’interno delle provette contenenti i campioni da sequenziare. E’ quindi evidente il problema di individuare procedure di lavoro migliori all’interno dei laboratori, almeno quando si parla di contaminazioni con DNA umano. E che ci sia anche un problema a livello di gestione delle provette è testimoniato dal genoma dell’ornitorinco con qualche sequenza di wallaby tammar. Questo marsupiale non frequenta i laboratori di ricerca. Perciò la possibile spiegazione è che all’interno dei grossi istituti dove vengono condotti questi progetti di sequenziamento qualche volta possa accadere, per svariati motivi, che tracce di un campione si mischino per sbaglio con un altro.

Certamente i laboratori di genetica forense sono ben consci del problema delle contaminazioni da DNA e sanno come evitarle. Infatti con un errore nella manipolazione del campione biologico la “prova del DNA” può cambiare il destino di un processo. Invece non sembrano esserci lo stesso rigore e la stessa precisione nei centri che si dedicano alla ricerca di base. Il genetista Robert Waterston, dell’Università di Washington a Seattle, sostiene che la presenza di errori nelle sequenze grezze è in fondo ammissibile: infatti queste sono delle bozze genetiche che devono essere ancora corrette a livello informatico, come le bozze di un articolo che vanno rilette e ripulite dagli errori ortografici. Chiaramente diverso è il discorso delle contaminazioni da DNA umano. David Haussler, bioinformatico dell’Università della California a Santa Cruz, ritiene che non si possano impiegare tutte le precauzioni che solitamente si adottano nella genetica forense, perché i costi sarebbero troppo alti. E’ quindi più ragionevole ottimizzare gli algoritmi di analisi delle sequenze, per riuscire a “pulire” al meglio le sequenze grezze ottenute dagli strumenti di laboratorio.

Comunque c’è anche una buona notizia: tutti i 172 archivi relativi ai genomi deivirus influenzali analizzati da O’Neill sono risultati privi di errori. Questo è probabilmente dovuto ai protocolli molto severi che vengono adottati per la manipolazione degli agenti infettivi.

Il dibattito, talvolta acceso, fra scienziati con opinioni diverse fa parte del normale processo alla base della ricerca scientifica. Ne è un esempio il polverone sollevato dalla recente scoperta del batterio in grado di metabolizzare l’arsenico al posto del fosforo. Ben venga quindi una pronta risposta alla ricerca di Rachel J. O’Neill. Solo che in questo caso a far suonare “l’altra campana” non è un singolo ricercatore, ma direttamente il National Center for Biotechnology Information (NCBI) di Bethesda, nel Maryland: una delle istituzioni direttamente citate nell’articolo di O’Neill. L’NCBI gestisce diverse banche dati genetiche e sviluppa software per l’analisi dei dati. La risposta da parte dell’NCBI è stata molto dettagliata: riconosce che il problema esiste ma non ha proporzioni così vaste come invece sembra emergere dal lavoro di O’Neill. L’NCBI continua dichiarando che buona parte dei dati analizzati nell’articolo sono grezzi e quindi per definizione soggetti a errori. Infatti questi dati, prima di essere validati, devono essere sottoposti a rigidi controlli mediante software di analisi. Di questo devono essere consci tutti coloro che consultano le banche dati, e quindi anche O’Neill… sembra di leggere fra le righe del comunicato. Infatti la stessa NCBI sostiene di aver sviluppato, a partire dal marzo del 2008, una procedura per verificare le contaminazioni nei dati genetici di tutti gli organismi eucarioti.

Ora che cosa possiamo aspettarci? Magari una controrisposta di O’Neill? In ogni caso l’NCBI conclude il proprio comunicato dichiarandosi disponibile a essere contattata per qualunque domanda in merito.

(Roberto Insolia – Corriere del Ticino Web+)


Longo MS, O’Neill MJ, & O’Neill RJ (2011). Abundant human DNA contamination identified in non-primate genome databases. PloS one, 6 (2) PMID: 21358816