Dalla chimica alla biologia molecolare per esplorare il genoma

Profilo di una reazione di sequenza secondo il metodo Sanger. (Cortesia: Abizar)

La reazione polimerasica a catena e il sequenziamento del DNA sono tecniche di biologia molecolare. La chimica di queste tecniche ci consente oggi di conoscere il nostro DNA. Ma non è sufficiente a farci comprendere tutto.

Si parla molto di biologia molecolare, con significati e in contesti spesso diversi. Ma cos’è la biologia molecolare? La biologia molecolare è una branca della biologia che studia i meccanismi molecolari, alla base dell’attività cellulare di tutti gli organismi viventi. I primi attori di questa scena, immensa dal punto di vista applicativo e microscopica dal punto di vista cellulare, sono il DNA, l’RNA e le proteine.

Nel 1938 Warren Weaver, direttore della Rockefeller Foundation, per primo impiegò il termine “biologia molecolare”, riferendosi al connubio fra la fisica e la chimica che sta alla base della vita. Possiamo dire che ogni biologo molecolare, quando lavora sul bancone, fa un po’ di reazioni chimiche, magari senza saperne bene le formule… essendo probabilmente più interessato al DNA, alla sua sequenza, alle sue mutazioni. Oggi, con il termine “biologia molecolare” solitamente si fa riferimento ad una serie di tecniche, applicate essenzialmente in vitro, con le quali è possibile studiare il nostro genoma.

Quale reazione bio-chimica domina i banconi dei laboratori di biologia molecolare? La risposta non può che essere corale: la reazione polimerasica a catena, cioè la polymerase chain reaction, più brevemente PCR . La PCR è la tecnica per eccellenza alla base della biologia molecolare. Questa epocale invenzione, ad opera del biochimico americano Kary B. Mullis, ha rivoluzionato lo studio dei genomi. E’ infatti una reazione chimica in grado di produrre miliardi di copie assolutamente identiche di un qualsiasi frammento di DNA. Avere tanto DNA, soprattutto nella regione che interessa studiare, è infatti fondamentale per qualunque applicazione di biologia molecolare. “La PCR è la tecnologia scientifica più importante degli ultimi cento anni”, ha detto il genetista americano Mark Hughes, uno dei responsabili del Progetto Genoma Umano. Ben meritato quindi è il Premio Nobel per la Chimica conferito a Kary Mullis nel 1993.

Oggi sappiamo che il DNA, l’acido deossiribonucleico presente in ogni cellula vivente, ha una struttura a doppia elica. Il DNA è un polimero nel quale quattro differenti basi azotate, insieme ad uno zucchero e a un fosfato, formano i quattro deossiribonucleotidi, mattoni del DNA stesso.

Nella PCR, un enzima polimerasico legge il filamento di DNA stampo ed aggiunge (“polimerizza” dicono i biologi molecolari), passo dopo passo, un nucleotide omologo, creando un filamento copia del primo.


Ha ragione Mark Hughes, la PCR è assolutamente eccezionale! Tuttavia, c’è un altro aspetto da considerare. Di fatto questa reazione, nella sua estrema efficienza, produce (“amplifica” dicono i biologi molecolari)

La PCR è in grado di darci tantissimo ma non ci dice nulla (o quasi) di quello che fa per ottenerlo. C’è bisogno di una reazione chimica più paziente rispetto alla PCR, in cui sia possibile monitorare ogni passaggio, in cui sia possibile capire quale è il mattone-nucleotide che viene aggiunto.

Immaginiamo di sfruttare la chimica della PCR utilizzando, oltre ai soliti deossiribonucleotidi, una quinta molecola molto simile. Questo dideossinucleotide è però in grado di fermare la reazione di polimerizzazione. Potremo quindi generare frammenti di DNA con lunghezza diversa, perché interrotti in corrispondenza dell’incorporazione del dideossinucleotide. E’ questo il principio della reazione di sequenza secondo il metodo chimico dei terminatori di catena, messo a punto da Frederick Sanger nel 1977. Tre anni dopo egli ricevette il Premio Nobel per la Chimica.


Oggi, il sequenziamento secondo Sanger è ancora usato in moltissimi laboratori. E questo non è poco, a fronte della velocità di rinnovamento tecnologico che si respira nel campo della biologia molecolare. La reazione chimica di Sanger è infatti una reazione performante. Altamente performante. Negli ultimi 30 anni, l’applicazione del sequenziamento secondo Sanger è stato di fatto alla base dei progetti di sequenziamento di interi genomi in diversi organismi.

Il Progetto Genoma Umano, iniziato nel 1986, ha portato nel 2001 alla stesura di una prima bozza dell’intero patrimonio genetico di Homo sapiens. Nel 2003 le due più importanti riviste scientifiche al mondo, l’inglese Nature e l’americana Science, hanno poi pubblicato una sequenza altamente accurata del nostro genoma.

Oggi sappiamo che il DNA umano è formato da circa 3 miliardi di basi: quattro molecole diverse messe in fila per circa 2 metri di lunghezza e impacchettate dentro il nucleo di ogni nostra cellula. Solo il 2% circa di questo DNA è rappresentato da geni, cioè da porzioni realmente codificanti. La comparazione dei genomi di individui diversi ha poi evidenziato come essi siano identici per oltre il 99%. Quindi solo in una piccolissima parte del nostro genoma sembra risiedere tutta la variabilità genetica della specie umana.

Questa variabilità è rappresentata sia dalle varianti più frequenti, i polimorfismi, che da più rare mutazioni potenzialmente responsabili di malattie ereditarie. I polimorfismi, detti SNPs (single nucleotide polymorphisms) sono singole basi del DNA, a livello delle quali gli individui possono differire gli uni dagli altri. All’interno del nostro genoma, un polimorfismo è presente circa ogni 1000 basi di DNA.

I polimorfismi, indagati dal 2002 con il Progetto HapMap, sono oggi diventati un potente strumento per comprendere le basi genetiche di molte patologie. Ben presto è apparso evidente come fosse importante avere sempre più informazioni sui polimorfismi umani. Per fare questo, l’approccio più intuitivo ma comunque tecnologicamente molto impegnativo è stato quello di analizzare moltissimi individui, sia sani che malati, per vedere come si distribuivano i loro polimorfismi. Attraverso complessi calcoli statistici, gli SNPs che risultavano legati ad una precisa malattia potevano suggerire la presenza di varianti genetiche, vicine nel DNA, realmente responsabili della patologia.

La chimica del sequenziamento viene messa da parte. Si ritorna a sfruttare l’elevatissima specificità della PCR per indagare, attraverso micro-chip, oltre 500.000 polimorfismi diversi nel DNA di migliaia di individui. Sono questi gli studi di associazione su larga scala, detti genome wide association studies (GWAS). Attraverso i GWAS, è stato possibile individuare dei polimorfismi nel nostro DNA statisticamente associati a malattie quali il diabete, l’ipertensione, l’infarto del miocardio. E’ stato cioè dimostrato come specifiche varianti genetiche comuni possano aumentare il rischio di sviluppare una data malattia.

La chimica del sequenziamento torna alla ribalta con il Progetto 1.000 Genomi. E’ questo un progetto internazionale avviato nel 2008 che ha lo scopo, attraverso il sequenziamento di tanti genomi, di individuare un numero sempre maggiore di polimorfismi. Soprattutto i polimorfismi a bassa frequenza, quelli cioè un po’ più rari, ma potenzialmente non meno significativi.

Al momento, è stato completato il sequenziamento dell’intero genoma di 179 individui non imparentati, provenienti da quattro popolazioni differenti, oltre al sequenziamento delle sole porzioni di DNA codificanti (esoni) in altre 697 persone. Il progetto prevede anche il sequenziamento completo dei genomi di alcuni gruppi familiari.

Sono stati individuati circa 15 milioni di polimorfismi, un milione di piccole inserzioni o delezioni (variazioni genetiche per perdita o aggiunta di poche basi), oltre a 20 mila varianti genetiche di tipo strutturale mai identificate prima. Confrontando i genomi all’interno delle famiglie è poi emerso come ogni figlio sia portatore di circa 60 varianti genetiche non presenti nei genitori. Cioè 60 potenziali occasioni per acquisire nuovi caratteri fenotipici, vantaggiosi o meno. Chiaramente i figli assomiglieranno sempre ai genitori, quindi il carattere fenotipico non va inteso in senso macroscopico. In questo caso potrebbe essere legato al guadagno o alla perdita di qualche funzione, a livello cellulare e molecolare.

Attraverso la chimica applicata alla biologia molecolare e con le più avanzate tecnologie oggi conosciamo esattamente la successione delle basi nel nostro DNA.

A cosa può portare questa immensa informazione genetica a nostra disposizione? In realtà gli obiettivi sono piuttosto chiari. Potremo capire i meccanismi molecolari e cellulari alla base di molte malattie genetiche. Potremo anche individuare specifici bersagli cellulari per nuove molecole farmacologiche. Se usate con giudizio, le conoscenze che via via acquisiremo ci permetteranno di migliore la nostra vita.

Tuttavia, si è consapevoli di quanto la strada sia lunga. Il Progetto Genoma Umano ci ha offerto tantissime informazioni genetiche ma poche, reali applicazioni, almeno fino ad ora. Ci ha dimostrato infatti che la precisa lettura del nostro DNA non è sufficiente per capire fino in fondo i nostri meccanismi cellulari, siano essi fisiologici che patologici.

E’ comunque certo che la chimica, magari con qualche nuova tecnologia, sarà ancora protagonista. Sarà ancora motore dei prossimi avanzamenti della conoscenza scientifica a livello molecolare e genetico.

Annunci