Studio delle proprietà di sequenze di DNA

Laurea in Ingegneria delle Telecomunicazioni

 

1.1 Genomic Signal Processing
E’ risaputo che molte delle scoperte scientifiche e tecnologiche che avverranno nel corso del XXI secolo dipenderanno in larga scala dall’essere in grado di processare e interpretare un’enorme quantità di dati.
In questi ultimi anni si è resa necessaria una capacità di gestione e catalogazione sempre maggiore che l’uomo non è più riuscito a garantire: di qui l’importanza del data processing, una nuova frontiera, un nuovo approccio informatico che permette di trattare studi ed esperimenti che generano grandi moli di dati.
Nel campo della genetica, ad esempio, settore di ricerca molto vasto e interdisciplinare che va dalla medicina alla biologia, dall’ingegneria all’agricoltura, sta nascendo un nuovo filone atto a gestire e sondare il libro della vita: il Genomic Signal Processing(GSP), il quale deriva dal Digital Signal Processing (DSP). Si tratta di una disciplina ingegneristica che studia il DNA come un segnale qualsiasi: il segnale genomico.
Considerando il ruolo fondamentale, giocato nella genetica, dai segnali di trascrizione, è naturale che la teoria del Signal Processing debba essere utilizzata per ottenere una comprensione sia della parte strutturale che di quella funzionale del fenomeno in questione.
L’obiettivo del GSP è quello di integrare la teoria e i metodi del SP con una globale comprensione della genomica funzionale e con particolare enfasi sulle regolazioni genomiche; in particolar modo abbraccia svariate tecniche di espressione come la scoperta, la predizione, la classificazione, il controllo e la modellizzazione statistica e dinamica delle reti di geni (gene networks).
Nello studio della genetica, il GSP è diventato una disciplina fondamentale checostituisce un modello strutturale basato su analisi e sintesi che sta alla base del rigore matematico ingegneristico [B.2].
Esempi di tecniche mutuate dall’Ingegneria delle Telecomunicazioni sono:
• Digital Signal Processing (sequence spectral analysis, filtering, prediction, image processing);
• Information theory(entropy, source coding, channel coding);
• Networks theory.
Nei capitoli che seguono ci occupiamo dell’analisi di sequenze di DNA mediante tecniche di Teoria dell’Informazione come misurazioni di entropia, numeri medi calcolati con gli algoritmi di Huffman e Lempel-Ziv applicati a sottosequenze individuate con il metodo della sliding window. Ricerchiamo sequenze ridondanti e periodiche ed infine eseguiamo un’analisi spettrale (Power Spectral Density) delle porzioni di DNA considerate. L’obiettivo è individuare le caratteristiche del segnale genetico, come ad esempio la delimitazione tra aree codificanti (che servono per costruire le proteine) e non codificanti.
Nei due paragrafi che seguono vengono introdotti il Progetto Genoma ed i concettidi base della genetica per fare un po’ di luce in questo nuovo campo di applicazione dell’ingegneria.

 

 

Scarica la tesi

http://www.matematicamente.it//tesi/Alberto-Studio_proprieta.pdf

 

Scarica la presentazione PowerPoint

http://www.matematicamente.it//tesi/Alberto-Studio.zip

 

Commenti

commenti