BIOINFORMATICA
cod. 1004403

Anno accademico 2019/20
2° anno di corso - Primo semestre
Docente
Settore scientifico disciplinare
Biochimica (BIO/10)
Field
Attività formative affini o integrative
Tipologia attività formativa
Affine/Integrativa
60 ore
di attività frontali
6 crediti
sede: PARMA
insegnamento
in ITALIANO

Obiettivi formativi

Conoscenze e capacità di comprendere: Il corso ha lo scopo di far acquisire agli studenti le conoscenze teoriche essenziali per la comprensione di dati e informazioni derivanti da analisi bioinformatiche.

Capacità di applicare conoscenze: attraverso esercitazioni pratiche sotto la guida del docente, gli studenti avranno la possibilità di acquisire le competenze necessarie per svolgere in prima persona analisi di dati biologici attraverso l’uso del computer.

Autonomia di giudizio: Durante il corso gli studenti saranno addestrati ad interpretare i risultati delle analisi al computer ed a valutare il grado di affidabilità delle evidenze bioinformatiche.

Capacità comunicative: attraverso esempi, verrà illustrato agli studenti come comunicare in un elaborato scritto (costituito da testo e immagini) risultati e interpretazioni di un’analisi bioinformatica.

Prerequisiti

Conoscenze di base sulle macromolecole biologiche e dei fondamenti di biochimca e biologia molecolare. Competenze nell’utilizzo del calcolatore e della navigazione in Internet.

Contenuti dell'insegnamento

Nella prima parte del corso verranno illustrati i meccanismi molecolari più rilevanti per la comprensione dell’analisi bioinformatica di DNA e proteine, con particolare riferimento alle modalità di evoluzione delle molecole e dell’informazione biologica.

Saranno quindi discussi i principi di funzionamento delle principali tecniche di analisi bioinformatica, come il confronto di sequenze, la ricerca di omologia, l’analisi filogenetica e la predizione di struttura e funzione.

Verranno quindi illustrate le tecniche bioinformatiche per l’analisi dei dati biologici prodotti su larga scala, con particolare riferimento all’interpretazione dell’informazione presente nei genomi completi.

Programma esteso

Argomenti del corso:
Introduzione alle sequenze e strutture biologiche, gestione e analisi dei dati, dogma centrale, storia evolutiva delle sequenze, genoma. Evoluzione di DNA e proteine: Teoria neutrale, omologia, ortologia, paralogia, somiglianza, metriche per il confronto sequenze, PAM, divergenza, orologio molecolare, evoluzione accelerata, evoluzione convergente.
Predizioni biochimiche: proprieta biochimiche prevedibili, motivi e segnali, evoluzione convergente di motivi, Prosite, ricerca di patterns, segnali di degradazione, PEST, protein sorting, sequenze segnale, sequenze di ancoraggio, glicosilazione, fosforilazione, ProtParam.
Struttura di RNA e proteine: Tipi di strutture secondarie dell'RNA, hairpin, bulge, loop, pseudoknots, Minimum free energy, stacking energy, analisi di covarianza, predizione di strutture secondarie, accessibilita al solvente, classi, architetture e ripiegamenti, homology modelling, threading, Coiled coils, proteine di membrana, topologia transmembrana. Allineamento a coppie: allineamento combinatoriale, Dot plots, sequenze ripetute, algoritmo, programmazione dinamica, Needleman-Wunsh, Smith-Waterman, significatività. Allineamento multiplo: Usi dell'allineamento multiplo, Allineamento progressivo, Allineamento iterativo, profili, hidden markov models, Pfam, Sequence logos. Banche Dati e ricerca di omologia: entry, GenBank, SwissProt, PDB, Expressed Sequence Tags, IMAGE, SRS, Entrez, FASTA, BLAST, PSI-BLAST, significativita, sensibilita, selettivita, copertura.
Analisi filogenetica: tree of life, nomenclatura degli alberi filogenetici, cladogrammi, filogrammi, alberi ultrametrici, alberi rooted e unrooted, distanze aminoacidiche e nucleotidiche, UPGMA, Neighbour-joining, maximum likelihood, parsimonia, bootstrap.
Reti biologiche: reti random e reti regolari; coefficiente di clustering, lunghezza media del cammino, modello di reti a “mondo piccolo”, modello di reti a invarianza di scala. Vari tipi di dati rappresentati attraverso reti biologiche.
Genomi: mappe fisiche e mappe genetiche, DNA fingerprinting, BAC, metodi di sequenziamento genomico: ?clone by clone e WGS, assemblaggio, contig, scaffold, sequenze draft e finished, ORF, gene-finding. Genomica com parativa. Associazioni funzionali tra proteine dedotte da genomi completi.

Bibliografia

Bioinformatica, Pascarella e Paiardini, Zanichelli, 2010
Bioinformatics: Sequence and Genome analysis. D. W. Mount, CSHL Press, 2001
Protein Evolution. L. Patty, Blackwell Science, 1999

Metodi didattici

Nelle lezioni teoriche verranno illustrate le basi dell’approccio bioinformatico ai problemi biologici. Saranno discussi i principi delle analisi computazionali di sequenze di DNA e proteine e del funzionamento dei principali programmi software utilizzati in ambito bioinformatico. Particolare enfasi verrà data al significato biologico delle analisi computazionali, con l’illustrazione dei processi e meccanismi molecolari più rilevanti per la bioinformatica.

Le lezioni teoriche saranno alternate con esercitazioni pratiche svolte in aula informatica. Nelle esercitazioni gli studenti saranno addestrati all’uso delle tecniche bioinformatiche per la soluzione di problemi biologici. Alcuni esercizi saranno svolti insieme al docente , altri saranno presentati come problemi che gli studenti dovranno affrontare in modo autonomo grazie agli strumenti forniti in precedenza con le lezioni teoriche e pratiche.

Modalità verifica apprendimento

Durante le esercitazioni pratiche gli studenti presenteranno soluzioni scritte ai problemi bioinformatici proposti. Un apposito software consente al docente di verificare in tempo reale tali soluzioni.

Al termine del corso verrà assegnata a ciascun studente l’analisi di una diversa porzione genomica codificante per una proteina non caratterizzata. Gli studenti dovranno svolgere in modo autonomo tale analisi e presentare una relazione scritta dei risultati ottenuti in forma di articolo scientifico.

La relazione sarà valutata dal docente e discussa durante l’esame orale. In particolare, Il docente valuterà la capacità dello studente di applicare conoscenze bioinformatiche, la correttezza delle interpretazioni e la capacità di comunicare i risultati ottenuti. L’esame orale sarà anche rivolto a determinare le conoscenze dello studente sui fondamenti della materia.

Altre informazioni

Il corso si avvale di un’aula per le esercitazioni pratiche attrezzata con 35 postazioni di calcolo collegate ad Internet e dotate dei programmi di analisi bioinformatica discussi durante il corso