Obiettivi formativi
Il corso si propone di fornire agli studenti le conoscenze basilari di biofisica e chimica computazionale per la modellazione di sistemi ed interazioni biologiche.
Particolare attenzione verrá data alla simulazione della dinamica delle proteine, alla predizione dell’energia d’interazione in complessi biologici, ed alle tecniche per l’individuazione di potenziali composti attivi nei confronti di target farmalogicamente interessanti. Le esercitazioni di laboratorio permetteranno agli studenti di applicare i concetti appresi durante le lezioni teoriche.
Prerequisiti
Conoscenze di base di fisica, chimica e biochimica.
Contenuti dell'insegnamento
Struttura delle proteine e relazione struttura attività. Le interazioni nei sistemi biologici. Folding ed effetto idrofobico. Metodi sperimentali per la determinazione della struttura tridimensionale delle proteine: diffrazione a raggi X e NMR. Protein Data Bank ed Electron Density Server. Meccanica molecolare e force fields: MM2, Amber, CHARMm, OPLS. Definizione di atom type ed atom name. Software di grafica molecolare. Allineamento di sequenza e similarità di sequenza. BLAST e PSIBLAST. Metodologie per la predizione della struttura tridimensionale delle proteine. Simple models, stepwise models and global models (MODELLER, SwissModel). Threading methods e calcoli ab initio. Dinamica molecolare. Parametrizzazione, file di topologia, minimizzazione, equilibrazione ed analisi delle traiettorie. Dinamica essenziale, autovalori ed autovettori. Tecniche di “accelerated Molecular Dynamics”. Energia d’interazione nei complessi biologici. Differenti ruoli delle molecole d’acqua e relativo contributo energetico. Modellazione dello stato di protonazione di residui ionizzabili nei siti di legame di complessi proteina-ligando. Ligand-based drug design. Similaritá chimica, descrittori molecolari e modelli QSAR, PCA e PLS. 3D-QSAR. Similaritá tridimensionale. Comparative Molecular Field Analysis (CoMFA). Structure-based drug design. Chimica combinatoriale. Algoritmi di docking e di scoring. Principali problemi e limiti delle funzioni di scoring. Librerie di composti, il database ZINC. Ligand-based e structure-based virtual screening. Consensus scoring.
ESERCITAZIONI DI LABORATORIO: Analisi di strutture proteiche tramite software di grafica molecolare. Costruzione di un modello per omologia e simulazioni di dinamica molecolare.
Programma esteso
LEZIONI FRONTALI:
STRUTTURA DELLE PROTEINE: Struttura primaria, secondaria, terziaria e quaternaria. Strutture supersecondarie e domini. Relazione fra struttura ed attività delle proteine. Interazioni di legame e di non-legame. Ponti salini, legami idrogeno ed interazioni di van der Waals. Il folding e l’effetto idrofobico. Il ruolo strutturale ed energetico delle molecole d’acqua. Metodi sperimentali per la determinazione della struttura tridimensionale delle proteine: diffrazione a raggi X e NMR. Parametri per la valutazione della qualità delle strutture cristallografiche: risoluzione, R factor e B factor. Protein Data Bank ed Electron Density Server.
MECCANICA MOLECOLARE & FORCE FIELDS: Differenze fra la meccanica molecolare e gli approcci quantomeccanici. Force fields, energia potenziale delle molecole biologiche e minimizzazione dell’energia. Calcolo dell’energia potenziale: contributi di legame (stretching bending e torsionale) e di non-legame (interazioni elettrostatiche e di van der Waals). Esempi di alcuni noti force fields: MM2, Amber, CHARMm, OPLS. Atom types e atom names. Esempi di programmi di grafica molecolare: Sybyl, PyMOL, VMD.
PREDIZIONE DELLA STRUTTURA TRIDIMENSIONALE DELLE PROTEINE: Similaritá ed allineamento di sequenza. BLAST e PSIBLAST. Modelli semplici, stepwise e globali. Predizione dell’architettura delle catene laterali, dei loop e comparative protein modeling. Software di homology modeling (MODELLER, SwissModel) ed esempi di modellazione. Metodi threading e calcoli ab initio.
DINAMICA E FLESSIBILITÁ DELLE PROTEINE: Proteine come sistemi biologici flessibili ed in costante movimento. Scala temporale degli eventi biologici. Approcci di dinamica molecolare classica e force fields. Costruzione di un file di topologia, minimizzazione, equilibrazione e dinamica molecolare. Analisi delle traiettorie risultanti. Analisi delle cavità interne alla matrice proteica (PASS, FPOCKET, GRID-MD) ed esempi relativi. Dinamica essenziale, autovalori ed auto vettori. Tecniche di “accelerated Molecular Dynamics”: modified potential (umbrella sampling), modified sampling (LES, REMD), modified dynamics (SHAKE algorithm, coarse-grained models).
LE INTERAZIONI BIOLOGICHE: Le interazioni biologie e l’energia d’interazione, complessi proteina-ligando, proteina-DNA, proteina-proteina e proteina-acqua.
PROTEINE, ACQUA E STATO DI IONIZZAZIONE: Differenti ruoli delle molecole d’acqua, acqua di solvatazione, acque in cavità e nei siti di legame. Molecole d’acqua catalitiche ed acque a ponte in grado di mediare il riconoscimento fra proteine e ligandi. Programmi per calcolare il contibuto energetico del solvente. Importanza di riprodurre accuratamente lo stato di ionizzazione di ligandi e residui del sito attivo. Il caso dell’HIV-1 proteasi.
DRUG DESIGN: Ligand-based drug design. Descrittori e proprietà molecolari. Idrofobicitá, polarizzabilitá, fattori elettronici e sterici. Modelli QSAR. Predizione dell’attivitá di nuovi composti tramite modelli QSAR: PCA e PLS. 3D-QSAR. Similaritá tridimensionale. Comparative Molecular Field Analysis (CoMFA).
Structure-based drug design. Chemoinformatica. Chimica combinatoriale. Classificazione degli algoritmi di docking. Point complementarity methods, systematic search, fragment-based methods, Monte Carlo, genetic algorithms, MD approaches, Tabú searches. Algoritmi di scoring: metodi basati su force field, funzioni empiriche e metodi knowledge-based. Il force field HINT. Problemi e limiti delle funzioni di scoring.
VIRTUAL SCREENING: Librerie di composti. Il database ZINC. Creazione di un database di composti per analisi di virtual screening. Ligand-based e structure-based virtual screening. Creazione di un modello farmacoforico. Screening, docking e consensus scoring. Il software FLAP.
ESERCITAZIONI DI LABORATORIO.
Analisi della struttura di un complesso proteina-ligando tramite il software PyMOL. Tecniche di rappresentazione e generazione di immagini. Creazione del modello tridimensionale di un’emoglobina di pianta tramite il programma di homology modelling MODELLER. Brevi simulazioni di dinamica con il programma NAMD. Generazione di un file di topologia, minimizzazione equilibrazione e dinamica.
Bibliografia
A.R. Leach. Molecular Modelling: Principles and Applications. Prentice Hall.
T. Lengauer. Bioinformatics – From Genomes to Drugs. WILEY-VCH.
Appunti delle lezioni.
Metodi didattici
Lezioni frontali ed esercitazioni di laboratorio.
Modalità verifica apprendimento
Relazione scritta concernente la risoluzione di problemi affrontati durante le lezioni teoriche e le esercitazioni di laboratorio. Discussione orale della relazione.