CHEMOMETRICS
cod. 1009232

Anno accademico 2021/22
2° anno di corso - Primo semestre
Docente
- Marina COCCHI
Settore scientifico disciplinare
Chimica analitica (CHIM/01)
Field
A scelta dello studente
Tipologia attività formativa
A scelta dello studente
48 ore
di attività frontali
6 crediti
sede: UNIMORE
insegnamento
in INGLESE

Obiettivi formativi

Il corso si propone di fornire gli elementi di base dell'analisi chemiometrica dei dati illustrando l'applicazione di tali metodiche nei seguenti contesti: ottimizzazione e disegno sperimentale; analisi esplorativa e statistica descrittiva; metodologie per il controllo di qualità di prodotto e processi industriali (QbD, PAT); gestione ed elaborazione dei dati da tecniche strumentali; aspetti applicativi dell'analisi di regressione e classificazione.
Al termine dell'insegnamento lo studente sarà in grado di:
- conoscere i metodi principali per l’analisi multivariata dei dati ad elevata dimensionalità e complessità e per la loro rappresentazione grafica;
- conoscere i principali contesti di applicazione della chemiometria nelle scienze sperimentali ed in ambito produttivo;
- riconoscere le diverse tipologie e struttura dei dati e le problematiche inerenti il preprocessing;
- saper utilizzare le principali metodologie di analisi multivariata dei dati nei contesti: analisi esplorativa, pianificazione degli esperimenti, classificazione e calibrazione multivariata.
- costruire modelli appropriati per l’analisi di insiemi di dati mediante esercitazioni pratiche svolte con tools commerciali e/o open source.
- validare e interpretare criticamente e validare i risultati ottenuti.
Per maggiore dettaglio sugli obiettivi formativi si rimanda alla sezione relativa ai risultati di apprendimento attesi.

Prerequisiti

Conoscenza della Chimica Generale e della Chimica Analitica per quanto concerne le basi del campionamento, incertezza di misura, una panoramica delle principali tecniche di analisi strumentali. Alcune nozioni di statistica univariata: concetto di distribuzione di una variabile, media, deviazione standard, correlazione tra coppie di variabili. Saper utilizzare un computer, un foglio elettronico e un editor di testo.

Contenuti dell'insegnamento

Introduzione alle tecniche di Disegno Sperimentale e Ottimizzazione: disegni di esplorazione e screening (disegni fattoriali completi e frazionari, pluckett and burman design); disegni di ottimizzazione (disegni centrali compositi); disegni d-ottimali; disegni per lo studio di formulazioni. Cenni all'elaborazione delle superfici di risposta. Diagnostica dei modelli attraverso l'analisi dei residui, normal probability plots.
Analisis esplorativa dei dati: metodi esplorativi univariati (istogrammi di frequenza, box-plot, grafici a dispersione); metodi esplorativi multivariati, definizione significato e calcolo delle variabili latenti. Analisi delle componenti Principali, PCA (definizione, derivazione, applicazione), rappresentazione grafica (scores, loadings, biplot); Analisi di cluster. Pretrattamento di dati multivariati: variabili puntuali, segnali strumentali, immagini.

Introduzione ai metodi multivariati per il controllo di processo: carte di controllo multivariate.

Introduzione alla spettroscopia NIR e pretrattamenti di segnali NIR. Cenni alle tecniche spettroscopiche implementabili at/on/in-line in contesto PAT.

Metodi di Regressione Uni e Multivariata: MLR, PCR e PLS. Calibrazione multivariata. Cenni ad alcuni metodi di ranking di variabili.

Introduzione ai metodi di classificazione: SIMCA, LDA, PLS-DA, differenze e contesto d'uso.

Ciascun argomento prevede l'integrazione con esercitazioni che prevedono l'analisi (e in qualche caso l'acquisizione) di data set legati a sperimentazione in ambito chimico. Softwares utilizzato: Open Office, PLS-Toolbox per MATLAB.

Programma esteso

- - -

Bibliografia

PLS toolbox Manual - Eigenvectors: www.eigenvector.com
-Several Tutorial papers suggested and furnished by the Teacher.
-K. Varmuza, P. Filzmoser, Introduction to multivariate statistical analysis in chemometrics, CRC press 2009. Print ISBN: 978-1-4200-5947-2 eBook ISBN:978-1-4200-5949-6
- Kim H. Esbensen, Brad Swarbrick, Frank Westad, Pat Whitcomb, Mark Anderson, Multivariate Data Analysis: An introduction to Multivariate Analysis, Process Analytical Technology and Quality by Design 6th Edition 2018. ISBN-13: 978-8269110401 ISBN-10: 826911040X.

Per approfondire:
- Trevor Hastie, Robert Tibshirani, Jerome Friedman, The elements of statistical learning. Data Mining, Inference, and Prediction. 2nd Ed. Springer Series in Statistics, Springer. Stanford, California 2008
- M. Forina Fondamenta di Chimica Analitica e-book:
www.sisnir.org/452/index.html (download at the bottom of the page)
- D.L. Massart and B. Vandeginste, Chemometrics: a textbook, Elsevier 1988, ISBN: 978-0-444-42660-4, www.sciencedirect.com/science/bookseries/09223487/23

Metodi didattici

Le lezioni si svolgeranno in presenza a meno di diverse indicazioni a causa della situazione sanitaria COVID19 che impongano l'erogazione a distanza. In tal caso saranno erogate mediante piattaforma teams in modalità sincrona.
Lezioni frontali con ausilio di presentazioni powerpoint. Esercitazioni interattive con software chemiometrico. Esercitazioni condotte in autonomia dagli studenti su data set reali. Discussione sugli argomenti presentati a lezione. Commenti e correzione sui reports presentati dagli studenti sulle singole esercitazioni. Seminari e/o visite in azienda volti ad illustrare le applicazioni della chemiometria nel contesto industriale.

Modalità verifica apprendimento

Verifiche in itinere: è richiesto di redigere una relazione per ciascuna esercitazione condotta in aula. Ciascuna relazione è valutata in una scala numerica da 0 a 10, secondo i criteri: organizzazione, linguaggio e capacità di sintesi (0-3); selezione dei metodi appropriate di analisi (0-2); corretta applicazione (0-2); capacità di descrivere ed interpretare i risultati (0-3). La valutazione non porta all'attribuzione di punteggio valido per la prova finale ma serve come idoneità a sostenere l'esame (media >= 6).
Verifica finale, è possibile scegliere tra due modalità:
1) allo studente è assegnato alla fine del corso un data set da elaborare con alcune delle metodologie utilizzate durante le esercitazioni, seguendo le richieste (obiettivi) indicati. E' richiesto quindi di effettuare una presentazione in formato elettronico e discussione orale dei dati elaborati in sede di prova di verifica finale; durante la discussione sono poste un paio di domande dal docente prendendo spunto dalla trattazione dello studente, che possono riguardare anche altri argomenti del corso non discussi in precedenza.
2) allo studente sono poste 3 domande ampie sulle tre parti base del programma (DoE, analisi esplorativa, modellamento) ed altre 2-3 domande su argomenti più speicifci volti a valutare la capacità di applicare le metodologie studiate.
Nell’attribuzione del punteggio della verifica finale si valuta: la corretta descrizione/scelta e discussione/applicazione dei metodi di elaborazione impiegati (30%); la capacità di applicare le conoscenze acquisite (30%); l'abilità comunicativa (10%), il livello delle conoscenze teoriche acquisite (30%).
La votazione finale è espressa in trentesimi con eventuale lode.
Agli studenti non frequentanti, che non avranno svolto le valutazioni in itinere, sono poste ulteriori domande volte ad accertare le loro conoscenze e capacità di giudizio nell’analisi di data sets.

Altre informazioni

- - -