Obiettivi formativi
L’obbiettivo del corso è fornire lo studente di alcuni fondamentali metodiche dell’analisi dei dati.
Più in particolare attraverso questo corso si mira a mettere in grado lo studente di poter scegliere, per alcuni problemi concreti di rilevanza aziendale, lo strumento appropriato di statistica multivariato.
Contenuti dell'insegnamento
Parte prima. Statistica univariata.
1. Medie di posizione e analitiche.
2. Alcune distribuzioni teoriche univariate.
3. Indici di variabilità assoluta e relativa.
4. Ricerca di dati anomali
Parte seconda. Statistica descrittiva bivariata
5. Tabelle e diagrammi per distribuzioni bivariate.
6. Medie, varianze e momenti di una distribuzione bivariata.
7. Alcune distribuzioni teoriche bivariate.
8. La connessione tra due caratteri qualititativi.
9. Metodo dei minimi quadrati.
10. Metodo dei momenti.
Parte terza. Analisi della varianza.
11. Analisi della varianza a un fattore.
12. Analisi della varianza a due fattori.
13. Quadrati latini.
Parte quarta. Statistica multivariata
14. La matrice dei dati.
15. Centri.
16. Distanze multivariate.
17. Componenti principali.
18. Modelli discriminanti.
19. Regressione multivariata.
.
Programma esteso
Parte prima. Statistica descrittiva univariata
1. Medie.
1.1 La funzione di medie potenziate.
1.2 Medie ottenute da condizioni di equivalenza.
1.3. Proprietà delle medie.
1.4 Medie di posizione e loro proprietà.
1.5 Centri a due e più dimensioni.
2. Ricerca di dati anomali e rappresentazioni grafiche
2.1 Il diagramma a foglie.
2.2 Il box plot.
2.3 Le curve di Andrew.
2.4 Le facce di Chernoff
3. Distribuzioni teoriche.
3.1 Normale.
3.2 Bernoulli.
3.3 Binomiale.
3.4 Poisson.
3.5 Rettangolare.
3.6 Esponenziale.
3.7 Lognormale.
3.8 Pareto.
3.9 Cauchy.
3.10 La verifica dell’ipotesi funzionale.
Parte seconda. Statistica descrittiva bivariata
Parte seconda. Statistica bivariata.
3. Tabelle e diagrammi per distribuzioni bivariate.
4. Medie varianze e momenti di una distribuzione bivariata.
5. Alcune distribuzioni teoriche bivariate.
5.1 La normale bivariata.
5.2 L’uniforme discreta bivariata.
5.3 L’uniforme continua bivariata.
6. La connessione tra due caratteri qualititativi.
6.1 Tabelle di connessione.
6.2 Indipendenza e dipendenza di connessione.
6.3 Indici di connessione.
7. Metodo dei minimi quadrati.
8. Metodo dei momenti.
Parte terza. Analisi della varianza.
4. Analisi della varianza a un fattore.
5. Analisi della varianza a due fattori.
6. Quadrati latini.
Parte quarta. Statistica multivariata.
12. Distanze.
12.1 Proprietà fondamentali delle distanze.
12.2 Metriche di Minkowski.
12.3 Proprietà della distanza euclidea.
12.4 La distanza di Mahalanobis.
13 Modelli discriminanti.
13.1 Discriminante di Fisher.
13.2 Discriminante di massima verosimiglianza.
13.3 Scelta delle variabili discriminanti.
13.4 Discriminazione e correlazione.
14. Componenti principali.
14.1 Alcune proprietà delle componenti principali.
14.2 I punteggi delle componenti principali.
7. Regressione multivariata.
7.1 Il modello lineare classico.
7.2 Valutazione della bontà delle stime ottenute.
Bibliografia
Ferrari G., Marliani G.(1993), Complementi ed esercizi di statistica descrittiva, Alfani Editore,
Cerioli A. Zani S. (2007) Analisi dei dati e data mining per le decisioni aziendali, Giuffrè editore. Milano, capitoli VI e VIII.
Montgomery D. C., (2001) Progettazione e analisi degli esperimenti, McGraw-Hill, capitoli, 1, 2, 3, 4.
Fleury B., 2010 A first course in multivariate statistics, Springer 2010, capitoli 5 e 7.