STATISTICA APPLICATA

Biologia STATISTICA APPLICATA

0522100042
DIPARTIMENTO DI CHIMICA E BIOLOGIA "ADOLFO ZAMBELLI"
CORSO DI LAUREA MAGISTRALE
BIOLOGIA
2022/2023

OBBLIGATORIO
ANNO CORSO 1
ANNO ORDINAMENTO 2022
PRIMO SEMESTRE
CFUOREATTIVITÀ
324LEZIONE
336LABORATORIO
Obiettivi
L’obiettivo del corso consiste nel fornire alle studentesse e agli studenti i) le basi del ragionamento statistico, ii) gli strumenti per organizzare dati sperimentali, produrre grafici descrittivi ed esplorativi, iii) la capacità di utilizzare modelli statistici per l’analisi di dati sperimentali, iv) le competenze per comunicare e discutere i risultati di un’analisi dati biologici, v) le competenze per applicare tali concetti in modo autonomo tramite l’analisi di dati reali da eseguire durante le attività di laboratorio. Nell’insieme il corso mira ad approfondire sia aspetti metodologici che applicativi mediante l’utilizzo del software statistico R.
Prerequisiti
Elementi di algebra lineare quali matrici, vettori e relative operazioni come il calcolo degli autovalori ed autovettori di una matrice quali possono essere acquisiti a livello di insegnamento di matematica generale in una laurea scientifica triennale. Capacità di utilizzare il computer per svolgere esercitazioni pratiche
Contenuti
Lezioni teoriche (24 ore)
-Dalla probabilità alla statistica: Probabilità, stimatori misure di correlazione, misure di associazione ed elementi di statistica descrittiva (6 ore).
-Regressione lineare semplice e multipla (4 ore).
-Misure di distanza, similarità e dissimilarità e trasformazioni di variabili casuali (2 ore).
-Algoritmi per il Clustering gerarchico e il Clustering partizionale (4 ore).
-Analisi delle componenti principali (PCA) (4 ore).
-Multidimensional scaling metrico o non metrico oppure modelli di regressione generalizzata a seconda dell’interesse (4 ore).
Attività di laboratorio (36 ore)
-Introduzione all’ambiente di programmazione R (2 ore).
-Dati e strutture dati, lettura e scrittura di file, utilizzo di funzioni grafiche, strutture di controllo in R (6 ore).
-Funzioni e grafici della statistica descrittiva in R (2 ore).
-Regressione lineare semplice e regressione lineare multipla (6 ore).
-Funzioni di distanza, similarità e dissimilarità in R (3 ore).
-Clustering gerarchico e clustering partizionale (6 ore).
-Analisi delle componenti principali (6 ore).
-Multidimensional scaling o modelli di regressione generalizzata (3 ore).
-Come creare report professionali mediante R e Rmarkdown (2 h).
Metodi Didattici
L’insegnamento prevede 60 ore di didattica tra lezioni teoriche ed esercitazioni in aula con il computer. Durante le esercitazioni si propone agli studenti l’analisi di dati disponibili in letteratura. Il metodo di risoluzione consiste nella formulazione del problema statistico, nella pianificazione delle fasi per l’analisi, e infine nell’analisi e discussione dei risultati. Quest’ultima fase promuove l’abilità a valutare la ragionevolezza risultati ottenuti e a verificare la coerenza con le metodologie utilizzate
Verifica dell'apprendimento
Il raggiungimento degli obiettivi previsti sarà verificato mediante
1)Prova scritta che consiste nella redazione di un elaborato (progetto) svolto con il supporto del software statistico R contenente l’analisi di uno o più datasets mediante i metodi presenti nel programma di insegnamento (regressione, clustering, PCA, MDS o altro) tale da aderire ai dettami della ricerca computazionale riproducibile.
2)Prova orale che consiste nella discussione dell’elaborato in una presentazione di 5 minuti e nella risposta a almeno 3 domande sui contenuti teorici e metodologici indicati nel programma. La prova orale è atta verificare la capacità di esposizione ricorrendo all’utilizzo della terminologia scientifica appropriata e la capacità di organizzazione autonoma dell’esposizione sugli stessi argomenti
Il voto finale è espresso in trentesimi, di cui massimo 10 punti per la prova scritta (progetto), massimo 5 punti per la presentazione orale dell’elaborato e massimo 5 punti per ciascuna delle 3 domande.
Testi
Materiale didattico fornito dal docente, ed almeno uno dei seguenti testi (limitatamente ai capitoli relativi al programma di insegnamento)
-BRIAN EVERITT AND TORSTEN HOTHORN. AN INTRODUCTION TO APPLIED MULTIVARIATE ANALYSIS WITH R, SPRINGER 2011
-ZELTERMAN, D. APPLIED MULTIVARIATE STATISTICS WITH R. SPRINGER (2015)
-HÄRDLE, W.K. AND SIMAR, L., APPLIED MULTIVARIATE STATISTICAL ANALYSIS, FOURTH EDITION. SPRINGER (2015)
-PETER DALGAARD. INTRODUCTORY STATISTICS WITH R, 2ND EDITION. SPRINGER 2008
-ALAIN F. ZUUR, ELENA N. IENO, ERIK H.W.G. MEESTERS. A BEGINNER’S GUIDE TO R. SPRINGER 2009
  BETA VERSION Fonte dati ESSE3 [Ultima Sincronizzazione: 2022-09-16]